Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a:SQL Server
Azure SQL Database
Azure SQL Managed Instance
Base de dados SQL no Microsoft Fabric
Este artigo descreve como plotar dados usando o pacote Python pandas'.hist(). Um banco de dados SQL Server é a fonte usada para visualizar os intervalos de dados do histograma que têm valores consecutivos e não sobrepostos.
Prerequisites
SQL Server Management Studio para restaurar o banco de dados de exemplo para a Instância Gerenciada SQL do Azure.
Azure Data Studio. Para instalar, consulte Azure Data Studio.
Restaure o banco de dados DW de exemplo para obter dados de exemplo usados neste artigo.
Verificar o banco de dados restaurado
Você pode verificar se o banco de dados restaurado existe consultando a Person.CountryRegion tabela:
USE AdventureWorksDW;
SELECT * FROM Person.CountryRegion;
Instalar pacotes Python
Baixe e instale o Azure Data Studio.
Instale os seguintes pacotes Python:
pyodbcpandassqlalchemymatplotlib
Para instalar estes pacotes:
- No seu bloco de anotações do Azure Data Studio, selecione Gerenciar Pacotes.
- No painel Gerenciar pacotes , selecione a guia Adicionar novo .
- Para cada um dos seguintes pacotes, insira o nome do pacote, selecione Pesquisar e, em seguida, selecione Instalar.
Histograma gráfico
Os dados distribuídos exibidos no histograma são baseados em uma consulta SQL da AdventureWorksDW2025. O histograma visualiza os dados e a frequência dos valores dos dados.
Edite as variáveis da cadeia de conexão: server, database, usernamee password para se conectar ao banco de dados do SQL Server.
Para criar um novo bloco de notas:
No Azure Data Studio, selecione Arquivo, selecione Novo Bloco de Anotações.
No bloco de anotações, selecione kernel Python3, selecione +código.
Cole o código no bloco de anotações. Selecione Executar Tudo.
import pyodbc import pandas as pd import matplotlib import sqlalchemy from sqlalchemy import create_engine matplotlib.use('TkAgg', force=True) from matplotlib import pyplot as plt # Some other example server values are # server = 'localhost\sqlexpress' # for a named instance # server = 'myserver,port' # to specify an alternate port server = 'servername' database = 'AdventureWorksDW2022' username = 'yourusername' password = 'databasename' url = 'mssql+pyodbc://{user}:{passwd}@{host}:{port}/{db}?driver=SQL+Server'.format(user=username, passwd=password, host=server, port=port, db=database) engine = create_engine(url) sql = "SELECT DATEDIFF(year, c.BirthDate, GETDATE()) AS Age FROM [dbo].[FactInternetSales] s INNER JOIN dbo.DimCustomer c ON s.CustomerKey = c.CustomerKey" df = pd.read_sql(sql, engine) df.hist(bins=50) plt.show()
O ecrã mostra a distribuição etária dos clientes na tabela FactInternetSales.