[DATA SCIENCE] DAY: 013 - Criando gráficos de barras com python
👨💼 Bom dia, boa tarde e boa noite pessoal, tudo bem?
🍁 Hoje iremos aprender como criar gráficos em barras com python.
📝 Obs: Irei utilizar o júpiter notebook, mas fique a vontade para escolher outro ambiente de sua preferência. Uma sugestão caso não conheça nenhum, tem o colab do google.
1 - Primeiro, podemos usar a notação as para abreviar o nome das bibliotecas que vamos importar e facilitar a escrita de código:
💻
import pandas as pd
from matplotlib import pyplot as plt
from matplotlib import rcParams
import seaborn as sns
📝 Obs:
- A primeira linha
import pandas as pd
importa a biblioteca pandas para utilizar suas funções para manipular e analisar dados. - A segunda linha
from matplotlib import pyplot as plt
importa o módulo pyplot da biblioteca matplotlib para criar gráficos. - A terceira linha
from matplotlib import rcParams
importa as configurações de parâmetros padrão da biblioteca matplotlib. - A quarta linha
import seaborn as sns
importa a biblioteca seaborn que fornece uma interface mais fácil para criar gráficos estatísticos atraentes e informativos, e também estende as funcionalidades de matplotlib.
Essas linhas de código preparam as bibliotecas necessárias para serem utilizadas na visualização de dados.
2 - Agora vamos ajustar as configurações de visualização para se adequar ao ambiente do Jupyter Notebook e estabelecer um estilo de gráfico padrão para ser usado ao longo do código:
💻
%matplotlib inline
rcParams['figure.figsize'] = 5, 4
sns.set_style('whitegrid')
📝 Obs:
-
%matplotlib inline
: Essa linha de código é usada para exibir gráficos dentro do notebook Jupyter. Isso significa que, em vez de abrir uma nova janela para exibir o gráfico, ele será exibido diretamente no notebook. -
rcParams['figure.figsize'] = 5, 4
: Essa linha de código define o tamanho da figura como 5x4. Isso significa que a largura será de 5 unidades e a altura será de 4 unidades. -
sns.set_style('whitegrid')
: Essa linha de código é parte do seaborn, uma biblioteca de visualização de dados baseada em Matplotlib. Ele define o estilo de grade como branco. Isso adiciona linhas brancas às suas visualizações de dados, o que pode ajudar a tornar os gráficos mais legíveis e fáceis de interpretar.
3 - Com as configurações já feitas, iremos gerar um gráfico de barras simples utilizando o Matplotlib.
💻
x = range(1, 10)
y = [1, 2, 3, 4, 0, 4, 3, 2, 1]
plt.bar(x, y)
📝 **Obs: **
-
x = range(1, 10)
: Essa linha de código está criando uma variável chamada "x" e atribuindo a ela uma lista de números inteiros de 1 a 9. Essa lista representa os valores do eixo x no gráfico. -
y = [1, 2, 3, 4, 0, 4, 3, 2, 1]
: Essa linha de código está criando uma variável chamaday
e atribuindo a ela uma lista de números inteiros. Essa lista representa os valores do eixo y no gráfico. -
plt.bar(x, y)
: Essa linha de código está usando a funçãobar
do Matplotlib para criar um gráfico de barras. A funçãobar
recebe dois argumentos,x
ey
, que são as listas criadas nas linhas anteriores. Essa código que geramos irá plotar um gráfico de barras com as listasx
ey
.
Gráfico gerado:
4 - Após entendermos como funciona gerar um gráfico de barras utilizando dados rasos, iremos aprender sobre a criação de gráficos de barras utilizando um objeto Pandas:
🔍 Para baixar o arquivo que está sendo usado, clique aqui.
💻
caminho = 'O-caminho-do-arquivo/mtcars.csv'
carros = pd.read_csv(caminho)
carros.columns = ['nomes','mpg','cyl','disp', 'hp', 'drat', 'wt', 'qsec', 'vs', 'am', 'gear', 'carb']
mpg = carros['mpg']
mpg.plot(kind='bar')
📝 **Obs: **
-
caminho: A variável
caminho
é atribuída com o caminho '/home/moisa/Downloads/dados/mtcars.csv'. -
carros = pd.read_csv(caminho): A função
pd.read_csv()
é utilizada para ler o arquivo de dados e criar um dataframe com as informações contidas nele salvando em uma variável chamada carros. -
carros.columns: As colunas do dataframe são renomeadas com os nomes especificados na lista ['nomes','mpg','cyl','disp', 'hp', 'drat', 'wt', 'qsec', 'vs', 'am', 'gear', 'carb']
-
Seleção de coluna: A coluna
mpg
é selecionada e atribuída à variável mpg. -
A função plot() é utilizada para gerar um gráfico de barras com os dados da coluna 'mpg'. A opção kind='bar' especifica que é um gráfico de barras que esta sendo criado.
Em resumo, essas linhas de código estão lendo um arquivo CSV, renomeando as colunas e selecionando uma coluna específica para armazenar em uma variável.
Gráfico gerado:
📝 Obs:
- Podemos brincar um pouco e enxergar os dados por um outro ângulo. A opção kind='barh' especifica que é um gráfico de barras horizontais que esta sendo criado.
💻
mpg.plot(kind='barh')
- Existem inúmeras formas, recomendo vocês lerem a documentação e se divertirem com a variedade.
5 - Por último, irei mostrar para vocês a possibilidade de salvar um gráfico em sua máquina local:
💻
plt.savefig('grafico_de_barras.png')
📝 Obs:
-
A função savefig() do módulo pyplot (plt) é utilizada para salvar o gráfico gerado anteriormente para um arquivo de imagem. O argumento 'grafico_de_barras.png' especifica o nome do arquivo de imagem e o formato de imagem deve ser PNG.
-
Dando o comando
!dir
, você consegue visualizar seu gráfico salvo com o respectivo nome que você o atribuiu.
💻
grafico_de_barras.png