[DATA SCIENCE] DAY: 014 - Formatando e visualizando gráficos
👨💼 Bom dia, boa tarde e boa noite pessoal, tudo bem?
🌵 Hoje iremos aprender como formatar gráficos.
📝 Obs: Irei utilizar o jupyter notebook, mas fique a vontade para escolher outro ambiente de sua preferência. Uma sugestão caso não conheça nenhum, tem o colab do google.
1 - Primeiro, podemos usar a notação as para abreviar o nome das bibliotecas que vamos importar e facilitar a escrita de código:
💻
import pandas as pd
from matplotlib import pyplot as plt
from matplotlib import rcParams
import seaborn as sns
📝 Obs:
- A primeira linha
import pandas as pd
importa a biblioteca pandas para utilizar suas funções para manipular e analisar dados. - A segunda linha
from matplotlib import pyplot as plt
importa o módulo pyplot da biblioteca matplotlib para criar gráficos. - A terceira linha
from matplotlib import rcParams
importa as configurações de parâmetros padrão da biblioteca matplotlib. - A quarta linha
import seaborn as sns
importa a biblioteca seaborn que fornece uma interface mais fácil para criar gráficos estatísticos atraentes e informativos, e também estende as funcionalidades de matplotlib.
Essas linhas de código preparam as bibliotecas necessárias para serem utilizadas na visualização de dados.
2 - Agora vamos ajustar as configurações de visualização para se adequar ao ambiente do Jupyter Notebook e estabelecer um estilo de gráfico padrão para ser usado ao longo do código:
💻
%matplotlib inline
rcParams['figure.figsize'] = 5, 4
sns.set_style('whitegrid')
📝 Obs:
-
%matplotlib inline
: Essa linha de código é usada para exibir gráficos dentro do notebook Jupyter. Isso significa que, em vez de abrir uma nova janela para exibir o gráfico, ele será exibido diretamente no notebook. -
rcParams['figure.figsize'] = 5, 4
: Essa linha de código define o tamanho da figura como 5x4. Isso significa que a largura será de 5 unidades e a altura será de 4 unidades. -
sns.set_style('whitegrid')
: Essa linha de código é parte do seaborn, uma biblioteca de visualização de dados baseada em Matplotlib. Ele define o estilo de grade como branco. Isso adiciona linhas brancas às suas visualizações de dados, o que pode ajudar a tornar os gráficos mais legíveis e fáceis de interpretar.
3 - Com as configurações já feitas, iremos gerar um gráfico de barras simples utilizando o Matplotlib.
💻
x = range(1, 10)
y = [1, 2, 3, 4, 0.5, 4, 3, 2, 1]
plt.bar(x, y)
📝 **Obs: **
-
x = range(1, 10)
: Essa linha de código está criando uma variável chamada "x" e atribuindo a ela uma lista de números inteiros de 1 a 9. Essa lista representa os valores do eixo x no gráfico. -
y = [1, 2, 3, 4, 0.5, 4, 3, 2, 1]
: Essa linha de código está criando uma variável chamaday
e atribuindo a ela uma lista de números inteiros. Essa lista representa os valores do eixo y no gráfico. -
plt.bar(x, y)
: Essa linha de código está usando a funçãobar
do Matplotlib para criar um gráfico de barras. A funçãobar
recebe dois argumentos,x
ey
, que são as listas criadas nas linhas anteriores. Essa código que geramos irá plotar um gráfico de barras com as listasx
ey
.
Gráfico gerado:
4 - Agora, vamos criar um gráfico de barras com as mesmas informações do gráfico acima, mas iremos colorir de laranja salmão e alinha-las no centro.
💻
cor = ['salmon']
plt.bar(x, y, color=cor, align='center')
📝 **Obs: **
- Esse código usa a biblioteca "matplotlib" para criar um gráfico de barras. O gráfico mostra as informações contidas nas variáveis
x
ey
. - As barras do gráfico são coloridas de acordo com a cor especificada na variável
cor
, que contém a stringsalmon
. - O parâmetro
align
é usado para alinhar as barras no centro do gráfico.
Gráfico gerado:
5 - Podemos também customizar o estilo das linhas. Iremos criar mais duas variáveis, x1
e y1
para compararmos e entendermos a diferença entre o gráfico das variáveis já criadas, x
e y
:
💻
x1 = range(0,10)
y1 = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
plt.plot(x, y)
plt.plot(x1,y1)
📝 Obs:
-
_Criação de lista de números: A linha
x1 = range(0,10)
usa a função "range" para criar uma lista de números inteiros de 0 a 9 e atribui essa lista à variável "x1". -
Definição de valores para o eixo y: A linha
y1 = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1]
define uma lista de valores para o eixo y. -
Criação do primeiro gráfico: A linha
plt.plot(x, y)
usa a funçãoplt.plot
para criar o primeiro gráfico de linhas com as informações contidas nas variáveisx
ey
. -
Criação do segundo gráfico: A linha
plt.plot(x1,y1)
usa a funçãoplt.plot
para criar o segundo gráfico de linhas com as informações contidas nas variáveisx1
ey1
.
Gráfico gerado:
6 - Iremos criar dois gráficos de linhas, o primeiro gráfico irá mostrar as informações contidas nas variáveis "x" e "y" e o segundo gráfico irá mostrar as informações contidas nas variáveis "x1" e "y1", ambos com as linhas customizadas:
💻
plt.plot(x, y, ls='steps', lw=5)
plt.plot(x1, y1, ls='--', lw=10)
📝 Obs:
-
Criação do primeiro gráfico: A linha
plt.plot(x, y, ls='steps', lw=5)
usa a função "plt.plot" para criar o primeiro gráfico de linhas com as informações contidas nas variáveisx
ey
. -
Estilo da linha do primeiro gráfico: O parâmetro
ls
é usado para definir o estilo da linha do primeiro gráfico, no caso, "steps" que é uma representação discreta dos dados. -
Espessura da linha do primeiro gráfico: O parâmetro
lw
é usado para definir a espessura da linha do primeiro gráfico, no caso, 5. -
Criação do segundo gráfico: A linha
plt.plot(x1, y1, ls='--', lw=10)
usa a função "plt.plot" para criar o segundo gráfico de linhas com as informações contidas nas variáveisx1
ey1
. -
Estilo da linha do segundo gráfico: O parâmetro
ls
é usado para definir o estilo da linha do segundo gráfico, no caso,--
que é uma linha tracejada. -
Espessura da linha do segundo gráfico: O parâmetro
lw
é usado para definir a espessura da linha do segundo gráfico, no caso, 10.
Gráfico gerado:
7 - Por último, irei mostrar que também é possível colocar marcadores em nossos gráficos gerados:
💻
plt.plot(x, y, marker='1', mew=20)
plt.plot(x1, y1, marker='+', mew=15)
plt.show()
📝 Obs:
-
Criação do primeiro gráfico: A linha
plt.plot(x, y, marker='1', mew=20)
usa a funçãoplt.plot
para criar o primeiro gráfico de linhas com as informações contidas nas variáveisx
ey
. -
Marcação dos pontos do primeiro gráfico: O parâmetro
marker
é usado para definir o tipo de marcação dos pontos no gráfico, no caso,1
que é um número1
-
Espessura da borda da marcação do primeiro gráfico: O parâmetro
mew
é usado para definir a espessura da borda da marcação dos pontos no primeiro gráfico, no caso,20
. -
Criação do segundo gráfico: A linha
plt.plot(x1, y1, marker='+', mew=15)
usa a funçãoplt.plot
para criar o segundo gráfico de linhas com as informações contidas nas variáveisx1
ey1
. -
Marcação dos pontos do segundo gráfico: O parâmetro
marker
é usado para definir o tipo de marcação dos pontos no gráfico, no caso,+
que é um sinal de mais+
-
Espessura da borda da marcação do segundo gráfico: O parâmetro
mew
é usado para definir a espessura da borda da marcação dos pontos no segundo gráfico, no caso,15
. -
Exibição do gráfico: A linha
plt.show()
é usada para exibir o gráfico criado.
Gráfico gerado