Neste tutorial, aprenderemos como fazer análises básicas de dados em Python usando a biblioteca Pandas. Este será um breve curso introdutório com exemplos práticos.
O que é Pandas?
Pandas é uma biblioteca de código aberto licenciada por BSD que fornece estruturas de dados fáceis de usar e ferramentas de análise de dados de alto desempenho para a linguagem de programação Python.
Ele fornece estruturas de dados e operações para manipular tabelas numéricas e séries temporais. Os dois principais tipos de dados são: Series e DataFrame.
DataFrame é uma estrutura de dados tabular bidimensional potencialmente heterogênea e com tamanho variável, com eixos rotulados (linhas e colunas). É uma estrutura de dados semelhante a uma planilha.
Series é uma única coluna DataFrame. Um DataFrame pode ser considerado um dicionário de objetos Series.
Como instalar o Python Pandas?
Podemos instalar o Pandas com o seguinte comando:
pip install pandas
Aqui usamos o comando pip para instalar o módulo pandas, e também apenas para fins de funcionalidade, instale o módulo Numpy também, usando o seguinte comando
pip install numpy
Começando com Pandas
A seguir está um exemplo simples do Pandas, vamos ver como podemos usar o Pandas para exibir dados.
import pandas as pd
dados = [['Joao', 5], ['Futi', 10], ['Muanda', 15]]
df = pd.DataFrame(dados, columns=['Nome', 'Idade'])
print(df)
Saida: -----------------------------------
Nome Idade
0 Joao 5
1 Futi 10
2 Muanda 15
No programa, criamos um DataFrame simples e o imprimimos no console.
import pandas as pd
Aqui importamos a biblioteca Pandas.
dados = [['Joao', 5], ['Futi', 10], ['Muanda', 15]]
Estes são os dados a serem exibidos no quadro. Cada lista aninhada é uma linha da tabela. Observe que há várias maneiras de inicializar um Pandas DataFrame.
df = pd.DataFrame(dados, columns=['Nome', 'Idade'])
Um DataFrame é criado a partir dos dados. Fornecemos os nomes das colunas do quadro com propriedade de colunas.
Nome Idade
0 Joao 5
1 Futi 10
2 Muanda 15
Esta é a saída. A primeira coluna são os índices de linha.
0 Comentários