Introdução A Bibliotecas em Panda
Introdução A Bibliotecas em Panda
Introdução A Bibliotecas em Panda
bibliotecas
Pandas
Dentre as diversas bibliotecas disponíveis no repositório PyPI, pandas é um pacote Python que fornece estruturas
de dados projetadas para facilitar o trabalho com dados estruturados (tabelas) e de séries temporais.
Fonte: Shutterstock.
Ambas as estruturas possuem como grande característica a indexação das linhas, ou seja, cada linha possui um
rótulo (nome) que a identifica, o qual pode ser uma string, um inteiro, um decimal ou uma data.
A figura a seguir ilustra uma Series (A) e um DataFrame (B), veja que:
Uma Series possui somente "uma coluna" de informação e seus rótulos (índices).
Um DataFrame pode ter uma ou mais colunas e, além dos índices, também há um rótulo de identificação com o
nome da coluna.
Saiba mais
Fonte: elaborada pela autora.
Para utilizar os recursos da biblioteca é preciso importar no projeto. Usa-se a seguinte convenção:
import pandas as pd
Series
Para construir um objeto do tipo Series, é preciso utilizar o método Series() do pacote pandas. O método possui o
seguinte construtor:
Como todos os parâmetros possuem valores padrão (default), o que permite instanciar um objeto de diferentes
formas. Veja algumas dessas formas:
DataFrame
Para construir um objeto do tipo DataFrame é preciso utilizar o método DataFrame() do pacote pandas. O método
possui o seguinte construtor:
Resultado:
nome
nome
0 Howard
1 Ian
2 Peter
3 Jonah
4 Kellie
Resultado:
Saiba mais Estruturas de dados são utilizadas para armazenar dados e diferentes
estruturas possuem diferentes atributos e métodos. Com as estruturas de
dados do pandas não é diferente, tais objetos possuem atributos e métodos
específicos. Existem atributos e métodos que extraem informações estruturais
da Series ou do DataFrame, por exemplo, o atributo shape ou dtypes. Por outro
lado, existem recursos que permitem transformar os dados em informações,
por exemplo, as estatísticas, como o método mean() ou median().
Pesquise mais
Na documentação oficial da biblioteca pandas você
encontrará o método read_html(), que permite fazer
a leitura de tabelas em páginas web.
pandas Team. pandas.read_html. Disponível em:
https://pandas.pydata.org/pandas-
docs/stable/reference/api/pandas.read_html.html.
Acesso em: 17 jun. 2020.
Fonte: Shutterstock.