Um DataFrame é uma estrutura de dados tabular bidimensional, em que cada coluna pode ser de um tipo diferente (string, float, inteiro, etc.). O Pandas é uma biblioteca Python amplamente utilizada para análise de dados, que oferece diversas funcionalidades para a manipulação de DataFrames. Neste documento, apresentamos algumas formas de declarar e importar um DataFrame no Pandas.
Podemos criar um DataFrame manualmente, através de um dicionário, fornecendo seus valores linha a linha. Para isso, utilizamos a função pd.DataFrame() do Pandas. Veja um exemplo:
import pandas as pd
df = pd.DataFrame({
'Nome': ['Antonio', 'Mateus', 'José'],
'Idade': [25, 30, 40],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']
})
print(df)
A saída será:
Nome Idade Cidade
0 Antonio 25 São Paulo
1 Mateus 30 Rio de Janeiro
2 José 40 Belo Horizonte
Neste exemplo, criamos um DataFrame com três colunas: "Nome", "Idade" e "Cidade". Cada linha corresponde a uma pessoa, com seus respectivos valores.
O Pandas permite a importação de DataFrames a partir de diversos tipos de arquivos, como CSV, Excel, SQL, entre outros. Para isso, utilizamos funções específicas do Pandas, como pd.read_csv() ou pd.read_excel(). Veja um exemplo de importação de um arquivo CSV:
import pandas as pd
df = pd.read_csv('arquivo.csv')
display(df)
Neste exemplo, importamos um arquivo CSV chamado "arquivo.csv" e o armazenamos em um DataFrame chamado "df". Ao imprimir o DataFrame, teremos seus valores exibidos na tela.
Essas são algumas das formas de declarar e importar um DataFrame no Pandas. Com o conhecimento dessas funcionalidades, podemos manipular e analisar dados de forma mais eficiente.
O "Raw" é uma opção disponível no GitHub que permite visualizar o conteúdo de um arquivo no formato bruto, sem a formatação ou qualquer outra adição feita no arquivo. Isso é útil quando se deseja acessar o conteúdo em sua forma mais básica, sem qualquer interferência.
É possível utilizar o “Raw” como link de importação do DataFrame no Pandas.