Como declarar e importar um DataFrame no Pandas

Um DataFrame é uma estrutura de dados tabular bidimensional, em que cada coluna pode ser de um tipo diferente (string, float, inteiro, etc.). O Pandas é uma biblioteca Python amplamente utilizada para análise de dados, que oferece diversas funcionalidades para a manipulação de DataFrames. Neste documento, apresentamos algumas formas de declarar e importar um DataFrame no Pandas.

Declarando um DataFrame manualmente

Podemos criar um DataFrame manualmente, através de um dicionário, fornecendo seus valores linha a linha. Para isso, utilizamos a função pd.DataFrame() do Pandas. Veja um exemplo:

import pandas as pd

df = pd.DataFrame({
    'Nome': ['Antonio', 'Mateus', 'José'],
    'Idade': [25, 30, 40],
    'Cidade': ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']
})

print(df)

A saída será:

    Nome  Idade          Cidade
0   Antonio  25       São Paulo
1   Mateus   30  Rio de Janeiro
2   José     40  Belo Horizonte

Neste exemplo, criamos um DataFrame com três colunas: "Nome", "Idade" e "Cidade". Cada linha corresponde a uma pessoa, com seus respectivos valores.

Importando um DataFrame a partir de um arquivo

O Pandas permite a importação de DataFrames a partir de diversos tipos de arquivos, como CSV, Excel, SQL, entre outros. Para isso, utilizamos funções específicas do Pandas, como pd.read_csv() ou pd.read_excel(). Veja um exemplo de importação de um arquivo CSV:

import pandas as pd

df = pd.read_csv('arquivo.csv')

display(df)

Neste exemplo, importamos um arquivo CSV chamado "arquivo.csv" e o armazenamos em um DataFrame chamado "df". Ao imprimir o DataFrame, teremos seus valores exibidos na tela.

Essas são algumas das formas de declarar e importar um DataFrame no Pandas. Com o conhecimento dessas funcionalidades, podemos manipular e analisar dados de forma mais eficiente.

Utilizando “Raw” do GitHub para importar os dados

O "Raw" é uma opção disponível no GitHub que permite visualizar o conteúdo de um arquivo no formato bruto, sem a formatação ou qualquer outra adição feita no arquivo. Isso é útil quando se deseja acessar o conteúdo em sua forma mais básica, sem qualquer interferência.

É possível utilizar o “Raw” como link de importação do DataFrame no Pandas.