Como remover uma coluna no pandas Python

Para remover uma coluna em um DataFrame do pandas, podemos utilizar o método .drop() passando o nome da coluna que queremos remover e o eixo (axis) que representa as colunas. Por exemplo, se tivermos um DataFrame chamado df com uma coluna chamada coluna_a_remover, podemos remover essa coluna da seguinte forma:

df = df.drop('coluna_a_remover', axis=1)

Além disso, também podemos remover várias colunas de uma só vez passando uma lista com os nomes das colunas a serem removidas como argumento para o método .drop(). Por exemplo:

colunas_a_remover = ['coluna1', 'coluna2', 'coluna3']
df = df.drop(colunas_a_remover, axis=1)

drop_duplicates()

Para remover linhas duplicadas de um DataFrame, podemos utilizar o método .drop_duplicates(). Esse método remove todas as linhas que possuem os mesmos valores em todas as colunas. Por exemplo:

df = df.drop_duplicates()

Com essas informações, você já pode remover colunas e linhas duplicadas em seus DataFrames do pandas no Python.

dropna()

dropna() é um método em pandas, que é uma biblioteca popular em Python para manipulação e análise de dados. Este método é usado para remover valores ausentes (valores NaN) de um DataFrame ou Series do pandas.

Quando chamado em um DataFrame, dropna() retorna um novo DataFrame com linhas ou colunas contendo valores ausentes removidos. Por padrão, ele remove qualquer linha contendo pelo menos um valor ausente. Também pode remover colunas contendo valores ausentes passando axis=1 como argumento.

Para remover todas as linhas contendo valores ausentes, você pode simplesmente chamar df.dropna().

Além do axis que permite especificar se a remoção de valores ausentes deve ser feita ao longo das linhas (valor padrão, axis=0) ou colunas (axis=1), existem outros argumentos importantes que podem ser passados para o método dropna(). Aqui estão alguns deles:

fillna()