No dia 06 manipulamos arquivos no formato json. Para transforma-los em um dataframe foi necessário lê-los em uma tabela e em seguida ler apelas a coluna registros[0] do dataframe, coluna relacionada aos alunos de graduação.

Untitled

Após adicionados no dataframe, os dados da coluna ‘matricula_ou_siape’ foram convertidos em string para que fosse possível mescla-los em outras tabelas.

Untitled

Em seguida foram lidos outros dados de outro dataframe no formato de excel. Essa tabela de dados possuía duas abas, ambas foram lidas utilizando o método sheet_name e especificando o nome da aba. Após lidos os dados foram concatenados em uma única tabela e a coluna matricula_ou_siape novamente foi convetido para string.

Untitled

Untitled

Os dataframes adquiridos em json e excel também foram concatenados.

Untitled

Untitled

Após isso foi criado um filtro que pega apenas os dados dos alunos de graduação, no ano acima de 2015 e adiciona em um novo dataframe. O formato da data foi convertido para apenas ano e todos os valores nulos foram excluídos.

Untitled

Untitled

Outro filtro foi criado separando apenas os cursos pedidos e mesclando com a tabela adquirida anteriormente. Utilizando o value_counts e o pivot_table foi possível analisar uma tabela pivot dos dados adquiridos.

Untitled

Untitled