No dia 06 manipulamos arquivos no formato json. Para transforma-los em um dataframe foi necessário lê-los em uma tabela e em seguida ler apelas a coluna registros[0]
do dataframe, coluna relacionada aos alunos de graduação.
Após adicionados no dataframe, os dados da coluna ‘matricula_ou_siape’
foram convertidos em string para que fosse possível mescla-los em outras tabelas.
Em seguida foram lidos outros dados de outro dataframe no formato de excel. Essa tabela de dados possuía duas abas, ambas foram lidas utilizando o método sheet_name
e especificando o nome da aba. Após lidos os dados foram concatenados em uma única tabela e a coluna matricula_ou_siape
novamente foi convetido para string.
Os dataframes adquiridos em json e excel também foram concatenados.
Após isso foi criado um filtro que pega apenas os dados dos alunos de graduação, no ano acima de 2015 e adiciona em um novo dataframe. O formato da data foi convertido para apenas ano e todos os valores nulos foram excluídos.
Outro filtro foi criado separando apenas os cursos pedidos e mesclando com a tabela adquirida anteriormente. Utilizando o value_counts e o pivot_table foi possível analisar uma tabela pivot dos dados adquiridos.