Pandas DataFrame para JSON

Pandas Dataframe Para Json



“Os “pandas” fornecem a facilidade de manipulação de dados e análise de dados. No mundo moderno, a análise de dados é uma ferramenta extremamente valiosa. Para completar esta tarefa, uma variedade de estruturas de dados está disponível em ciência da computação. Em “pandas”, temos o DataFrame, que também é convertido para “JSON”. Podemos explicar “JSON” pois é um texto que usa notações de objetos JavaScript. A transferência de dados entre servidores e aplicativos web utiliza o “JSON”. Neste guia, examinaremos a conversão do formato JSON de DataFrames. Para esta conversão do DataFrame para o “Json”, o “pandas” disponibiliza o método “to_json()”. Sempre que precisamos converter o DataFrame para o formato “JSON”, utilizamos o método “to_json()” dos “pandas”. Para entender melhor como utilizar a função de “pandas” que é “to_json”, vejamos alguns códigos de “pandas” aqui neste guia.”

Exemplo # 01
Vamos demonstrar na prática como utilizar o método “to_json()” de “pandas” para alterar o DataFrame “pandas” para o formato JSON. O pacote “pandas” é importado aqui, que é o “numpy”, e importamos como “np”. Agora, para executar o código “pandas”, os pacotes do panda devem ser importados. Para importar esse pacote, utilizamos a palavra-chave “import”. Em seguida, definimos “pandas como pd”, o que significa que podemos acessar ou utilizar facilmente qualquer “pacote pandas” que precisamos apenas colocando o “pd” lá.

Criamos o array numpy aqui utilizando o método “np. array”, este “np” nos ajuda a acessar as funções da biblioteca numpy. Esse array numpy também é armazenado na variável “New_data” e colocamos “A, B, C, D” e “E, F, G, H” neste array numpy. Essa matriz numpy agora é convertida para o DataFrame utilizando o método “pd.DataFrame”. Este é o método “pandas” que acessamos aqui colocando o “pd”. Quando convertemos esse array numpy no DataFrame, também colocamos os nomes das colunas.







Os nomes que adicionamos aqui como cabeçalhos de coluna são “col1, col2, col3 e col4”. Então você vê que temos o “print” abaixo no qual definimos o nome do DataFrame, que neste caso é “New_dataFrame”, então isso será renderizado na execução deste código. Agora, estamos convertendo este DataFrame para o formato JSON utilizando o método “to_json()”. Definimos o nome do DataFrame “New_dataFrame” com o método “to_json()” e também colocamos este método na variável “New_json”. Aqui, não passamos nenhum parâmetro para este método “to_json()”. O formato JSON do DataFrame agora é colocado em “print” e também será renderizado no console.





Para compilação e execução deste código, pressionamos “Shift+Enter” e se o código estiver livre de erros, a saída será renderizada. Aqui também colamos o resultado deste código no qual mostramos o DataFrame que criamos neste exemplo e também o formato JSON desse DataFrame.





Exemplo # 02
Aqui, importamos apenas uma biblioteca, que é a “pandas” e então a lista “AtoZ_Courses” é criada, e colocamos algumas listas nela, que são “Python, 29000, 35 days e 1000.0”, então colocamos “ JavaScript, 27000, 55 dias e 2300.0”, depois adicionamos “HTMLCSS, 25000, 25 dias e 1500.0”. Agora, também inserimos mais dois dados como “DataBase, 24000, 45 dias e 1500,0” e “OOP, 21000, 35 dias, 1500,0” também. A lista “AtoZ_Courses” agora foi alterada no DataFrame, e a chamamos de “AtoZ_Courses_df”. Os “Curses_Name, Payment, Duration e Bonus” são adicionados aqui como os nomes das colunas do DataFrame.



Agora, o DataFrame é gerado nesta etapa e o adicionamos na instrução “print()” para exibi-lo no terminal. Agora, usando o método “to_json()”, estamos transformando o DataFrame “AtoZ_Courses_df” para o formato JSON. Este método “to_json()” também recebe um parâmetro que é “orient= column”, que também é o parâmetro padrão. Ele exibe o DataFrame como o dict como “{column name -> {index value -> column value}} format”.

Aqui, no formato JSON, ele exibe o nome da coluna e, em seguida, coloca todos os valores dessa coluna junto com o valor do índice. Primeiro, ele menciona o nome da primeira coluna, e então todos os valores da primeira coluna são renderizados junto com os valores do índice, e então ele coloca o nome da segunda coluna e também todos os valores da segunda coluna com índices e assim por diante.

Exemplo # 03
O DataFrame é gerado neste código com o nome “Bachelors_df”. Inserimos cinco colunas neste “Bachelors_df”. A primeira coluna que temos aqui é a coluna “Estudante”, e nela inserimos “Lily, Smith, Bromley, Milli e Alexander”. A coluna que vem a seguir é a coluna “Grau”, que contém “IT, BBA, Inglês, CS e DVM”. Em seguida, vem o “year_of_joining” onde somamos os anos de ingresso dos alunos, que são “2015, 2018, 2017, 2015 e 2014”.

A coluna ao lado desta coluna é “year_of_graduation”, que contém os anos de graduação desses alunos são “2019, 2022, 2021, 2019 e 2018”. Também adicionamos aqui a coluna “CGPA” na qual colocamos os CGPAs dos alunos “3.3, 3.5, 3.6, 3.7 e 3.8”. Para exibir “Bachelors_df” no terminal, incluímos na expressão “print()”. Agora, estamos convertendo o DataFrame ” Bachelors_df ” para o formato JSON usando o método “to_json()”.

O parâmetro “orient= records” também é passado para este método “to_json()” neste código. Este “orient= records” exibirá o formato JSON como “[{column name -> column value}, … , {column name -> column value}]”. O formato JSON do DataFrame agora está definido como 'imprimir' e também será exibido no terminal.

O DataFrame é simplesmente mostrado aqui em forma de colunas e linhas, mas no formato JSON, você pode notar que ele coloca o nome da coluna e depois exibe o valor dessa coluna; depois de exibir o valor de uma coluna, ele imprime o nome da segunda coluna e depois coloca o valor dessa coluna e assim sucessivamente porque definimos o parâmetro do método “to_josn” como “orient= records”.

Exemplo # 04
Criamos um array numpy “My_data” no qual inserimos “2, 4” e “6, 8”. Em seguida, altere a matriz numpy para o DataFrame “My_dataFrame” e defina seus nomes de coluna como “A1 e A2”. Agora, depois de exibir o DataFrame aqui usando “print”. Nós utilizamos o método “to_json()” primeiro sem nenhum parâmetro e o exibimos. Depois disso, definimos o parâmetro dos métodos “to_json()” para “orient=split” e também imprimimos este formato. Então aplicamos o “to_josn()” novamente ao “My_dataFrame” e desta vez, passamos “orient=records” como parâmetro desta função.

Abaixo disso, colocamos “orient= index” com o “My_dataFrame” e renderizamos este formato JSON. Após este parâmetro, novamente utilizamos o “to_json” com o parâmetro “orient = column” e o renderizamos também. Então passamos “orient= values” como parâmetro do método “to_json()” e aplicamos no “My_dataFrame”. Também definimos o parâmetro desta função para “orient= table” e novamente o usamos com o mesmo DataFrame e também exibimos este formato JSON. Agora, vamos notar a diferença entre os formatos de JSON na saída deste código.

Aqui, você pode encontrar facilmente a diferença entre os formatos do JSON, que aplicamos ao mesmo DataFrame. Todos os parâmetros que passamos no método “to_json” aparecem em diferentes formatos aqui.

Conclusão

Este guia mostra o formato JSON e explica esse formato JSON em detalhes e como converter o DataFrame pandas no JSON. Explicamos que o método “to_json()” é utilizado para converter o DataFrame pandas para o formato JSON. Também discutimos diferentes parâmetros, que passamos para o método “to_json()” aqui. Fornecemos um guia completo no qual utilizamos os métodos “to_json()” colocando todos os parâmetros possíveis para esse método “to_json()” em nosso código “pandas” e também mostramos na saída como esses parâmetros alteram o formato do JSON.