Reindexação de Pandas

Reindexacao De Pandas



“Em “pandas”, podemos armazenar muitas informações em formato tabular, também conhecido como DataFrame. O “pandas” nos facilita com o método “DataFrame()” para construir o DataFrame. O DataFrame contém índices, e também podemos alterar os índices do DataFrame utilizando as funções “pandas”. O método que utilizamos para reindexar o DataFrame é o método “reindex()”. Este método ajuda a alterar os valores de índice da linha, bem como os valores de índice das colunas. Ao utilizar este método, podemos alterar o índice padrão do DataFrame e também podemos alterar o índice que definimos ao criar o DataFrame. Usaremos o método “reindex()” em nossos exemplos de “pandas” neste tutorial e explicaremos esse conceito em profundidade aqui.”

Exemplo # 01

A ferramenta “Spyder” nos ajuda a desenvolver o código “pandas” aqui neste tutorial, e iniciamos nosso código com a palavra-chave “import”, que ajudará na importação da função “pandas”. Colocamos “pandas como pd” depois de digitar “import”. Após isso, criamos o DataFrame digitando “pd.DataFrame()”. Escrevemos este “pd” aqui porque o “DataFrame()” é o método de “pandas”. O “value_df” é o nome da variável na qual o DataFrame é salvo. Adicionamos 'RandomName', que é o nome da coluna, e 'RandomName' contém 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander e Samuel'.







Em seguida, temos “Value_1”, no qual inserimos “16, 29, 24, 35, 44, 50, 69, 74 e 88”. Em seguida, vem “Value_2” e adicionamos “25, 38, 42, 56, 54, 65, 78, 89 e 99”. Agora, o “Value_3” vem em seguida, e colocamos “36, 48, 52, 69, 74, 75, 87, 91 e 69” nele. A coluna “Value_4” está presente depois disso, onde inserimos “52, 64, 72, 88, 82, 95, 97, 21 e 39”. A última coluna é a coluna “Value_5” aqui, e nesta coluna, os valores que adicionamos são “66, 78, 82, 99, 34, 45, 57, 61 e 89”. Depois disso, usamos a função “print()” na qual “Values_df” é adicionado. Ele será impresso no terminal.




Depois de pressionar “Shift+Enter”, podemos obter facilmente o resultado de nossos códigos no aplicativo “Spyder”. Aqui, esse código retorna o DataFrame com o índice padrão. Agora, vamos aplicar o método “reindex()” para reindexar este DataFrame em “pandas”.




A função “reindex()” é usada aqui para reindexar o valor de índice da linha. No DataFrame acima, você pode ver que os valores de índice padrão da linha são exibidos e, agora, estamos aplicando o método “reindex()” para reindexar esses índices de linha. Colocamos o nome do DataFrame e depois o método “reindex()” no qual colocamos os valores de índice que queremos adicionar ao DataFrame acima. Colocamos “ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H e ind_I” na função “reindex()”. Assim, os índices dessas linhas serão atualizados no DataFrame quando executarmos este código.






Os valores do índice da linha são exibidos neste resultado e você pode observar que os valores do DataFrame não são exibidos aqui e os valores “NaN” apareceram. Isso ocorre porque os novos valores de índice não correspondem aos valores de índice anteriores do DataFrame. Quando o novo índice e o índice antigo não correspondem, ele exibe “Nan” lá. Esses valores “NaN” aparecem por padrão quando alteramos o índice e não correspondem ao índice anterior.



Exemplo # 02

Agora estamos alterando os valores do índice da coluna do “Value_df”, que criamos anteriormente no exemplo 1. Após imprimir o “Value_df”, colocamos a variável “column” e adicionamos alguns valores a ela. Adicionamos “a_1, b_1, c_1, d_1 e e_1”. Agora, queremos ajustar esses valores como o índice das colunas, então, para isso, estamos usando o método “reindex()” e colocamos o nome da variável “column” na qual os novos valores do índice da coluna são armazenados e também defina o “eixo” para “colunas” para que ele atualize o índice do eixo da coluna. Colocamos o método “reindex()” no “print()”, para que também seja renderizado no terminal.


Como usamos o método “reindex()”, os valores de índice de coluna que estão presentes no primeiro DataFrame são atualizados e novos valores são adicionados no DataFrame atualizado. Você também pode observar que todos os valores do DataFrame são convertidos em “NaN” porque os dois valores de índice das colunas são diferentes.

Exemplo # 03

O “Programming_data” neste código contém “P_Languages”, onde adicionamos “JavaScript, CSS, Web Engineering, OOP, C#, AI, Java e JavaScript”. Então, temos “Horas” em que colocamos “4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs e 6_hrs”. Depois disso, o “P_Code” é inserido e inserimos “11523, 12423, 12321, 11456, 11454, 12267, 13106 e 14123”. Adicionamos a variável “p_index” e colocamos “Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G e Pro_H”.

Esses valores serão usados ​​como os valores de índice das linhas. Alteramos o “Programming_data” no DataFrame “Programming_df”. Também adicionamos o “p_index” a este DataFrame usando o método “index”. Colocamos “Programming_df” e depois o método “index” e atribuímos o “p_index” a isso. Agora, os valores de índice acima são adicionados como os valores de índice de linhas ao DataFrame. Também imprimimos o “Programming_df”.

Depois disso, adicionamos alguns novos valores de índice na variável “new_index”, que são “P_1, P_2, P_3, P_4, P_5, P_6, P_7 e P_8”. Como queremos atualizar os valores de índice das linhas, usamos o método “reindex()” e colocamos “new_index” como parâmetro desta função e também armazenamos o DataFrame atualizado no “newProgramming_df” e colocamos o “newProgramming_df” em “ print()” para exibição.


Os valores de índice são atualizados e também podemos dizer que reindexamos o DataFrame que criamos. Todos os valores do DataFrame também são convertidos em “NaN” porque ambos os valores de índice são diferentes.

Exemplo # 04

Atualmente estamos alterando os valores de índice das colunas “Programming_df”, que desenvolvemos anteriormente no exemplo 3. Colocamos a variável “column” e inserimos novos valores nela. O “P_Code, P_Languages, Hours, and New” são adicionados à variável “column”. Em seguida, usamos novamente o método “reindex()” no qual definimos a variável “column”, que atualizará os valores de índice de coluna anteriores e adicionará esses novos valores de índice de coluna ao DataFrame.

Aqui, você pode notar que os novos valores que adicionamos em “column” são os mesmos que adicionamos no DataFrame acima, mas a sequência é diferente, portanto, alterará a sequência das colunas e ajustará todas as colunas conforme mencionado na variável “coluna”. Além disso, adicionamos mais um valor de índice que não está presente no DataFrame acima, que é “Novo” aqui, então os valores “NaN” aparecerão nesta coluna.


A sequência das colunas é alterada aqui, e todos os valores aparecem como estão presentes nas colunas do DataFrame original e a coluna “Novo” no DataFrame atualizado contém todos os valores “NaN” porque essa coluna não está presente no DataFrame original.

Conclusão

Apresentamos este tutorial que nos ajuda a entender em detalhes a noção de “reindexação de pandas”. Discutimos como podemos reindexar a coluna de um DataFrame, bem como os valores de índice da linha. Explicamos que a função “reindex()” de “pandas” é utilizada para fazer isso. Fizemos diferentes exemplos em que alteramos os valores de índice das linhas do DataFrame e também os valores de índice do índice da coluna do DataFrame. Nós renderizamos os resultados de todos os códigos que fizemos aqui neste tutorial e também os explicamos em profundidade.