Coluna de soma de pandas

Coluna De Soma De Pandas



“Este artigo demonstrará como somar todas as colunas ou colunas específicas em um Pandas DataFrame usando Python. A função DataFrame.sum() será usada junto com alguns parâmetros úteis nos vários exemplos deste tutorial.”

Quando este tutorial terminar, você poderá saber como:







    • Encontre a soma da coluna do dataframe em Pandas.
    • Adicionando as colunas do dataframe juntas
    • Adicione colunas a um Dataframe do Pandas que atenda à condição especificada.
    • Determine a soma após agrupar os dados do dataframe.

Como determinar a soma das colunas do dataframe?

A função “dataframe.sum()” no Pandas retorna a soma total para o eixo especificado. Se a entrada for um eixo do índice, a função soma os valores de cada coluna individualmente, depois faz o mesmo para cada coluna, retornando uma série que armazena a soma dos dados/valores em cada coluna. Além disso, ele suporta o cálculo da soma do dataframe ignorando os valores ausentes.



Sintaxe: DataFrame.sum(axis = None, skipna = None, level = None, numeric_only = None, min_count = 0, **kwargs)



Onde,





eixo: {colunas (1), índice (0)}

ordem: Ignore os valores NA/nulos ao calcular o resultado.



nível: Se o eixo especificado for hierárquico (um multi-índice), conte para um nível de índice específico antes de converter para uma série.

numeric_only: Apenas colunas float, int e boolean são aceitáveis. Se Nenhum, tente usar tudo; se não, apenas dados numéricos. Para Série, não implementado.

min_count: O número de valores possíveis necessários para concluir a operação. O resultado será NA se houver menos valores não NA presentes do que min_count.

Devoluções: DataFrame (se o nível for especificado) ou Series.

Exemplo # 01: Determinar a soma de uma coluna de dataframe e todas as colunas

Exigimos primeiro um dataframe com os tipos de dados válidos, ou seja, int, float, etc., coluna ou colunas para as quais podemos encontrar a soma dos dados. O dataframe será criado usando a função pd.DataFrame().


Criamos o dataframe necessário a partir de um dicionário python dentro da função pd.DataFrame(). No dataframe criado acima, existem quatro colunas “Nome”, “dia1”, “dia2” e “dia3”. Das quatro colunas, as três colunas, ou seja, 'dia1', 'dia2' e 'dia3' são colunas numéricas com os valores de dados (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) e (7, 4, 3, 5, 6, 2, 1, 4), respectivamente. Só podemos encontrar a soma dessas três colunas. A soma para ambas as séries (ou seja, uma coluna) e um dataframe inteiro pode ser determinada usando o método sum(). Vamos começar ensinando como somar todos os dados em uma coluna do Pandas.


Para determinar a soma, usamos o método sum() na coluna “day2”. A função retornou o valor de soma de 28. Da mesma forma, podemos determinar a soma de cada coluna do Dataframe. Simplesmente usar o método sum() em todo o dataframe fará isso.


Como pode ser visto, a soma da coluna “dia1” é 31; para “dia2”, o valor da soma é 28, enquanto, para a coluna “dia3”, o valor da soma é 32.

Exemplo # 02: Usando a função sum() para somar os valores da coluna do dataframe juntos

Como você pode ver na saída do exemplo anterior, a função não retornou os dados reais da coluna do quadro de dados que compunham a soma. No entanto, ao atribuir o método 'DataFrame.sum()' a uma coluna DataFrame, você pode acessar todas as colunas do DataFrame, incluindo a coluna soma. Primeiro, criamos outro dataframe para este exemplo.


Usando o pd.DataFrame() nosso dataframe foi criado. Criamos o dataframe com três colunas: item, preço e imposto. O item da coluna contendo os valores da string (“caneta”, “marcador”, “régua”, “borracha”, “lápis”, “área de transferência”, “grampeador”, “pinos”), o preço da coluna armazenando os valores (20, 15, 10, 3, 5, 30, 35, 10), e a coluna “imposto” consiste em valores (8, 5, 3, 3, 4, 10, 5, 2). Agora vamos somar os valores das colunas de preço e impostos e armazenar os resultados em uma nova coluna mantendo as colunas originais do dataframe.


Como pode ser observado junto com a nova coluna “total”, as colunas originais do dataframe fornecido também são retornadas pela função. A coluna “total” armazena a soma dos valores das colunas “preço” e “imposto” em relação aos dados de cada “item”.

Exemplo # 03: Usando a função sum() para determinar a soma das colunas de dataframe especificadas

Para somar as várias colunas do dataframe, podemos especificar uma lista com os rótulos das colunas e, em seguida, aplicar o método sum() na lista para encontrar a soma. Como nos exemplos anteriores, primeiro criaremos o dataframe.


Criamos nosso dataframe com quatro colunas “students”, “marks1”, “marks2” e “marks3”. A coluna “alunos” armazena os dados (“Larry”, “James”, “Rob”, “Arya”, “Max”, “Ben”, “Gwen”, “Bill”) e a coluna “marks1” armazena os valores (8, 9, 6, 8, 10, 7, 9, 9), enquanto as colunas “marks2” e “marks3” estão armazenando os valores numéricos (6, 6, 8, 6, 7, 9, 10, 9 ) e (7, 6, 9, 7, 8, 7, 10, 10), respectivamente.


Primeiro, criamos um objeto de lista com rótulos de coluna “alunos”, “marcas1” e “marcas3”. Em seguida, o método sum() é aplicado à lista. A função resumiu os valores das colunas marcas1 e marcas3 apenas porque a coluna 'alunos' não é numérica, portanto, a função soma() não pode encontrar a soma dos valores da coluna 'alunos'. Armazenamos a soma dos valores das colunas “marks1” e “marks3” na coluna “sum”.

Exemplo # 04: Adicionar Colunas de Pandas Dataframe que Satisfazem uma Condição Especificada

Neste exemplo, adicionaremos os valores das colunas especificadas se elas atenderem à condição especificada.


Existem 5 colunas no dataframe recém-criado, ou seja, “empresa”, “semana1_vendas”, “semana2_vendas”, “semana3_vendas” e “filiais”. Agora, vamos supor que não queremos adicionar o valor da última coluna quando estamos adicionando ou encontrando a soma dos valores das linhas do dataframe. Digamos que queríamos apenas adicionar os valores das colunas com a palavra “week” em seus rótulos. Uma compreensão de lista pode ser criada para determinar se a palavra “semana” está presente em um rótulo de coluna ou não.


Agora buscamos as colunas com a palavra “week” em seus rótulos. Podemos resumir as colunas que contêm a palavra “week” usando o argumento axis=1 na função sum().


Dessa forma, podemos resumir com segurança os dados nas colunas, sem incluir nenhuma coluna que não desejamos.

Exemplo # 5: Determine a soma após agrupar os dados do dataframe

Também podemos encontrar a soma das colunas do dataframe após agrupar os dados de uma ou mais colunas. O método groupby() será usado para agrupar os dados em categorias dentro da coluna. Vamos criar um dataframe para que possamos agrupar os dados de uma de suas colunas.


Agora vamos agrupar os dados na coluna “idade” e somar os valores das colunas “pontuação1” e “pontuação2” para cada categoria do grupo.


Podemos ver que somar os dados no dataframe depois de agrupar primeiro os valores de dados por idade resulta em uma soma em colunas dependendo dos agrupamentos de idade.

Conclusão

Neste tutorial, tentamos ensiná-lo a calcular a soma entre dataframes usando o método Pandas sum. Discutimos a adição de valores em linhas e colunas nos exemplos deste post. Além disso, você aprendeu como adicionar colunas condicionalmente e como somar os valores após agrupar a coluna do dataframe. Agora você pode somar as colunas do dataframe ou somar os valores dentro da coluna do dataframe sozinho.