Desvio Padrão dos Pandas

Desvio Padrao Dos Pandas



“O “Pandas” é uma ótima linguagem para realizar a análise de dados devido ao seu grande ecossistema de pacotes python centrados em dados. Isso facilita a análise e a importação de ambos os fatores. O desvio padrão é um desvio “típico” derivado da média. Ele é muito usado, pois retorna as unidades de medida originais do dataframe. Os pandas usaram std() para o cálculo do desvio padrão. O desvio padrão pode ser calculado a partir dos valores fornecidos que podem estar no dataframe na forma de uma linha ou coluna. Implementaremos todas as maneiras possíveis de usar o desvio padrão dos pandas. Para a implementação do código, usaremos a ferramenta “spyder” como está escrita em um ambiente compatível com python.”

Sintaxe







“df.std ( )


A sintaxe a seguir é usada para calcular o desvio padrão no dataframe. O “df” no dataframe é a abreviação do “dataframe”. O que o desvio padrão faz? Ele mede a extensão dos dados necessários. Quanto mais altos valores expandidos, maior o desvio padrão deve ocorrer.



Retornar

O desvio padrão dos pandas retorna o dataframe se o nível for especificado com base no requisito.



Observe que a função “std()” ignorará automaticamente os valores “NaN” no “df” enquanto calcula o desvio padrão dos pandas. “NaN” pode ser explicado como “não é um número”, o que significa que não há valor atribuído a um determinado.





A seguir estão os métodos que serão executados com exemplos do desvio padrão dos pandas:

    • Cálculo do desvio padrão do Pandas em uma única coluna.
    • Cálculo do desvio padrão do Pandas em várias colunas.
    • Cálculo do desvio padrão do Pandas de todas as colunas numéricas.
    • desvio padrão dos pandas usando o eixo = 1.
    • desvio padrão dos pandas usando o eixo = 0.

Criando o Dataframe para o Cálculo do Desvio Padrão em Pandas

Primeiro, abra o software “spyder”. Agora importe a biblioteca pandas como pd. Criaremos um dataframe que consiste em um placar com termos como “x”, “y” e “z” com seus pontos como “22”, “10”, “11”, “16”, “12”, “45 ”, “36” e “40”. Temos seus valores de assistências como “8”, “9”, “13”, “7”, “22”, “24”, “4” e “6” também, tendo o valor dos rebotes como “17”, “ 14”, “3”, 5”, “9”, “8”, “7” e “4”.




Os displays mostram o dataframe criado de acordo com os valores atribuídos no código:

Exemplo # 01: Cálculo do Desvio Padrão do Pandas em uma Coluna Única

Neste exemplo, calcularemos o desvio padrão de uma única coluna no dataframe do pandas. O dataframe tem os valores da equipe como “u”, “v” e “b” com seus pontos como “44”, “33”, “22”, “44”, “45”, “88”, “96 ” e “78”. Os valores de assistências são como “7”,”8”, “9”, “10”, “11”, “14”, “18” e “17” tendo também os valores de rebotes como “11”, “ 9”, “8”, “7”, “6”, “5”, “4” e “3”. A coluna 'pontos' é selecionada do dataframe para calcular o desvio padrão de coluna única.


A saída mostra o desvio padrão calculado da coluna “pontos”:

Exemplo # 02: Cálculo de Desvio Padrão do Pandas em Várias Colunas

Neste exemplo, executaremos os cálculos de desvio padrão dos pandas em várias colunas. Neste dataframe, os dados são novamente do placar esportivo tendo os valores da equipe como “n”, “w” e “t” com a pontuação como “33”, “22”, “66”, “55”, “44”, “88”, “99” e “77”. As assistências como '9', '7', '8', '11', '16', '14', '12' e '13' e rebotes como '5', '8', '1', ' 2”, “3”, “4”, “6” e “7”. Aqui vamos calcular o desvio padrão das duas colunas “pontos” e “rebotes” usando a função std() aplicada ao dataframe.


Como vemos, a saída mostra que o desvio padrão foi de 26,944387 na coluna de pontos e 2,449490 na coluna de recuperação, respectivamente.

Exemplo # 03: Cálculo do Desvio Padrão do Pandas de Todas as Colunas Numéricas

Agora aprendemos como calcular o desvio padrão de linhas únicas e múltiplas. E se não quisermos especificar todos os nomes das colunas no dataframe e calcular todo o dataframe? Isso é possível com apenas uma simples implementação de função do desvio padrão dos pandas para o cálculo do dataframe completo nos resultados. O dataframe aqui consiste em “l”, “m” e “o” com os valores de pontuação “33”, “36”, “79”, “78”, “58”, “55”, e duas equipes pontuam a mesma que é '25'. As assistências são como “1”, “2”, “3”, “4”, “6”, “9”, “5” e “7” e seus rebotes como “14”, “10”, “2” , “5”, “8”, “3”, “6” e “9”. Podemos calcular todos os desvios padrão da coluna por pandas no dataframe usando a função pandas “std()”.


O display tem o desvio padrão calculado de todo o “df” mostrado abaixo; também podemos notar que os pandas não calcularam o desvio padrão da primeira coluna, que é “equipe”, pois não é uma coluna numérica.

Exemplo # 04: Desvio Padrão do Pandas Usando o Eixo = 0

Neste exemplo, os dataframes têm as equipes dos esportes como “g”, “h” e “k” com mais dados. Aqui, vamos calcular o desvio padrão usando o eixo como “0”, um parâmetro usado no desvio padrão dos pandas. Este argumento calcula o desvio padrão em coluna do dataframe.


A saída a seguir exibe os resultados em colunas do desvio padrão calculado. A coluna de pontos tem o desvio padrão calculado como '24,0313062', a coluna de assistências tem o desvio padrão calculado como '2,669270' e o desvio padrão calculado da coluna de rebote é mostrado como '3,943802'.

Exemplo # 05: Desvio Padrão do Pandas Usando o Eixo = 1

Aqui usaremos o parâmetro do eixo atribuído como “1” para calcular o desvio padrão em pandas. Que diferença o eixo “1” pode fazer? O argumento do eixo “1” calcula o desvio padrão em linha dos valores numéricos no dataframe. O dataframe tem os três times como “s”, “d” e “e”, com a adição de colunas de dados criadas como pontos do time, assistências do time e rebotes do time. Todas as direções são atribuídas com valores diferentes no dataframe. Este parâmetro de eixo é um divisor de águas, pois, no momento, precisamos trabalhar nos dados onde queremos que estejam em uma coluna mais o ponto calculado do desvio padrão realizado.


A saída a seguir exibe o desvio padrão calculado em uma linha do dataframe:

Conclusão

O desvio padrão dos pandas é uma função muito técnica, que é uma função muito benéfica, pois encontra o desvio padrão do pacto de entusiasmo dos dataframes dos pandas. Neste editorial, estudamos os métodos de cálculo do desvio padrão em pandas. Fizemos cálculos de coluna única de desvio padrão e várias colunas e também calculamos o desvio padrão de todo o dataframe juntos. Todas as estratégias funcionam bem desde que sejam usadas de forma consistente e com os resultados desejados.