Como trabalhar com distribuição normal no MATLAB usando fitdist

Como Trabalhar Com Distribuicao Normal No Matlab Usando Fitdist



Distribuição normal é uma técnica estatística amplamente utilizada em inteligência artificial, ciência de dados, aprendizado de máquina e muitos outros campos. É uma distribuição de probabilidade simétrica na média e também chamada de distribuição gaussiana devido ao formato que assume em um gráfico. Mostra que os valores dos dados próximos da média ocorrem com mais frequência do que os valores dos dados distantes da média. Em um gráfico, a distribuição normal forma uma curva em sino.

Encontrar uma distribuição normal de um conjunto de dados não é uma tarefa fácil; no entanto, podemos realizá-lo no MATLAB usando o distfit() função. Leia este guia para aprender em detalhes sobre como trabalhar com o distribuição normal no MATLAB usando o distfit() função.

O que é distribuição normal

A distribuição normal também chamada de distribuição gaussiana é definida usando dois parâmetros; média e desvio padrão dos pontos de dados. A média mede a média dos valores dos dados, enquanto o desvio padrão mede como os valores dos dados estão distribuídos em torno da média. Com a combinação da média e do desvio padrão, podemos calcular distribuição normal da seguinte fórmula:









Onde:



  • x representa valores do conjunto de dados.
  • f(x) representa a função de probabilidade.
  • eu denota o
  • p denota o desvio padrão.

Como realizar distribuição normal no MATLAB usando a função fitdist()

MATLAB nos permite calcular o distribuição normal de variáveis ​​​​aleatórias usando o built-in distfit() função. Esta função produz um distribuição normal de probabilidade objeto ajustando a distribuição fornecida aos dados de entrada. O distribuição normal aceita dois parâmetros como entrada: o desvio padrão e também a média. Uma distribuição normal padrão tem valor médio zero, bem como um desvio padrão unitário que é 1. Isso significa que o distribuição normal está centrado em zero e os valores das distribuições estão distribuídos igualmente em ambos os lados da média.





Sintaxe

O distfit() no MATLAB pode ser usado de diferentes maneiras:



PD = fitdista ( x , nome dist )
PD = fitdista ( x , nome dist , Nome , Valor )
pdca , gn , gl ] = fitdista ( x , nome dist , 'Por' , var de grupo )

Aqui:

  • A função pd = distfit(x,nomedist) é responsável por ajustar a distribuição fornecida por distname aos dados contidos no vetor coluna x para produzir um objeto de distribuição de probabilidade.
  • A função pd = fitdist(x,distname,Nome,Valor) é responsável por construir o objeto de distribuição de probabilidade com um ou mais argumentos de par nome-valor que especificam parâmetros extras.
  • A função [pdca,gn,gl] = fitdist(x,distname,’By’,groupvar) é responsável por ajustar a distribuição de probabilidade definida por distname aos dados no vetor coluna x com base na variável de agrupamento groupvar para gerar objetos de distribuição de probabilidade. Ele retorna um array de células de objetos de distribuição de probabilidade ajustados, denotado como pdca, um array de células de rótulos de grupo, denotado como gn, e um array de células de níveis de variáveis ​​de agrupamento, denotado como gl.

Exemplo 1: Como encontrar a distribuição normal usando a função fitdist(x,distname)

Este exemplo se enquadra em um distribuição normal para os dados de amostra z usando o distfit() função.

carregar pacientes
Com = Peso ;
PD = fitdista ( Com , 'Normal' )

Exemplo 2: Como encontrar a distribuição normal usando fitdist(x,distname,Name,Value) Função

Neste exemplo, vamos ajustar uma distribuição Kernel aos dados de amostra usando o distfit() função no MATLAB.

carregar pacientes
Com = Peso ;
PD = fitdista ( Com , 'Núcleo' , 'Núcleo' , 'epanechnikov' )

Exemplo 3: Como encontrar a distribuição normal usando a função fitdist(x,distname,’By’,groupvar)

O código MATLAB fornecido abaixo se ajusta distribuições normais para dados agrupados, calcula e plota a pdf de ambos os grupos de dados.

carregar pacientes
Com = Peso ;
[ pdca , gn , gl ] = fitdista ( Com , 'Normal' , 'Por' , Gênero )
fêmea = pdca { 1 }
macho = pdca { 2 }
valores_z = 80 : 1 : 220 ;
femininopdf = pdf ( fêmea , valores_z ) ;
masculinopdf = pdf ( macho , valores_z ) ;
figura
trama ( valores_z , femininopdf , 'Espessura da linha' , 2 )
aguentar
trama ( valores_z , masculinopdf , 'Cor' , 'r' , 'EstiloLinha' , ':' , 'Espessura da linha' , 2 )
lenda ( gn , 'Localização' , 'Nordeste' )
espere

Conclusão

Encontrando o distribuição normal de um conjunto de dados é uma técnica estatística amplamente utilizada em aprendizado de máquina, inteligência artificial, ciência de dados e muitos outros campos. Pode ser definido usando dois parâmetros; média e também o desvio padrão dos pontos de dados. Podemos ajustar o conjunto de dados no distribuição normal objeto usando o distfit() função. Este guia forneceu os fundamentos do distribuição normal função e como trabalhar com ela no MATLAB usando o distfit() função.