Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Ajustar objetos de distribución de probabilidad a datos agrupados

Este ejemplo muestra cómo ajustar los objetos de distribución de probabilidad a los datos de muestra agrupados y crear un trazado para comparar visualmente el PDF de cada grupo.

Paso 1. Cargue datos de muestra.

Cargue los datos de ejemplo.

load carsmall;

Los datos contienen las mediciones de millas por galón () para las diferentes marca y modelos de automóviles, agrupados por país de origen (), año del modelo () y otras características del vehículo.MPGOriginModel_Year

Paso 2. Cree una matriz categórica.

Transfórmate en una matriz categórica.Origin

Origin = categorical(cellstr(Origin));

Paso 3. Ajuste las distribuciones de kernel a cada grupo.

Utilíce para ajustar las distribuciones del kernel a cada grupo de países de origen en los datos.fitdistMPG

[KerByOrig,Country] = fitdist(MPG,'Kernel','by',Origin)
KerByOrig = 1x6 cell array
  Columns 1 through 2

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

  Columns 3 through 4

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

  Columns 5 through 6

    {1x1 prob.KernelDistribution}    {1x1 prob.KernelDistribution}

Country = 6x1 cell array
    {'France' }
    {'Germany'}
    {'Italy'  }
    {'Japan'  }
    {'Sweden' }
    {'USA'    }

La matriz de celdas contiene seis objetos de distribución de kernel, uno para cada país representado en los datos de ejemplo.KerByOrig Cada objeto contiene propiedades que contienen información sobre los datos, la distribución y los parámetros. La matriz enumera el país de origen de cada grupo en el mismo orden en que se almacenan los objetos de distribución.CountryKerByOrig

Paso 4. Calcule el PDF para cada grupo.

Extraiga los objetos de distribución de probabilidad para Alemania, Japón y Estados Unidos. Utilice las posiciones de cada país que se muestran en el paso 3, lo que indica que Alemania es el segundo país, Japón es el cuarto país, y Estados Unidos es el sexto país.KerByOrig Calcule el PDF para cada grupo.

Germany = KerByOrig{2}; Japan = KerByOrig{4}; USA = KerByOrig{6};  x = 0:1:50;  USA_pdf = pdf(USA,x); Japan_pdf = pdf(Japan,x); Germany_pdf = pdf(Germany,x);

Paso 5. Trace el PDF para cada grupo.

Trace el PDF para cada grupo en la misma figura.

plot(x,USA_pdf,'r-') hold on plot(x,Japan_pdf,'b-.') plot(x,Germany_pdf,'k:') legend({'USA','Japan','Germany'},'Location','NW') title('MPG by Country of Origin') xlabel('MPG')

La gráfica resultante muestra cómo el rendimiento de las millas por galón () difiere según el país de origen ().MPGOrigin Utilizando estos datos, Estados Unidos tiene la distribución más amplia, y su pico es el valor más bajo de los tres orígenes.MPG Japón tiene la distribución más regular con una cola izquierda ligeramente más pesada, y su pico es el valor más alto de los tres orígenes.MPG El pico para Alemania es entre los EE.UU. y Japón, y el segundo bulto cerca de 44 millas por galón sugiere que podría haber varios modos en los datos.

Consulte también

|

Temas relacionados