Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Distribución multivariadat

Definición

La función de densidad de la probabilidad de la distribución del estudiante multivariado-dimensional es dada pordt

f(x,Σ,ν)=1|Σ|1/21(νπ)dΓ((ν+d)/2)Γ(ν/2)(1+x Σ-1xν)(ν+d)/2.

donde es un 1 por Vector, Σ es un-por-simétrico, matriz definida positiva, y es un escalar positivo.xdddν Si bien es posible definir el Student multivariado para Σ singular, la densidad no puede escribirse como la anterior.t Para el caso singular, solo se admite la generación de números aleatorios. Tenga en cuenta que mientras que la mayoría de los libros de texto definen la multivariada Student con orientado como un vector de columna, para los fines de software de análisis de datos, es más conveniente para orientar como un vector de fila, y el software utiliza esa orientación.txxStatistics and Machine Learning Toolbox™

Fondo

La distribución multivariada de Student es una generalización de la univariado Student a dos o más variables.tt Es una distribución para vectores aleatorios de variables correlacionadas, cada elemento de los cuales tiene una distribución univariada de Student.t De la misma manera que la distribución del estudiante univariado se puede construir dividiendo una variable aleatoria normal estándar univariada por la raíz cuadrada de una variable aleatoria de Chi-cuadrada univariada, la distribución del estudiante multivariado puede ser construida por dividiendo un vector aleatorio normal multivariado con media cero y varianzas unitarias por una variable aleatoria de Chi-cuadrado univariada.tt

La distribución del alumno multivariado se parametriza con una matriz de correlación, Σ y un parámetro de grados de libertad escalar positivo. es análogo al parámetro grados de libertad de la distribución de un alumno univariado.tννt Los elementos fuera de la diagonal de Σ contienen las correlaciones entre las variables. Tenga en cuenta que cuando Σ es la matriz de identidad, las variables no están correlacionadas; sin embargo, no son independientes.

La distribución multivariada de Student se utiliza a menudo como sustituto de la distribución normal multivariada en situaciones en las que se sabe que las distribuciones marginales de las variables individuales tienen colas más fatadas que las normales.t

Ejemplo

Trace PDF y CDF de distribución multivariadat

Trace el PDF de la distribución de un estudiante bivariado.t También puede utilizar esta distribución para un mayor número de cotas, aunque la visualización no es fácil.

Rho = [1 .6; .6 1]; nu = 5; x1 = -3:.2:3; x2 = -3:.2:3; [X1,X2] = meshgrid(x1,x2); F = mvtpdf([X1(:) X2(:)],Rho,nu); F = reshape(F,length(x2),length(x1)); surf(x1,x2,F); caxis([min(F(:))-.5*range(F(:)),max(F(:))]); axis([-3 3 -3 3 0 .2]) xlabel('x1'); ylabel('x2'); zlabel('Probability Density');

Trace la CDF de la distribución de un estudiante bivariado.t

F = mvtcdf([X1(:) X2(:)],Rho,nu); F = reshape(F,length(x2),length(x1)); surf(x1,x2,F); caxis([min(F(:))-.5*range(F(:)),max(F(:))]); axis([-3 3 -3 3 0 1]) xlabel('x1'); ylabel('x2'); zlabel('Cumulative Probability');

Dado que la distribución del alumno bivariado se define en el plano, también puede calcular las probabilidades acumulativas en regiones rectangulares.t Por ejemplo, esta gráfica de contorno ilustra el cálculo que sigue, de la probabilidad contenida en el cuadrado de la unidad que se muestra en la figura.

contour(x1,x2,F,[.0001 .001 .01 .05:.1:.95 .99 .999 .9999]); xlabel('x'); ylabel('y'); line([0 0 1 1 0],[1 0 0 1 1],'linestyle','--','color','k');

Calcule el valor de la probabilidad contenida en el cuadrado de la unidad.

F = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401 

Calcular una probabilidad acumulada multivariada requiere mucho más trabajo que calcular una probabilidad univariada. De forma predeterminada, la función calcula los valores a una precisión inferior a la de la máquina completa y devuelve una estimación del error, como una segunda salida opcional.mvtcdf

[F,err] = mvtcdf([0 0],[1 1],Rho,nu)
F = 0.1401 
err = 1.0000e-08 

Consulte también

| |

Temas relacionados