Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

corrcoef

Coeficientes de correlación

Descripción

ejemplo

R = corrcoef(A) devuelve la matriz de coeficientes de correlación Coeficiente de correlación para A, donde las columnas de A representan variables aleatorias y las filas representan observaciones.

ejemplo

R = corrcoef(A,B) devuelve coeficientes entre dos variables aleatorias A y B.

ejemplo

[R,P] = corrcoef(___) devuelve la matriz de coeficientes de correlación y la matriz de valores p para probar la hipótesis de que no existe relación entre los fenómenos observados (hipótesis nula). Utilice esta sintaxis con cualquiera de los argumentos de las sintaxis anteriores. Si un elemento OFF-diagonal de P es menor que el nivel de significancia (el valor predeterminado es 0.05), la correlación correspondiente en R se considera significativa. Esta sintaxis no es válida si R contiene elementos complejos.

ejemplo

[R,P,RL,RU] = corrcoef(___) incluye matrices que contienen límites inferiores y superiores para un intervalo de confianza del 95% para cada coeficiente. Esta sintaxis no es válida si R contiene elementos complejos.

ejemplo

___ = corrcoef(___,Name,Value) devuelve cualquiera de los argumentos de salida de las sintaxis anteriores con opciones adicionales especificadas por uno o más argumentos de par Name,Value . Por ejemplo, corrcoef(A,'Alpha',0.1) especifica un intervalo de confianza del 90% y corrcoef(A,'Rows','complete') omite todas las filas de A que contienen uno o más NaN valores.

Ejemplos

contraer todo

Calcule los coeficientes de correlación de una matriz con dos columnas aleatorias normalmente distribuidas y una columna definida en términos de otra. Dado que la tercera columna de A es un múltiplo del segundo, estas dos variables se correlacionan directamente, por lo tanto el coeficiente de correlación en las entradas de (2,3) y (3,2) de R es 1.

x = randn(6,1);
y = randn(6,1);
A = [x y 2*y+3];
R = corrcoef(A)
R = 3×3

    1.0000   -0.6237   -0.6237
   -0.6237    1.0000    1.0000
   -0.6237    1.0000    1.0000

Calcular la matriz de coeficiente de correlación entre dos vectores aleatorios normalmente distribuidos de 10 observaciones cada uno.

A = randn(10,1);
B = randn(10,1);
R = corrcoef(A,B)
R = 2×2

    1.0000    0.4518
    0.4518    1.0000

Calcular los coeficientes de correlación y los valores p de una matriz aleatoria normalmente distribuida, con una cuarta columna añadida igual a la suma de las otras tres columnas. Dado que la última columna de A es una combinación lineal de las otras, se introduce una correlación entre la cuarta variable y cada una de las otras tres variables. Por lo tanto, la cuarta fila y la cuarta columna de P contienen valores p muy pequeños, que los identifican como correlaciones significativas.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

Crear una matriz aleatoria normalmente distribuida, con una cuarta columna añadida igual a la suma de las otras tres columnas, y calcular los coeficientes de correlación, los valores de p, y los límites inferiores y superiores de los coeficientes.

A = randn(50,3);       
A(:,4) = sum(A,2); 
[R,P,RL,RU] = corrcoef(A)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.1702   -0.1952    0.5688
   -0.1702    1.0000   -0.4070    0.2677
   -0.1952   -0.4070    1.0000    0.2825
    0.5688    0.2677    0.2825    1.0000

RU = 4×4

    1.0000    0.3799    0.3575    0.8389
    0.3799    1.0000    0.1388    0.6890
    0.3575    0.1388    1.0000    0.6974
    0.8389    0.6890    0.6974    1.0000

Las matrices RL y RU dan límites inferiores y superiores, respectivamente, en cada coeficiente de correlación de acuerdo con un intervalo de confianza del 95% de forma predeterminada. Puede cambiar el nivel de confianza especificando el valor de Alpha, que define la confianza porcentual, 100*(1-Alpha)%. Por ejemplo, utilice un valor Alpha igual a 0,01 para calcular un intervalo de confianza del 99%, que se refleja en los límites RL y RU. Los intervalos definidos por los límites del coeficiente en RL y RU son más grandes para la confianza del 99% en comparación con el 95%, ya que una mayor confianza requiere un rango más inclusivo de valores potenciales de correlación.

[R,P,RL,RU] = corrcoef(A,'Alpha',0.01)
R = 4×4

    1.0000    0.1135    0.0879    0.7314
    0.1135    1.0000   -0.1451    0.5082
    0.0879   -0.1451    1.0000    0.5199
    0.7314    0.5082    0.5199    1.0000

P = 4×4

    1.0000    0.4325    0.5438    0.0000
    0.4325    1.0000    0.3146    0.0002
    0.5438    0.3146    1.0000    0.0001
    0.0000    0.0002    0.0001    1.0000

RL = 4×4

    1.0000   -0.2559   -0.2799    0.5049
   -0.2559    1.0000   -0.4792    0.1825
   -0.2799   -0.4792    1.0000    0.1979
    0.5049    0.1825    0.1979    1.0000

RU = 4×4

    1.0000    0.4540    0.4332    0.8636
    0.4540    1.0000    0.2256    0.7334
    0.4332    0.2256    1.0000    0.7407
    0.8636    0.7334    0.7407    1.0000

Cree una matriz distribuida normalmente que implique los valores de NaN y calcule la matriz de coeficiente de correlación, excluyendo las filas que contengan NaN.

A = randn(5,3);
A(1,3) = NaN;
A(3,2) = NaN;
A
A = 5×3

    0.5377   -1.3077       NaN
    1.8339   -0.4336    3.0349
   -2.2588       NaN    0.7254
    0.8622    3.5784   -0.0631
    0.3188    2.7694    0.7147

R = corrcoef(A,'Rows','complete')
R = 3×3

    1.0000   -0.8506    0.8222
   -0.8506    1.0000   -0.9987
    0.8222   -0.9987    1.0000

Utilice 'all' para incluir todos los valores de NaN en el cálculo.

R = corrcoef(A,'Rows','all')
R = 3×3

     1   NaN   NaN
   NaN   NaN   NaN
   NaN   NaN   NaN

Utilice 'pairwise' para calcular cada coeficiente de correlación de dos columnas sobre una base Pairwise. Si una de las dos columnas contiene un NaN, se omite esa fila.

R = corrcoef(A,'Rows','pairwise')
R = 3×3

    1.0000   -0.3388    0.4649
   -0.3388    1.0000   -0.9987
    0.4649   -0.9987    1.0000

Argumentos de entrada

contraer todo

Array de entrada, especificado como una matriz.

  • Si A es un escalar, corrcoef(A) devuelve NaN.

  • Si A es un vector, corrcoef(A) devuelve 1.

Tipos de datos: single | double
Soporte de números complejos:

Matriz de entrada adicional, especificada como vector, matriz o matriz multidimensional.

  • A y B deben tener el mismo tamaño.

  • Si A y B son escalares, corrcoef(A,B) devuelve 1. Sin embargo, si A y B son iguales, corrcoef(A,B) devuelve NaN.

  • Si A y B son matrices o matrices multidimensionales, corrcoef(A,B) convierte cada entrada en su representación vectorial y equivale a corrcoef(A(:),B(:)) o corrcoef([A(:) B(:)]).

  • Si A y B son matrices vacías de 0 por 0, corrcoef(A,B) devuelve una matriz 2 por 2 de NaN valores.

Tipos de datos: single | double
Soporte de números complejos:

Argumentos de par nombre-valor

Ejemplo: R = corrcoef(A,'Alpha',0.03)

Nivel de significancia, especificado como un número entre 0 y 1. El valor del parámetro 'Alpha' define el nivel de confianza porcentual, 100 * (1-Alpha)%, para los coeficientes de correlación, que determina los límites en RL y RU .

Tipos de datos: single | double

Uso de la opción NaN , especificada como uno de estos valores:

  • 'all' : Incluya todos los valores de NaN en la entrada antes de calcular los coeficientes de correlación.

  • 'complete' : Omita cualquier fila de la entrada que contenga valores de NaN antes de calcular los coeficientes de correlación. Esta opción siempre devuelve una matriz definida positiva.

  • 'pairwise' : Omita cualquier fila que contenga NaN sólo sobre una base Pairwise para cada cálculo de coeficiente de correlación de dos columnas. Esta opción puede devolver una matriz que no es positiva definida.

Tipos de datos: char

Argumentos de salida

contraer todo

Coeficientes de correlación, devueltos como matriz.

  • Para una entrada de matriz, R tiene el tamaño [size(A,2) size(A,2)] basándose en el número de variables aleatorias (columnas) representadas por A. Las entradas diagonales se establecen en una por Convención, mientras que las entradas OFF-diagonal son coeficientes de correlación de pares variables. Los valores de los coeficientes pueden variar de-1 a 1, con-1 que representa una correlación directa, negativa, 0 que representa ninguna correlación, y 1 que representa una correlación directa, positiva. R es simétrico.

  • Para dos argumentos de entrada, R es una matriz de 2 por 2 con unas a lo largo de la diagonal y los coeficientes de correlación a lo largo de la diagonal.

  • Si alguna variable aleatoria es constante, su correlación con todas las demás variables no está definida y el valor de fila y columna respectivo es NaN.

Valores P, devueltos como una matriz. P es simétrico y tiene el mismo tamaño que R. Las entradas diagonales son todas unas y las entradas OFF-diagonales son los p-valores para cada par variable. Los valores de P oscilan entre 0 y 1, donde los valores cercanos a 0 corresponden a una correlación significativa en R y una baja probabilidad de observar la hipótesis nula.

Límite inferior para el coeficiente de correlación, devuelto como matriz. RL es simétrico y tiene el mismo tamaño que R. Las entradas diagonales son todas unas y las entradas OFF-diagonales son el intervalo de confianza del 95% más bajo límite para el coeficiente correspondiente en R. La sintaxis que devuelve RL no es válida si R contiene valores complejos.

Límite superior para el coeficiente de correlación, devuelto como matriz. RU es simétrico y tiene el mismo tamaño que R. Las entradas diagonales son todas unas y las entradas OFF-diagonales son el 95% intervalo de confianza superior límite para el coeficiente correspondiente en R. La sintaxis que devuelve RL no es válida si R contiene valores complejos.

Más acerca de

contraer todo

Coeficiente de correlación

El coeficiente de correlación de dos variables aleatorias es una medida de su dependencia lineal. Si cada variable tiene N observaciones escalares, el coeficiente de correlación de Pearson se define como

ρ(A,B)=1N1i=1N(AiμA¯σA)(BiμBσB),

donde μA y σA son la media y la desviación estándar de A, respectivamente, y μB y σB son la desviación media y estándar de B. También puede definir el coeficiente de correlación en términos de la covarianza de A y B:

ρ(A,B)=cov(A,B)σAσB.

El coeficiente de correlación matriz de dos variables aleatorias es la matriz de coeficientes de correlación para cada combinación de variables Pairwise,

R=(ρ(A,A)ρ(A,B)ρ(B,A)ρ(B,B)).

desde A y B están siempre directamente correlacionados a sí mismos, las entradas diagonales son sólo 1, esto es,

R=(1ρ(A,B)ρ(B,A)1).

Referencias

[1] Fisher, R.A. Statistical Methods for Research Workers, 13th Ed., Hafner, 1958.

[2] Kendall, M.G. The Advanced Theory of Statistics, 4th Ed., Macmillan, 1979.

[3] Press, W.H., Teukolsky, S.A., Vetterling, W.T., and Flannery, B.P. Numerical Recipes in C, 2nd Ed., Cambridge University Press, 1992.

Capacidades ampliadas

Consulte también

| | |

Introducido antes de R2006a