Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Análisis de covarianza

Introducción al análisis de la covarianza

El análisis de la covarianza es una técnica para analizar los datos agrupados que tienen una respuesta (, la variable que se predice) y un predictor (, la variable utilizada para hacer la predicción).yx Utilizando el análisis de covarianza, puede modelar como una función lineal de, con los coeficientes de la línea posiblemente variando de un grupo a un grupo.yx

Análisis de la herramienta de covarianza

La función abre un entorno gráfico interactivo para el ajuste y predicción con el análisis de los modelos de covarianza (ANOCOVA).aoctool Se adapta a los siguientes modelos para el grupo TH:i

La misma media

y = α + ε

Los medios separados

y = (α + αi) + ε

La misma línea

y = α + βx + ε

Las líneas paralelas

y = (α + αi) + βx + ε

Separe las líneas

y = (α + αi) + (β + βi) x + ε

Por ejemplo, en el modelo de líneas paralelas, la intercepción varía de un grupo a otro, pero la pendiente es la misma para cada grupo. En el mismo modelo medio, hay una intercepción común y ninguna pendiente. Con el fin de que los coeficientes del grupo estén bien determinados, la herramienta impone las restricciones

αj=βj=0

Los siguientes pasos describen el uso de.aoctool

  1. El conjunto de datos contiene información sobre automóviles de los años 1970, 1976 y 1982.Load the data.Statistics and Machine Learning Toolbox™carsmall.mat Este ejemplo estudia la relación entre el peso de un automóvil y su kilometraje, y si esta relación ha cambiado a lo largo de los años. Para iniciar la demostración, cargue el conjunto de datos.

    load carsmall

    El navegador de espacio de trabajo muestra las variables del conjunto de datos.

    También puede utilizarlo con sus propios datos.aoctool

  2. Las siguientes llamadas de comando se ajustan a una línea independiente a los vectores de columna y para cada uno de los tres grupos de modelos definidos en.Start the tool.aoctoolWeightMPGModel_Year El ajuste inicial modela la variable, como una función lineal de la variable.yMPGxWeight

    [h,atab,ctab,stats] = aoctool(Weight,MPG,Model_Year); 

    Consulte la página de referencia de la función para obtener información detallada sobre la llamada.aoctoolaoctool

  3. La salida gráfica consta de una ventana principal con una gráfica, una tabla de estimaciones de coeficiente y una tabla de análisis de varianza.Examine the output. En la gráfica, cada grupo tiene una línea separada.Model_Year Los puntos de datos de cada grupo se codifican con el mismo color y símbolo, y el ajuste para cada grupo tiene el mismo color que los puntos de datos.

    Los coeficientes de las tres líneas aparecen en la figura titulada coeficientes ANOCOVA. Se puede ver que las laderas son aproximadamente – 0,0078, con una pequeña desviación para cada grupo:

    • Año modelo 1970:y = (45.9798 – 8.5805) + (–0.0078 + 0.002)x + ε

    • Año modelo 1976:y = (45.9798 – 3.8902) + (–0.0078 + 0.0011)x + ε

    • Año modelo 1982:y = (45.9798 + 12.4707) + (–0.0078 – 0.0031)x + ε

    Debido a que las tres líneas ajustadas tienen pendientes que son más o menos similares, usted puede preguntarse si realmente son los mismos. La interacción expresa la diferencia en las pendientes, y la tabla ANOVA muestra una prueba para la importancia de este término.Model_Year*Weight Con una estadística de 5,23 y un valor de 0,0072, las pendientes son significativamente diferentes.Fp

  4. Para examinar los ajustes cuando las pendientes están restringidas para que sean iguales, regrese a la ventana trazado de predicción ANOCOVA y utilice el menú emergente para seleccionar unConstrain the slopes to be the same.Model Parallel Lines Modelo. La ventana se actualiza para mostrar el siguiente gráfico.

    Aunque este ajuste parece razonable, es significativamente peor que el Separate Lines Modelo. Vuelva a usar el menú emergente para volver al modelo original.Model

Límites de confianza

El ejemplo en proporciona estimaciones de la relación entre y para cada uno, pero ¿cuán precisas son estas estimaciones?Análisis de la herramienta de covarianzaMPGWeightModel_Year Para averiguarlo, puedes superponer límites de confianza en los ajustes examinándolos un grupo a la vez.

  1. En el menú situado en la parte inferior derecha de la figura, cambie la configuración deModel_Year All Groups a 82. Los datos y los ajustes para los otros grupos se atenúan y aparecen límites de confianza alrededor del ajuste 82.

    Las líneas discontinuas forman un sobre alrededor de la línea ajustada para el año del modelo 82. Bajo la suposición de que la relación verdadera es lineal, estos límites proporcionan una región de confianza del 95% para la línea verdadera. Tenga en cuenta que los ajustes para los años del otro modelo están bien fuera de estos límites de confianza para los valores entre y.Weight20003000

  2. A veces es más valioso poder predecir el valor de respuesta para una nueva observación, no sólo estimar el valor medio de respuesta. Utilice el menú de funciones para cambiar la definición de los límites de confianza deaoctoolBounds Line Para Observation. Los intervalos más amplios resultantes reflejan la incertidumbre en las estimaciones de parámetros, así como la aleatoriedad de una nueva observación.

    Al igual que la función, la función tiene pelos cruzados que puede utilizar para manipular y ver los límites de estimación y confianza a lo largo de la actualización del eje.polytoolaoctoolWeighty Estos valores aparecen solo cuando se selecciona un solo grupo, no cuando All Groups está seleccionada.

Comparaciones múltiples

Puede realizar una prueba de comparación múltiple utilizando la estructura de salida como entrada para la función.statsaoctoolmultcompare La función puede probar cualquier pendiente, intercepta o medio marginal de población (el MPG pronosticado del peso medio para cada grupo).multcompare El ejemplo en muestra que las pendientes no son todas iguales, pero ¿podría ser que dos son los mismos y sólo el otro es diferente?Análisis de la herramienta de covarianza Puedes probar esa hipótesis.

multcompare(stats,0.05,'on','','s')  ans =     1.0000    2.0000   -0.0012    0.0008    0.0029     1.0000    3.0000    0.0013    0.0051    0.0088     2.0000    3.0000    0.0005    0.0042    0.0079 

Esta matriz muestra que la diferencia estimada entre las Interceptas de los grupos 1 y 2 (1970 y 1976) es 0,0008, y un intervalo de confianza para la diferencia es [– 0,0012, 0,0029]. No hay diferencia significativa entre los dos. Hay diferencias significativas, sin embargo, entre la intercepción para 1982 y cada una de las otras dos. El gráfico muestra la misma información.

Tenga en cuenta que la estructura se creó en la llamada inicial a la función, por lo que se basa en el ajuste del modelo inicial (normalmente un modelo de líneas separadas).statsaoctool Si cambia el modelo de forma interactiva y desea basar sus comparaciones múltiples en el nuevo modelo, debe volver a ejecutarse para obtener otra estructura, esta vez especificando su nuevo modelo como modelo inicial.aoctoolstats