Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Parcelas de caja

Los diagramas de caja proporcionan una visualización de las estadísticas de resumen para los datos de muestra y contienen las siguientes características:

  • Las tapas y los fondos de cada "caja" son los percentiles 25º y 75 de las muestras, respectivamente. Las distancias entre las tapas y los valles son los rangos intercuartil. Puede calcular el valor del intervalo intercuartil utilizando.iqr

  • La línea en el centro de cada caja es la mediana de la muestra. Si la mediana no está centrada en la caja, muestra asimetría de la muestra. Puede calcular el valor de la mediana utilizando la función.median

  • el bigotes son líneas que se extienden por encima y por debajo de cada caja. Los bigotes se dibujan desde los extremos de los rangos intercuartil hasta las observaciones más lejanas dentro de la longitud del bigote (el ).adjacent values

  • Las observaciones más allá de la longitud del bigote se marcan como valores atípicos. De forma predeterminada, un valor atípico es un valor que es más de 1,5 veces el intervalo intercuartil fuera de la parte superior o inferior del cuadro, pero este valor se puede ajustar con argumentos de entrada adicionales. Los valores atípicos se muestran con un signo + rojo.

  • Las muescas muestran la variabilidad de la mediana entre las muestras. El ancho de una muesca se calcula para que los trazados de caja cuyas muescas no se solapen (como arriba) tengan medianas diferentes en el nivel de significancia del 5%. El nivel de significancia se basa en una suposición de distribución normal, pero las comparaciones de medianas son razonablemente sólidas para otras distribuciones. La comparación de las medianas de la parcela de caja es como una prueba de hipótesis visual, análoga a la prueba utilizada para los medios.t

Dado que los diagramas de caja muestran menos detalles que los histogramas, son más útiles para las comparaciones en paralelo de dos distribuciones.

Comparar datos agrupados mediante parcelas de caja

Cargue los datos de muestra de iris de Fisher. Los datos contienen mediciones de longitud y anchura de los sépalos y pétalos de tres especies de flores de iris. Almacene los datos de longitud del pétalo para los Iris versicolor como, y los datos de longitud del pétalo para los Iris virginica como.s1s2

load fisheriris s1 = meas(51:100,3); s2 = meas(101:150,3);

Cree un diagrama de caja utilizando los datos de ejemplo. Incluir una muesca en la parcela y etiquetar cada caja con el nombre de las especies de iris que representa.

figure boxplot([s1 s2],'notch','on',...         'labels',{'versicolor','virginica'})

Las muescas de los dos trazados de caja no se superponen, lo que indica que la longitud mediana del pétalo de los Iris versicolor y virginica son significativamente diferentes en el nivel de significancia del 5%.

La línea mediana en la gráfica versicolor no parece estar centrada dentro del cuadro, lo que indica que la muestra está ligeramente sesgada. Además, los datos versicolor contienen un valor atípico, mientras que los datos virginicas no contienen valores atípicos.

Consulte también

| |

Temas relacionados