Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

boxplot

Descripción

ejemplo

boxplot(x) crea un diagrama de caja de los datos en.x Si es un vector, traza una caja.xboxplot Si es una matriz, traza una casilla para cada columna de.xboxplotx

En cada caja, la marca central indica la mediana, y los bordes inferior y superior de la caja indican los percentiles 25º y 75, respectivamente. Los bigotes se extienden hasta los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se trazan individualmente mediante el símbolo.'+'

ejemplo

boxplot(x,g) crea un diagrama de caja utilizando una o más variables de agrupación contenidas en. genera un cuadro independiente para cada conjunto de valores que comparten el mismo valor o valores.gboxplotxg

boxplot(ax,___) crea un diagrama de caja utilizando los ejes especificados por el objeto gráfico de ejes, utilizando cualquiera de las sintaxis anteriores.ax

ejemplo

boxplot(___,Name,Value) crea un diagrama de caja con opciones adicionales especificadas por uno o más argumentos de par.Name,Value Por ejemplo, puede especificar el estilo de cuadro o el orden.

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carsmall

Cree un diagrama de caja de las mediciones de millas por galón ().MPG Agregue un título y etiquete los ejes.

boxplot(MPG) xlabel('All Vehicles') ylabel('Miles per Gallon (MPG)') title('Miles per Gallon for All Vehicles')

La gráfica de caja muestra que la mediana de millas por galón para todos los vehículos en los datos de muestra es aproximadamente 24. El valor mínimo es aproximadamente 9, y el valor máximo es aproximadamente 44.

Cargue los datos de ejemplo.

load carsmall

Cree un diagrama de caja de las mediciones de millas por galón () a partir de los datos de la muestra, agrupados por el país de origen de los vehículos ().MPGOrigin Agregue un título y etiquete los ejes.

boxplot(MPG,Origin) title('Miles per Gallon by Vehicle Origin') xlabel('Country of Origin') ylabel('Miles per Gallon (MPG)')

Cada cuadro representa visualmente los datos de MPG para los coches del país especificado. La "caja" de Italia aparece como una sola línea porque los datos de muestra solo contienen una observación para este grupo.

Genere dos conjuntos de datos de ejemplo. El primer ejemplo, contiene números aleatorios generados a partir de una distribución normal con y.x1mu = 5sigma = 1 El segundo ejemplo, contiene números aleatorios generados a partir de una distribución normal con y.x2mu = 6sigma = 1

rng default  % For reproducibility x1 = normrnd(5,1,100,1); x2 = normrnd(6,1,100,1);

Crear trazados de cajas con muescas de y.x1x2 Etiquete cada cuadro con su valor correspondiente.mu

figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'}) title('Compare Random Data from Different Distributions')

La gráfica de caja muestra que la diferencia entre las medianas de los dos grupos es aproximadamente 1. Dado que las muescas en el diagrama de caja no se superponen, puede concluir, con un 95% de confianza, que las verdaderas medianas sí difieren.

La siguiente figura muestra el diagrama de caja para los mismos datos con la longitud máxima del bigote especificada como 1,0 veces el intervalo intercuartil. Los puntos de datos más allá de los bigotes se muestran utilizando.+

figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1) title('Compare Random Data from Different Distributions')

Con los bigotes más pequeños, muestra más puntos de datos como valores atípicos.boxplot

Cree una matriz 100-by-25 de números aleatorios generados a partir de una distribución normal estándar para utilizarlos como datos de muestra.

rng default  % For reproducibility x = randn(100,25);

Cree dos parcelas de caja para los datos en la misma figura.x Utilice el formato predeterminado para la gráfica superior y el formato compacto para el trazado inferior.

figure  subplot(2,1,1) boxplot(x)  subplot(2,1,2) boxplot(x,'PlotStyle','compact')

Cada gráfico presenta los mismos datos, pero el formato compacto puede mejorar la legibilidad de los trazados con muchos cuadros.

Cree trazados de cuadro para vectores de datos de longitud variable utilizando una variable de agrupación.

Genere aleatoriamente tres vectores de columna de longitud variable: uno de longitud, uno de longitud y otro de longitud.51015 Combine los datos en un vector de longitud de una sola columna.30

rng('default')  % For reproducibility x1 = rand(5,1); x2 = rand(10,1); x3 = rand(15,1); x = [x1; x2; x3];

Cree una variable de agrupación que asigne el mismo valor a las filas que corresponden al mismo vector.x Por ejemplo, las primeras cinco filas tienen el mismo valor, porque las primeras cinco filas de todas proceden del mismo vector,.gFirstxx1

g1 = repmat({'First'},5,1); g2 = repmat({'Second'},10,1); g3 = repmat({'Third'},15,1); g = [g1; g2; g3];

Cree los trazados de caja.

boxplot(x,g)

Argumentos de entrada

contraer todo

Datos de entrada, especificados como un vector numérico o una matriz numérica. Si es un vector, traza una caja.xboxplot Si es una matriz, traza una casilla para cada columna de.xboxplotx

En cada caja, la marca central indica la mediana, y los bordes inferior y superior de la caja indican los percentiles 25º y 75, respectivamente. Los bigotes se extienden hasta los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se trazan individualmente mediante el símbolo.'+'

Tipos de datos: single | double

Agrupar variables, especificadas como un vector numérico, una matriz de caracteres, una matriz de cadenas, una matriz de celdas o una matriz categórica. Puede especificar varias variables de agrupación mediante el uso de una matriz de celdas de estos tipos de variables o una matriz.g Si especifica varias variables de agrupación, todas deben tener la misma longitud.

Si es un vector, las variables de agrupamiento deben contener una fila para cada elemento de.xx Si es una matriz, las variables de agrupamiento deben contener una fila para cada columna de.xx Se omiten los grupos que contienen un valor faltante (), un vector de caracteres vacío, un vacío o una cadena, o un valor en una variable de agrupación, y no se cuentan en el número de grupos considerados por otros parámetros.NaN<missing><undefined>

De forma predeterminada, ordena las variables de agrupación de caracteres y cadenas en el orden en que aparecen inicialmente en los datos, las variables de agrupación categóricas según el orden de sus niveles y las variables de agrupación numéricas en orden numérico.boxplot Para controlar el orden de los grupos, realice una de las siguientes acciones:

  • Utilice variables categóricas y especifique el orden de sus niveles.g

  • Use el argumento de par nombre-valor.'GroupOrder'

  • Ordene previamente sus datos.

Tipos de datos: single | double | char | string | cell | categorical

Ejes en los que trazar, especificados como un objeto gráfico de ejes. Si no se especifica, se crea el trazado utilizando el eje actual.axboxplot Para obtener más información sobre cómo crear un objeto gráfico de ejes, vea y.axesAxes Properties

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: crea un trazado de cuadro con muescas y etiqueta los dos cuadros y, de izquierda a derecha'Notch','on','Labels',{'mu = 5','mu = 6'}mu = 5mu = 6

Apariencia de caja

contraer todo

Estilo de cuadro, especificado como el par separado por comas que consta de y uno de los siguientes.'BoxStyle'

NombreValor
'outline'Trazar cuadros utilizando una caja sin relleno con bigotes discontinuas. Este es el valor predeterminado si es.'PlotStyle''traditional'
'filled'Cuadros de parcela con una caja de relleno estrecho con líneas para bigotes. Este es el valor predeterminado si es.'PlotStyle''compact'

Ejemplo: 'BoxStyle','filled'

Colores de cuadro, especificados como el par separado por comas que consta de un triplete RGB, un vector de caracteres o un escalar de cadena.'Colors' Un triplete RGB es un vector de fila de tres elementos, cuyo elemento especifica las intensidades de los componentes rojo, verde y azul del color, respectivamente. Cada intensidad debe estar en el intervalo [0,1].

La tabla siguiente enumera los caracteres de color disponibles y sus valores de triplete RGB equivalentes.

Nombre largoNombre cortoTriplete RGB
Amarillo'y'[1 1 0]
Magenta'm'[1 0 1]
Cian'c'[0 1 1]
Rojo'r'[1 0 0]
Verde'g'[0 1 0]
Azul'b'[0 0 1]
Blanco'w'[1 1 1]
Negro'k'[0 0 0]

Puede especificar varios colores, ya sea como vector de caracteres o escalar de cadena de nombres de color (por ejemplo,) o una matriz de tres columnas de valores RGB.'rgbm' La secuencia se replica o trunca según sea necesario, por lo que, por ejemplo, proporciona cuadros que alternan rojo y azul.'rb'

Si no especifica el par nombre-valor, utiliza el mismo esquema de color para todos los cuadros.'ColorGroup'boxplot Si se especifica, el valor predeterminado es una modificación.'ColorGroup'hsvcolormap

Ejemplo: 'Colors','rgbm'

Estilo mediano, especificado como el par separado por comas que consta de y uno de los siguientes.'MedianStyle'

NombreValor
'line'Dibuje una línea para representar la mediana en cada caja. Este es el valor predeterminado cuando es.'PlotStyle''traditional'
'target'Dibuja un punto negro dentro de un círculo blanco para representar la mediana en cada caja. Este es el valor predeterminado cuando es.'PlotStyle''compact'

Ejemplo: 'MedianStyle','target'

Marcador para los intervalos de comparación, especificado como el par separado por comas que consta de y uno de los siguientes.'Notch'

NombreValor
'off'Omita los intervalos de comparación de la visualización del cuadro.
'on'Si es así, dibuje los intervalos de comparación utilizando muescas.'PlotStyle''traditional' Si es así, dibuje los intervalos de comparación utilizando marcadores triangulares.'PlotStyle''compact'
'marker'Dibuje intervalos de comparación utilizando marcadores triangulares.

Dos medianas son significativamente diferentes en el nivel de significancia del 5% si sus intervalos no se superponen. representa los puntos finales de intervalo utilizando los extremos de las muescas o los centros de los marcadores triangulares.boxplot Los extremos de muesca corresponden a q2 – 1.57(q3q1)/sqrt(n) Y q2 + 1.57(q3q1)/sqrt(n)Dónde q2 es la mediana (percentil 50), q1 Y q3 son los percentiles 25 y 75, respectivamente, y es el número de observaciones sin ningún valor.nNaN Si el tamaño de la muestra es pequeño, las muescas podrían extenderse más allá del final de la caja.

Ejemplo: 'Notch','on'

Tamaño del marcador para los valores atípicos, especificado como el par separado por comas que consta de un valor numérico positivo y el mismo.'OutlierSize' El valor especificado representa el tamaño del marcador en puntos.

Si es así, entonces el valor predeterminado es 6.'PlotStyle''traditional'OutlierSize Si es, entonces el valor predeterminado es 4.'PlotStyle''compact'OutlierSize

Ejemplo: 'OutlierSize',8

Tipos de datos: single | double

Estilo de trazado, especificado como el par separado por comas y que consta de uno de los siguientes.'PlotStyle'

NombreValor
'traditional'Trazar cuadros utilizando un estilo de caja tradicional.
'compact'Trace cuadros con un estilo de caja más pequeño diseñado para parcelas con muchos grupos. Este estilo cambia los valores predeterminados para algunos otros parámetros.

Ejemplo: 'PlotStyle','compact'

Símbolo y color para valores atípicos, especificados como el par separado por comas que consta de una especificación de línea.'Symbol' Consulte el parámetro en las especificaciones de línea disponibles.LineSpecplot

Si es así, entonces el valor predeterminado es, que traza cada valor atípico usando un símbolo rojo.'PlotStyle''traditional''r+''+'

Si es así, entonces el valor predeterminado es, que traza cada valor atípico usando un símbolo en el mismo color que el cuadro correspondiente.'PlotStyle''compact''o''o'

Si omite el símbolo, los valores atípicos aparecerán invisibles. Si omite el color, los valores atípicos aparecerán en el mismo color que el cuadro.

Ejemplo: 'kx'

Ancho de cuadro, especificado como el par separado por comas que consta de un vector escalar o numérico numérico.'Widths' Si el número de casillas no es igual al número de valores de ancho especificados, la lista de valores se replica o trunca según sea necesario.

Este argumento de par nombre-valor no altera el espaciado entre los cuadros. Por lo tanto, si especifica un valor grande para, los cuadros pueden superponerse.'Widths'

El ancho predeterminado del cuadro es igual a la mitad de la separación mínima entre los cuadros, que es 0,5 cuando el argumento del par nombre-valor toma su valor predeterminado.'Positions'

Ejemplo: 'Widths',0.3

Tipos de datos: single | double

Apariencia de grupo

contraer todo

Variable de agrupación para el cambio de color de cuadro, especificado como el par separado por comas que consta de una variable de agrupación.'ColorGroup' La variable de agrupación es un vector numérico, una matriz de caracteres, una matriz de cadenas, una matriz de celdas o una matriz categórica. El color del cuadro cambia cuando cambia la variable de agrupación especificada. El valor predeterminado indica que el color del cuadro no cambia en función del grupo.[]

Tipos de datos: single | double | char | string | cell | categorical

Orden de los factores en el trazado, especificado como el par separado por comas que consta de y uno de los siguientes.'FactorDirection'

NombreValor
'data'Los factores aparecen con el primer valor junto al origen del trazado.
'list'Los factores aparecen de izquierda a derecha si están en el eje x o de arriba a abajo si están en el eje y.
'auto'Si las variables de agrupamiento son numéricas, utiliza.boxplot'data' Si las variables de agrupación son matrices de caracteres, matrices de cadenas, matrices de celdas o matrices categóricas, a continuación, utiliza.boxplot'list'

Trace todos los factores de grupo, especificados como el par separado por comas que consta de y cualquiera o.'FullFactors''off''on' Si, a continuación, traza un cuadro para cada fila única de variables de agrupación.'off'boxplot Si, a continuación, traza un cuadro para cada combinación posible de valores de variable de agrupación, incluidas las combinaciones que no aparecen en los datos.'on'boxplot

Ejemplo: 'FullFactors','on'

Distancia entre diferentes factores de agrupamiento, especificados como el par separado por comas que consta de un valor numérico positivo, un vector de valores numéricos positivos o.'FactorGap''auto' Si especifica un vector, la longitud del vector debe ser menor o igual que el número de variables de agrupamiento.

representa la distancia de la brecha entre los diferentes factores de una variable de agrupamiento, expresado como un porcentaje de la anchura de la gráfica.'FactorGap' Por ejemplo, si se especifica, la brecha es el tres por ciento del ancho de la gráfica entre los grupos con valores diferentes de la primera variable de agrupación y un porcentaje entre los grupos con el mismo valor de la primera variable de agrupación, pero con valores diferentes para el segundo.[3,1]

Si se especifica, se selecciona automáticamente una distancia de separación.'auto'boxplot El valor indica que no hay cambios en el tamaño del hueco entre diferentes factores.[]

Si es, entonces el valor predeterminado es.'PlotStyle''traditional'FactorGap[] Si es así, entonces el valor predeterminado es.'PlotStyle''compact''auto'

Ejemplo: 'FactorGap',[3,1]

Tipos de datos: single | double | char | string

Separación entre los factores de agrupamiento, especificado como el par separado por comas consistente en un entero positivo o un vector de enteros positivos, o.'FactorSeparator''auto' Si especifica un vector, la longitud del vector debe ser menor o igual que el número de variables de agrupamiento. Los valores enteros deben estar en el intervalo [1,], donde es el número de variables de agrupamiento.GG

Especifica qué factores deben tener sus valores separados por una línea de rejilla.'FactorSeparator' Por ejemplo, agrega una línea separadora cuando la primera o segunda variable de agrupamiento cambia de valor.[1,2]

Si es, entonces el valor predeterminado es.'PlotStyle''traditional'FactorSeparator[] Si es así, entonces el valor predeterminado es.'PlotStyle''compact''auto'

Ejemplo: 'FactorSeparator',[1,2]

Tipos de datos: single | double | char | string

Trazar el orden de los grupos, especificado como el par separado por comas que consta de una matriz de cadenas o matriz de celdas que contiene los nombres de las variables de agrupación.'GroupOrder' Si tiene varias variables de agrupación, separe los valores con una coma. También puede utilizar matrices categóricas como variables de agrupación para controlar el orden de los cuadros. El valor predeterminado no reordena los cuadros.[]

Tipos de datos: string | cell

Límites de datos y distancias máximas

contraer todo

Límites de datos extremos, especificados como el par separado por comas que consta de un vector numérico de dos elementos que contiene los límites inferior y superior, respectivamente.'DataLim' Los valores especificados para se utilizan para determinar qué puntos de datos son extremos.'DataLim''ExtremeMode'

Tipos de datos: single | double

Método de manipulación de datos extremos, especificado como el par separado por comas que consta de uno de los siguientes.'ExtremeMode'

NombreValor
'clip'Si los valores de datos están fuera de los límites especificados por, a continuación, muestra estos valores en el trazado.'DataLim'boxplotDataLim
'compress'Si los valores de datos caen fuera de los límites especificados por, a continuación, muestra estos valores distribuidos uniformemente en una región justo fuera, conservando el orden relativo de los puntos.'DataLim'boxplotDataLim

Si los puntos de datos se encuentran fuera del límite especificado por, el límite se marca con una línea de puntos.'DataLim' Si se comprimen los puntos de datos, dos líneas grises marcan la región de compresión. Los valores se pueden recortar o comprimir, pero los valores no aparecen en el trazado.–InfInfNaN Las muescas de las cajas se dibujan a escala y pueden extenderse más allá de los límites si la mediana está dentro del límite. Las muescas de caja no se dibujan si la mediana está fuera de los límites.

Ejemplo: 'ExtremeMode','compress'

Distancia máxima de desplazamiento atípico, especificada como el par separado por comas que consta de un valor numérico. es la distancia máxima para desplazar los valores atípicos a lo largo del eje del factor por una cantidad aleatoria uniforme, con el fin de hacer visibles los puntos duplicados.'Jitter'Jitter Si especifica igual a 1, las regiones de fluctuación solo se tocan entre los grupos adyacentes más cercanos.'Jitter'

Si es, entonces el valor predeterminado es 0.'PlotStyle''traditional'Jitter Si es así, el valor predeterminado es 0,5.'PlotStyle''compact'

Ejemplo: 'Jitter',1

Tipos de datos: single | double

Longitud máxima de bigotes, especificada como el par separado por comas que consta de un valor numérico positivo.'Whisker'

dibuja puntos como valores atípicos si son mayores queboxplot q3 + w × (q3q1) o menos de q1w × (q3q1), donde está la longitud máxima del bigote, ywq1 Yq3 son los percentiles 25 y 75 de los datos de muestra, respectivamente.

El valor predeterminado corresponde a aproximadamente'Whisker' +/–2.7σ y 99,3 por ciento de cobertura si los datos se distribuyen normalmente. El bigote trazado se extiende a la, que es el valor de datos más extrema que no es un outlier.adjacent value

Especifique como 0 para no dar bigotes y para hacer que cada punto fuera de'Whisker'q1 Yq3 un outlier.

Ejemplo: 'Whisker',0

Tipos de datos: single | double

Apariencia de trazado

contraer todo

Etiquetas de cuadro, especificadas como el par separado por comas que consta de una matriz de caracteres, una matriz de cadenas, una matriz de celdas o un vector numérico que contiene los nombres de etiqueta de cuadro.'Labels' Especifique una etiqueta por valor o una etiqueta por grupo.x Para especificar varias variables de etiqueta, utilice una matriz numérica o una matriz de celdas que contenga cualquiera de los tipos de datos aceptados.

Para eliminar etiquetas de un trazado, utilice el siguiente comando:.set(gca,'XTickLabel',{' '})

Tipos de datos: char | string | cell | single | double

Orientación de etiqueta, especificada como el par separado por comas que consta de y uno de los siguientes.'LabelOrientation'

NombreValor
'inline'Gire las etiquetas de las cajas para que sean verticales. Este es el valor predeterminado cuando es.'PlotStyle''compact'
'horizontal'Deje las etiquetas de caja horizontales. Este es el valor predeterminado cuando es.'PlotStyle''traditional'

Si las etiquetas están en el eje, ambas configuraciones dejan las etiquetas horizontales.y

Ejemplo: 'LabelOrientation','inline'

Etiquetas que se mostrarán en el trazado, especificadas como el par separado por comas que consta de LabelVerbosity y uno de los siguientes.

NombreValor
'all'Mostrar una etiqueta para cada factor. Este es el valor predeterminado cuando es.'PlotStyle''traditional'
'minor'Mostrar una etiqueta para un factor sólo cuando ese factor tiene un valor diferente del grupo anterior.
'majorminor'Mostrar una etiqueta para un factor cuando ese factor o cualquier factor mayor tenga un valor diferente del grupo anterior. Este es el valor predeterminado cuando es.'PlotStyle''compact'

Ejemplo: 'LabelVerbosity','minor'

Orientación de trazado, especificada como el par separado por comas que consta de Orientation y uno de los siguientes.

NombreValor
'vertical'Trazar en el eje.xy
'horizontal'Trazar en el eje.xx

Ejemplo: 'horizontal'

Posiciones de cuadro, especificadas como el par separado por comas que consta de un vector numérico que contiene una entrada para cada grupo o valor.'Positions'x El valor predeterminado es 1:, donde es el número de grupos.NumGroupsNumGroups

Tipos de datos: single | double

Sugerencias

  • crea una representación visual de los datos, pero no devuelve valores numéricos.boxplot Para calcular las estadísticas de Resumen relevantes para los datos de muestra, utilice las funciones siguientes:

    • : Permite buscar el valor mínimo en los datos de ejemplo.min

    • : Permite buscar el valor máximo en los datos de ejemplo.max

    • : Permite buscar el valor mediano en los datos de ejemplo.median

    • : Permite buscar los valores de cuantil en los datos de ejemplo.quantile

    • — Calcular las estadísticas de resumen para los datos de muestra, organizados por grupo.grpstats

  • Puede ver los valores de los datos y los nombres de grupo utilizando la ventana de la figura.cursor de datos (MATLAB) El cursor muestra los valores originales de los puntos afectados por el parámetro.datalim Puede etiquetar el grupo al que pertenece un valor atípico utilizando la función.gname

  • Para modificar las propiedades de gráficos de un componente de trazado de caja, utilice con la propiedad para buscar el manejador del componente. valores para los componentes de trazado de cuadro dependen de la configuración de parámetros y se enumeran en la tabla siguiente.findobjTagTag

    Configuración de parámetrosValores de etiqueta
    Todos los ajustes
    • 'Box'

    • 'Outliers'

    ¿Cuándo es'PlotStyle''traditional'
    • 'Median'

    • 'Upper Whisker'

    • 'Lower Whisker'

    • 'Upper Adjacent Value'

    • 'Lower Adjacent Value'

    ¿Cuándo es'PlotStyle''compact'
    • 'Whisker'

    • 'MedianOuter'

    • 'MedianInner'

    ¿Cuándo es'Notch''marker'
    • 'NotchLo'

    • 'NotchHi'

Referencias

[1] McGill, R., J. W. Tukey, and W. A. Larsen. “Variations of Boxplots.” The American Statistician. Vol. 32, No. 1, 1978, pp. 12–16.

[2] Velleman, P.F., and D.C. Hoaglin. Applications, Basics, and Computing of Exploratory Data Analysis. Pacific Grove, CA: Duxbury Press, 1981.

[3] Nelson, L. S. “Evaluating Overlapping Confidence Intervals.” Journal of Quality Technology. Vol. 21, 1989, pp. 140–141.

[4] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

Introducido antes de R2006a