Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

boxplot

Visualizar estadísticas descriptivas con una gráfica de caja

Descripción

ejemplo

boxplot(x) crea una gráfica de caja de los datos en x. Si x es un vector, boxplot representa una caja. Si x es una matriz, boxplot representa una caja para cada columna de x.

En cada caja, la marca central indica la mediana, y los extremos inferior y superior de la caja indican los percentiles 25 y 75, respectivamente. Los bigotes se extienden hasta los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se representan individualmente mediante el símbolo del marcador '+'.

ejemplo

boxplot(x,g) crea una gráfica de caja mediante una o más variables de agrupación incluidas en g. boxplot produce una caja separada para cada conjunto de valores x que comparten el mismo valor o valores g.

boxplot(ax,___) crea una gráfica de caja mediante los ejes especificados por el objeto gráfico de ejes ax, con cualquiera de las sintaxis anteriores.

ejemplo

boxplot(___,Name,Value) crea una gráfica de caja con más opciones especificadas por uno o más argumentos de par Name,Value. Por ejemplo, puede especificar el estilo o el orden de las cajas.

Ejemplos

contraer todo

Cargue los datos de muestra.

load carsmall

Cree una gráfica de caja de las medidas de millas por galón (MPG). Añada un título y etiquete los ejes.

boxplot(MPG)
xlabel('All Vehicles')
ylabel('Miles per Gallon (MPG)')
title('Miles per Gallon for All Vehicles')

Figure contains an axes object. The axes object with title Miles per Gallon for All Vehicles, xlabel All Vehicles, ylabel Miles per Gallon (MPG) contains 7 objects of type line. One or more of the lines displays its values using only markers

La gráfica de caja muestra que la mediana de millas por galón de todos los vehículos en los datos de muestra es de aproximadamente 24. El valor mínimo es de unas 9 y el valor máximo es de unas 44.

Cargue los datos de muestra.

load carsmall

Cree una gráfica de caja con las medidas de millas por galón (MPG) de los datos de muestra, agrupados por el país de origen de los vehículos (Origin). Añada un título y etiquete los ejes.

boxplot(MPG,Origin)
title('Miles per Gallon by Vehicle Origin')
xlabel('Country of Origin')
ylabel('Miles per Gallon (MPG)')

Figure contains an axes object. The axes object with title Miles per Gallon by Vehicle Origin, xlabel Country of Origin, ylabel Miles per Gallon (MPG) contains 42 objects of type line. One or more of the lines displays its values using only markers

Cada caja representa visualmente los datos de MPG de los coches del país especificado. La "caja" de Italia aparece como una sola línea porque los datos de muestra solo contienen una observación en este grupo.

Genere dos conjuntos de datos de muestra. La primera muestra, x1, contiene números aleatorios generados a partir de una distribución normal con mu = 5 y sigma = 1. La segunda muestra, x2, contiene números aleatorios generados a partir de una distribución normal con mu = 6 y sigma = 1.

rng default  % For reproducibility
x1 = normrnd(5,1,100,1);
x2 = normrnd(6,1,100,1);

Cree gráficas de caja con muescas de x1 y x2. Etiquete cada caja con su valor mu correspondiente.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'})
title('Compare Random Data from Different Distributions')

Figure contains an axes object. The axes object with title Compare Random Data from Different Distributions contains 14 objects of type line. One or more of the lines displays its values using only markers

La gráfica de caja muestra que la diferencia entre la mediana de los dos grupos es de aproximadamente 1. Dado que las muescas de la gráfica de caja no se solapan, se puede concluir, con un 95% de confianza, que las verdaderas medianas son diferentes.

La siguiente figura muestra la gráfica de caja de los mismos datos con la longitud máxima de los bigotes especificada como 1,0 veces el rango intercuartil. Los puntos de datos que están más allá de los bigotes se muestran con +.

figure
boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1)
title('Compare Random Data from Different Distributions')

Figure contains an axes object. The axes object with title Compare Random Data from Different Distributions contains 14 objects of type line. One or more of the lines displays its values using only markers

Con los bigotes más pequeños, boxplot muestra más puntos de datos como valores atípicos.

Cree una matriz de 100 por 25 de números aleatorios generados a partir de una distribución normal estándar para utilizarlos como datos de muestra.

rng default  % For reproducibility
x = randn(100,25);

Cree dos gráficas de caja para los datos de x en la misma figura. Utilice el formato predeterminado para la gráfica superior y el formato compacto para la gráfica inferior.

figure

subplot(2,1,1)
boxplot(x)

subplot(2,1,2)
boxplot(x,'PlotStyle','compact')

Figure contains 2 axes objects. Axes object 1 contains 175 objects of type line. Axes object 2 contains 150 objects of type line, text.

Cada gráfica presenta los mismos datos, pero el formato compacto puede mejorar la legibilidad de las gráficas con muchas cajas.

Cree gráficas de caja para vectores de datos de longitud variable con una variable de agrupación.

Genere tres vectores columna de longitud variable aleatoriamente: uno de longitud 5, otro de longitud 10 y otro de longitud 15. Combine los datos en un único vector columna de longitud 30.

rng('default')  % For reproducibility
x1 = rand(5,1);
x2 = rand(10,1);
x3 = rand(15,1);
x = [x1; x2; x3];

Cree una variable de agrupación que asigne el mismo valor a las filas que corresponden al mismo vector de x. Por ejemplo, las cinco primeras filas de g tienen el mismo valor, First, porque las cinco primeras filas de x provienen todas del mismo vector, x1.

g1 = repmat({'First'},5,1);
g2 = repmat({'Second'},10,1);
g3 = repmat({'Third'},15,1);
g = [g1; g2; g3];

Cree las gráficas de caja.

boxplot(x,g)

Figure contains an axes object. The axes object contains 21 objects of type line. One or more of the lines displays its values using only markers

Argumentos de entrada

contraer todo

Datos de entrada, especificados como vector numérico o matriz numérica. Si x es un vector, boxplot representa una caja. Si x es una matriz, boxplot representa una caja para cada columna de x.

En cada caja, la marca central indica la mediana, y los extremos inferior y superior de la caja indican los percentiles 25 y 75, respectivamente. Los bigotes se extienden hasta los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se representan individualmente mediante el símbolo del marcador '+'.

Tipos de datos: single | double

Variables de agrupación, especificadas como vector numérico, arreglo de caracteres, arreglo de cadenas, arreglo de celdas o arreglo categórico. Puede especificar múltiples variables de agrupación en g usando un arreglo de celdas de estos tipos de variables o una matriz. Si especifica múltiples variables de agrupación, deben tener todas la misma longitud.

Si x es un vector, las variables de agrupación deben contener una fila por cada elemento de x. Si x es una matriz, las variables de agrupación deben contener una fila por cada columna de x. Los grupos que contienen un valor ausente (NaN), un vector de caracteres vacío, una cadena vacía o <missing>, o un valor <undefined> en una variable de agrupación se omiten y no se cuentan en el número de grupos considerados por otros parámetros.

De forma predeterminada, boxplot ordena las variables de agrupación de caracteres y cadenas en el orden en que aparecen inicialmente en los datos, las variables de agrupación categórica por el orden de sus niveles y las variables de agrupación numérica en orden numérico. Para controlar el orden de los grupos, realice una de las siguientes acciones:

  • Utilice variables categóricas en g y especifique el orden de sus niveles.

  • Utilice el argumento de par nombre-valor 'GroupOrder'.

  • Ordene previamente los datos.

Tipos de datos: single | double | char | string | cell | categorical

Ejes en los que representar, especificados como objeto gráfico de ejes. Si no especifica ax, boxplot crea la gráfica utilizando el eje actual. Para obtener más información sobre la creación de un objeto gráfico de ejes, consulte axes y Axes Properties.

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Notch','on','Labels',{'mu = 5','mu = 6'} crea una gráfica de caja con muescas y etiqueta las dos cajas mu = 5 y mu = 6, de izquierda a derecha

Apariencia de la caja

contraer todo

El estilo de la caja, especificado como uno de los siguientes.

NombreValor
'outline'Representa las cajas con una caja sin llenar con bigotes discontinuos. Esta es la opción predeterminada si 'PlotStyle' es 'traditional'.
'filled'Representa las cajas con una caja estrecha rellena con líneas para los bigotes. Esta es la opción predeterminada si 'PlotStyle' es 'compact'.

Ejemplo: 'BoxStyle','filled'

Los colores de la caja, especificados como triplete RGB, vector de caracteres o escalar de cadena. Un triplete RGB es un vector fila de tres elementos, cuyos elementos especifican las intensidades de los componentes rojo, verde y azul del color, respectivamente. Las intensidades deben estar en el rango [0,1].

En la siguiente tabla se enumeran los caracteres de color disponibles y sus valores de triplete RGB equivalentes.

Nombre largoNombre cortoTriplete RGB
Amarillo'y'[1 1 0]
Magenta'm'[1 0 1]
Cian'c'[0 1 1]
Rojo'r'[1 0 0]
Verde'g'[0 1 0]
Azul'b'[0 0 1]
Blanco'w'[1 1 1]
Negro'k'[0 0 0]

Puede especificar varios colores como un vector de caracteres o un escalar de cadena de nombres de colores (por ejemplo, 'rgbm'), o una matriz de tres columnas de valores RGB. La secuencia se replica o se trunca según sea necesario, de modo que, por ejemplo, 'rb' da cajas que alternan el rojo y el azul.

Si no se especifica el par nombre-valor 'ColorGroup', boxplot utiliza el mismo esquema de color para todas las cajas. Si se especifica 'ColorGroup', el valor predeterminado es un hsv colormap modificado.

Ejemplo: 'Colors','rgbm'

El estilo de la mediana, especificado como uno de los siguientes.

NombreValor
'line'Dibuja una línea para representar la mediana en cada caja. Esta es la opción predeterminada cuando 'PlotStyle' es 'traditional'.
'target'Dibuja un punto negro dentro de un círculo blanco para representar la mediana en cada caja. Esta es la opción predeterminada cuando 'PlotStyle' es 'compact'.

Ejemplo: 'MedianStyle','target'

El marcador de los intervalos de comparación, especificado como uno de los siguientes.

NombreValor
'off'Omite los intervalos de comparación de la visualización de la caja.
'on'Si 'PlotStyle' es 'traditional', dibuja los intervalos de comparación mediante muescas. Si 'PlotStyle' es 'compact', dibuja los intervalos de comparación mediante marcadores triangulares.
'marker'Dibuja los intervalos de comparación mediante marcadores triangulares.

Dos medianas son significativamente diferentes al nivel de significación del 5% si sus intervalos no se solapan. boxplot representa los puntos finales del intervalo utilizando los extremos de las muescas o los centros de los marcadores triangulares. Los extremos de las muescas corresponden a q2 – 1.57(q3q1)/sqrt(n) y q2 + 1.57(q3q1)/sqrt(n), donde q2 es la mediana (percentil 50), q1 y q3 son los percentiles 25 y 75, respectivamente, y n es el número de observaciones sin ningún valor NaN. Si el tamaño de la muestra es pequeño, las muescas pueden sobrepasar el extremo de la caja.

Para ver un ejemplo etiquetado de gráficas de caja con muescas, consulte Gráfica de caja.

Ejemplo: 'Notch','on'

El tamaño del marcador de los valores atípicos, especificado como valor numérico positivo. El valor especificado representa el tamaño del marcador en puntos.

Si 'PlotStyle' es 'traditional', el valor predeterminado de OutlierSize es 6. Si 'PlotStyle' es 'compact', el valor predeterminado de OutlierSize es 4.

Ejemplo: 'OutlierSize',8

Tipos de datos: single | double

El estilo de la gráfica, especificado como uno de los siguientes.

NombreValor
'traditional'Representa las cajas con un estilo de caja tradicional.
'compact'Representa las cajas con un estilo de caja más pequeño diseñado para gráficas con muchos grupos. Este estilo cambia los valores predeterminados de algunos de los otros parámetros.

Ejemplo: 'PlotStyle','compact'

El marcador y el color de los valores atípicos, especificados como vector de caracteres o escalar de cadena que contiene símbolos de marcador y color. Los símbolos pueden aparecer en cualquier orden. Si se omite el símbolo de marcador, los valores atípicos se vuelven invisibles. Si se omite el color de símbolo, los valores atípicos aparecen del mismo color que la caja.

Si 'PlotStyle' es 'traditional', el valor predeterminado es '+r', que representa cada valor atípico usando un símbolo de marcador con forma de signo de más '+' rojo.

Si 'PlotStyle' es 'compact', el valor predeterminado es 'o', que representa cada valor atípico usando un símbolo de marcador con forma de círculo 'o' del mismo color que la caja correspondiente.

MarcadorDescripciónMarcador resultante
"o"Círculo

Sample of circle marker

"+"Signo de más

Sample of plus sign marker

"*"Asterisco

Sample of asterisk marker

"."Punto

Sample of point marker

"x"Cruz

Sample of cross marker

"_"Línea horizontal

Sample of horizontal line marker

"|"Línea vertical

Sample of vertical line marker

"square"Cuadrado

Sample of square marker

"diamond"Diamante

Sample of diamond marker

"^"Triángulo hacia arriba

Sample of upward-pointing triangle marker

"v"Triángulo hacia abajo

Sample of downward-pointing triangle marker

">"Triángulo hacia la derecha

Sample of right-pointing triangle marker

"<"Triángulo hacia la izquierda

Sample of left-pointing triangle marker

"pentagram"Pentagrama

Sample of pentagram marker

"hexagram"Hexagrama

Sample of hexagram marker

ColorDescripción

'y'

Amarillo

'm'

Magenta

'c'

Cian

'r'

Rojo

'g'

Verde

'b'

Azul

'w'

Blanco

'k'

Negro

Ejemplo: Especifique 'Symbol','' para que los valores atípicos se vuelvan invisibles.

El ancho de la caja, especificado como escalar numérico o vector numérico. Si el número de cajas no es igual al número de valores de anchura especificados, la lista de valores se replica o se trunca según sea necesario.

Este argumento de par nombre-valor no modifica el espacio entre las cajas. Por lo tanto, si especifica un valor grande de 'Widths', las cajas podrían solaparse.

El ancho de la caja predeterminado es igual a la mitad de la separación mínima entre cajas, que es 0,5 cuando el argumento del par nombre-valor 'Positions' toma su valor predeterminado.

Ejemplo: 'Widths',0.3

Tipos de datos: single | double

Apariencia del grupo

contraer todo

La variable de agrupación de cambio de color de la caja, especificada como variable de agrupación. La variable de agrupación es un vector numérico, un arreglo de caracteres, un arreglo de cadenas, un arreglo de celdas o un arreglo categórico. El color de la caja cambia cuando cambia la variable de agrupación especificada. El valor predeterminado [] indica que el color de la caja no cambia en función del grupo.

Tipos de datos: single | double | char | string | cell | categorical

El orden de los factores en la gráfica, especificado como uno de los siguientes.

NombreValor
'data'Los factores aparecen con el primer valor junto al origen de la gráfica.
'list'Los factores aparecen de izquierda a derecha si están en el eje x, o de arriba a abajo si están en el eje y.
'auto'Si las variables de agrupación son numéricas, boxplot utiliza 'data'. Si las variables de agrupación son arreglos de caracteres, arreglos de cadenas, arreglos de celdas o arreglos categóricos, boxplot utiliza 'list'.

Ejemplo: 'FactorDirection','auto'

Todos los factores del grupo de la gráfica, especificados como 'off' u 'on'. Si es 'off', boxplot representa una caja para cada fila única de variables de agrupación. Si es 'on', boxplot representa una caja para cada combinación posible de valores de las variables de agrupación, incluidas las combinaciones que no aparecen en los datos.

Ejemplo: 'FullFactors','on'

La distancia entre los factores de agrupación, especificada como valor numérico positivo, vector de valores numéricos positivos o 'auto'. Si se especifica un vector, la longitud del vector debe ser inferior o igual al número de variables de agrupación.

'FactorGap' representa la distancia de la brecha entre los diferentes factores de una variable de agrupación, expresada como un porcentaje de la anchura de la gráfica. Por ejemplo, si se especifica [3,1], la brecha es el tres por ciento del ancho de la gráfica entre los grupos con diferentes valores de la primera variable de agrupación, y el uno por ciento entre los grupos con el mismo valor de la primera variable de agrupación pero diferentes valores de la segunda.

Si se especifica 'auto', boxplot selecciona una distancia de brecha automáticamente. El valor [] indica que no hay cambios en el tamaño de la brecha entre los diferentes factores.

Si 'PlotStyle' es 'traditional', el valor predeterminado de FactorGap es []. Si 'PlotStyle' es 'compact', el valor predeterminado es 'auto'.

Ejemplo: 'FactorGap',[3,1]

Tipos de datos: single | double | char | string

La separación entre los factores de agrupación, especificada como entero positivo o vector de enteros positivos, o 'auto'. Si se especifica un vector, la longitud del vector debe ser inferior o igual al número de variables de agrupación. Los valores enteros deben estar en el rango [1,G], donde G es el número de variables de agrupación.

'FactorSeparator' especifica qué factores deben tener sus valores separados por una línea de cuadrícula. Por ejemplo, [1,2] añade una línea de separación cuando la primera o la segunda variable de agrupación cambia de valor.

Si 'PlotStyle' es 'traditional', el valor predeterminado de FactorSeparator es []. Si 'PlotStyle' es 'compact', el valor predeterminado es 'auto'.

Ejemplo: 'FactorSeparator',[1,2]

Tipos de datos: single | double | char | string

El orden de representación de los grupos, especificado como arreglo de cadenas o arreglo de celdas que contiene los nombres de las variables de agrupación. Si tiene varias variables de agrupación, separe los valores con una coma. También puede utilizar los arreglos categóricos como variables de agrupación para controlar el orden de las cajas. El valor predeterminado [] no cambia el orden de las cajas.

Tipos de datos: string | cell

Límites de datos y distancias máximas

contraer todo

Los límites de datos extremos, especificados como vector numérico de dos elementos que contiene los límites inferior y superior, respectivamente. Los valores especificados de 'DataLim' son utilizados por 'ExtremeMode' para determinar qué puntos de datos son extremos.

Tipos de datos: single | double

El método de gestión de datos extremos, especificado como uno de los siguientes.

NombreValor
'clip'Si algún valor de los datos queda fuera de los límites especificados por 'DataLim', boxplot muestra estos valores en DataLim en la gráfica.
'compress'Si algún valor de los datos queda fuera de los límites especificados por 'DataLim', boxplot muestra estos valores distribuidos de manera uniforme en una región justo fuera de DataLim, conservando el orden relativo de los puntos.

Si algún punto de los datos se encuentra fuera del límite especificado por 'DataLim', el límite se marca con una línea de puntos. Si algún punto de los datos está comprimido, dos líneas grises marcan la región de compresión. Los valores en –Inf o Inf se pueden recortar o comprimir, pero los valores NaN no aparecen en la gráfica. Las muescas de la caja se dibujan a escala y pueden extenderse más allá de los límites si la mediana está dentro del límite. Las muescas de la caja no se dibujan si la mediana está fuera de los límites.

Ejemplo: 'ExtremeMode','compress'

La distancia máxima de desplazamiento de los valores atípicos, especificada como valor numérico. Jitter es la distancia máxima de desplazamiento de los valores atípicos a lo largo del eje del factor en una cantidad aleatoria uniforme, para hacer visibles los puntos duplicados. Si se especifica que 'Jitter' es igual a 1, las regiones de fluctuación solo se tocan entre los grupos adyacentes más cercanos.

Si 'PlotStyle' es 'traditional', el valor predeterminado de Jitter es 0. Si 'PlotStyle' es 'compact', el valor predeterminado es 0,5.

Ejemplo: 'Jitter',1

Tipos de datos: single | double

El multiplicador de la longitud máxima de los bigotes, especificado como valor numérico positivo. La longitud máxima de los bigotes es el producto de Whisker por el rango intercuartil.

boxplot dibuja puntos como valores atípicos si son mayores que q3 + w × (q3q1) o menores que q1w × (q3q1), donde w es el multiplicador Whisker y q1 y q3 son los percentiles 25 y 75 de los datos de muestra, respectivamente.

El valor predeterminado de 'Whisker' corresponde aproximadamente a +/–2.7σ y al 99,3 por ciento de cobertura si los datos se distribuyen con normalidad. El bigote representado se extiende hasta el valor adyacente, que es el valor de datos más extremo que no es un valor atípico.

Especifique 'Whisker' como 0 para que no haya bigotes y para que cada punto que esté fuera de q1 y q3 sea un valor atípico.

Para ver un ejemplo etiquetado de gráficas de caja con bigotes, consulte Gráfica de caja.

Ejemplo: 'Whisker',0

Tipos de datos: single | double

Apariencia de la gráfica

contraer todo

Las etiquetas de la caja, especificadas como arreglo de caracteres, arreglo de cadenas, arreglo de celdas o vector numérico que contiene los nombres de las etiquetas de la caja. Especifique una etiqueta por valor x o una etiqueta por grupo. Para especificar varias variables de etiqueta, utilice una matriz numérica o un arreglo de celdas que contenga cualquiera de los tipos de datos aceptados.

Para eliminar las etiquetas de una gráfica, utilice el siguiente comando: set(gca,'XTickLabel',{' '}).

Tipos de datos: char | string | cell | single | double

La orientación de las etiquetas, especificada como uno de los siguientes.

NombreValor
'inline'Gire las etiquetas de la caja para que estén en posición vertical. Esta es la opción predeterminada cuando 'PlotStyle' es 'compact'.
'horizontal'Deje las etiquetas de la caja en posición horizontal. Esta es la opción predeterminada cuando 'PlotStyle' es 'traditional'.

Si las etiquetas están en el eje y, ambas configuraciones dejan las etiquetas en posición horizontal.

Ejemplo: 'LabelOrientation','inline'

Las etiquetas para mostrar en la gráfica, especificadas como uno de los siguientes.

NombreValor
'all'Muestre una etiqueta para cada valor de una variable de agrupación. Esta es la opción predeterminada cuando 'PlotStyle' es 'traditional'.
'minor'

En cualquier variable de agrupación, muestre el valor correspondiente a la caja j solo si ese valor es diferente del valor correspondiente a la caja (j – 1).

'majorminor'

En cualquier variable de agrupación g(:,i), muestre el valor correspondiente a la caja j solo si ese valor es diferente del valor de g(:,i) correspondiente a la caja (j – 1), o si la condición anterior se cumple en al menos una de las variables de agrupación g(:,1),…,g(:,i-1). Esta es la opción predeterminada cuando 'PlotStyle' es 'compact'.

Ejemplo: 'LabelVerbosity','minor'

La orientación de la gráfica, especificada como uno de los siguientes.

NombreValor
'vertical'Representa x en el eje y.
'horizontal'Representa x en el eje x.

Ejemplo: 'Orientation','horizontal'

Las posiciones de la caja, especificadas como vector numérico que contiene una entrada para cada grupo o valor x. El valor predeterminado es 1:NumGroups, donde NumGroups es el número de grupos.

Tipos de datos: single | double

Más acerca de

contraer todo

Gráfica de caja

Una gráfica de caja proporciona una visualización de las estadísticas descriptivas de los datos de muestra y contiene las siguientes funcionalidades:

  • La parte inferior y superior de cada caja son los percentiles 25 y 75 de la muestra, respectivamente. La distancia entre la parte inferior y superior de cada caja es el rango intercuartil.

  • La línea roja que está en el centro de cada caja es la mediana de la muestra. Si la mediana no está centrada en la caja, la gráfica muestra la asimetría de la muestra.

  • Los bigotes son líneas que se extienden por encima y por debajo de cada caja. Los bigotes van desde el final del rango intercuartil hasta la observación más lejana dentro de la longitud del bigote (el valor adyacente).

  • Las observaciones que superan la longitud del bigote se marcan como valores atípicos. De forma predeterminada, un valor atípico es un valor que está a más de 1,5 veces el rango intercuartil de la parte inferior o superior de la caja. Sin embargo, puede ajustar este valor utilizando más argumentos de entrada. Un valor atípico aparece como un signo + rojo.

  • Las muescas muestran la variabilidad de la mediana entre las muestras. La anchura de una muesca se calcula de forma que las cajas cuyas muescas no se solapan tengan medianas diferentes al nivel de significación del 5%. El nivel de significación se basa en el supuesto de una distribución normal, pero las comparaciones de las medianas son razonablemente sólidas en otras distribuciones. Comparar las medianas de las gráficas de caja es como una prueba de hipótesis visual, similar a la prueba t utilizada para las medias. En algunos casos, las muescas se extienden fuera de las cajas.

Example of a box plot with labels for the summary statistics

Sugerencias

  • boxplot crea una representación visual de los datos, pero no devuelve valores numéricos. Para calcular las estadísticas descriptivas relevantes de los datos de muestra, utilice las siguientes funciones:

    • min: encuentre el valor mínimo de los datos de muestra.

    • max: encuentre el valor máximo de los datos de muestra.

    • median: encuentre el valor de la mediana de los datos de muestra.

    • quantile: encuentre los valores cuantílicos de los datos de muestra. Por ejemplo, para calcular los percentiles 25 y 75 de x, especifique quantile(x,[0.25 0.75]).

    • iqr: encuentre el rango intercuartil de los datos de muestra.

    • grpstats: calcule las estadísticas descriptivas de los datos de muestra, organizadas por grupo.

  • Puede ver los valores de los datos y los nombres de los grupos mediante el cursor de datos en la ventana de la figura. El cursor muestra los valores originales de los puntos afectados por el parámetro datalim. Puede etiquetar el grupo al que pertenece un valor atípico con la función gname.

  • Para modificar las propiedades gráficas de un componente de la gráfica de caja, utilice findobj con la propiedad Tag para encontrar el identificador del componente. Los valores Tag de los componentes de las gráficas de caja dependen de la configuración de los parámetros y se enumeran en la siguiente tabla.

    Configuración de los parámetrosValores de las etiquetas
    Todas las configuraciones
    • 'Box'

    • 'Outliers'

    Cuando 'PlotStyle' es 'traditional'
    • 'Median'

    • 'Upper Whisker'

    • 'Lower Whisker'

    • 'Upper Adjacent Value'

    • 'Lower Adjacent Value'

    Cuando 'PlotStyle' es 'compact'
    • 'Whisker'

    • 'MedianOuter'

    • 'MedianInner'

    Cuando 'Notch' es 'marker'
    • 'NotchLo'

    • 'NotchHi'

Funcionalidad alternativa

También puede crear un objeto BoxChart mediante la función boxchart. Aunque boxchart no incluye toda la funcionalidad de boxplot, tiene algunas ventajas. A diferencia de boxplot, la función boxchart:

  • Permite reglas categóricas a lo largo del eje del grupo

  • Proporciona la opción de una leyenda

  • Funciona bien con el comando hold on

  • Tiene un diseño visual mejorado que ayuda a ver las muescas más fácilmente

Para controlar la apariencia y el comportamiento del objeto, cambie BoxChart Properties.

Referencias

[1] McGill, R., J. W. Tukey, and W. A. Larsen. “Variations of Boxplots.” The American Statistician. Vol. 32, No. 1, 1978, pp. 12–16.

[2] Velleman, P.F., and D.C. Hoaglin. Applications, Basics, and Computing of Exploratory Data Analysis. Pacific Grove, CA: Duxbury Press, 1981.

[3] Nelson, L. S. “Evaluating Overlapping Confidence Intervals.” Journal of Quality Technology. Vol. 21, 1989, pp. 140–141.

[4] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

Historial de versiones

Introducido antes de R2006a