Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Medidas de dispersión

El propósito de medidas de dispersión es averiguar cómo se extienden los valores de los datos están en la línea numérica. Otro término para estas estadísticas son las medidas de propagación.

La tabla proporciona los nombres y las descripciones de las funciones.

Nombre de la función

Descripción

iqr

Rango intercuartil

mad

La desviación media absoluta

moment

Momento central de todas las órdenes

range

Gama

std

La desviación estándar

var

Varianza

El intervalo (la diferencia entre los valores máximo y mínimo) es la medida de propagación más sencilla. Pero si hay un valor atípico en los datos, será el valor mínimo o máximo. Por lo tanto, el rango no es robusto a los valores atípicos.

La desviación estándar y la varianza son medidas populares de propagación que son óptimas para muestras distribuidas normalmente. La varianza de la muestra es el estimador imparcial de la varianza mínima (MVUE) del parámetro normal σ2. La desviación estándar es la raíz cuadrada de la varianza y tiene la propiedad deseable de estar en las mismas unidades que los datos. Es decir, si los datos están en metros, la desviación estándar también está en metros. La varianza es en metros2, que es más difícil de interpretar.

Ni la desviación estándar ni la varianza son robustas para los valores atípicos. Un valor de datos que es independiente del cuerpo de los datos puede aumentar el valor de las estadísticas por una cantidad arbitrariamente grande.

La media desviación absoluta (MAD) también es sensible a los valores atípicos. Pero el MAD no se mueve tanto como la desviación estándar o la varianza en respuesta a los datos defectuosos.

el rango intercuartil (IQR) es la diferencia entre el percentil 75 y 25 de los datos. Dado que solo el 50% medio de los datos afecta a esta medida, es robusto a los valores atípicos.

Compare las medidas de dispersión

En este ejemplo se muestra cómo calcular y comparar las medidas de dispersión para los datos de ejemplo que contienen un valor atípico.

Genere datos de ejemplo que contengan un valor atípico.

x = [ones(1,6),100]
x = 1×7

     1     1     1     1     1     1   100

Calcule el rango intercuartil, la desviación absoluta media, el rango y la desviación estándar de los datos de la muestra.

stats = [iqr(x),mad(x),range(x),std(x)]
stats = 1×4

         0   24.2449   99.0000   37.4185

El rango intercuartil () es la diferencia entre el percentil 75 y 25 de los datos de la muestra, y es robusto a los valores atípicos.iqr El rango () es la diferencia entre los valores máximos y mínimos de los datos y está fuertemente influenciado por la presencia de un valor atípico.range

Tanto la desviación absoluta media () como la desviación estándar () son sensibles a los valores atípicos.madstd Sin embargo, la desviación media absoluta es menos sensible que la desviación estándar.

Temas relacionados