Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Medidas de tendencia central

Las medidas de tendencia central localizan una distribución de datos a lo largo de una escala adecuada.

La siguiente tabla enumera las funciones que calculan las medidas de tendencia central.

Nombre de la función

Descripción

geomean

Media geométrica

harmmean

La media armónica

mean

Promedio aritmético

median

percentil 50

mode

El valor más frecuente

trimmean

Media recortada

El promedio es una estimación simple y popular de la ubicación. Si la muestra de datos proviene de una distribución normal, entonces la media de la muestra también es óptima (estimador imparcial de varianza mínima (MVUE) de).µ

Desafortunadamente, los valores atípicos, los errores de entrada de datos o los fallos técnicos existen en casi todos los datos reales. La media de la muestra es sensible a estos problemas. Un valor de datos erróneo puede mover el promedio lejos del centro del resto de los datos por una distancia arbitrariamente grande.

La mediana y la media recortada son dos medidas que son resistentes (robustas) a los valores atípicos. La mediana es el percentil 50 de la muestra, que solo cambiará ligeramente si se agrega una gran perturbación a cualquier valor. La idea detrás de la media recortada es ignorar un pequeño porcentaje de los valores más altos y más bajos de una muestra al determinar el centro de la muestra.

La media geométrica y la media armónica, como el promedio, no son robustas para los valores atípicos. Son útiles cuando la muestra se distribuye lognormal o fuertemente sesgada.

Medidas de tendencia central

En este ejemplo se muestra cómo calcular y comparar las medidas de ubicación para los datos de ejemplo que contienen un valor atípico.

Genere datos de ejemplo que contengan un valor atípico.

x = [ones(1,6),100]
x = 1×7

     1     1     1     1     1     1   100

Calcule la media geométrica, la media armónica, la media, la mediana y el promedio recortado para los datos de la muestra.

locate = [geomean(x) harmmean(x) mean(x) median(x)...            trimmean(x,25)]
locate = 1×5

    1.9307    1.1647   15.1429    1.0000    1.0000

La media () está lejos de cualquier valor de datos debido a la influencia del outlier.mean La media geométrica () y la media armónica () están influenciadas por el valor atípico, pero no tan significativamente.geomeanharmmean La mediana () y la media recortada () ignoran el valor atípico y describen la ubicación del resto de los valores de datos.mediantrimmean

Temas relacionados