Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Preprocesamiento de datos

Limpieza, suavizado y agrupamiento de datos

Los conjuntos de datos pueden requerir técnicas de preprocesamiento con el fin de garantizar un análisis preciso, eficiente o significativo. La limpieza de datos alude a todos aquellos métodos que se utilizan para buscar, eliminar y reemplazar datos incorrectos o ausentes. La detección de cambios de extremos locales y cambios abruptos puede ayudar a identificar tendencias de datos significativas. El suavizado y la eliminación de tendencia son procesos que se emplean para eliminar el ruido y las tendencias lineales de los datos, mientras que el escalado cambia los límites de los datos. Los métodos para agrupar y discretizar son técnicas que identifican relaciones entre las variables de datos.

Funciones

expandir todo

ismissingFind missing values
rmmissingRemove missing entries
fillmissingFill missing values
missingCreate missing values
standardizeMissingInsert standard missing values
isoutlierFind outliers in data
filloutliersDetect and replace outliers in data
rmoutliersDetect and remove outliers in data
movmadMoving median absolute deviation
ischangeFind abrupt changes in data
islocalminFind local minima
islocalmaxFind local maxima
smoothdataSmooth noisy data
movmeanMoving mean
movmedianMoving median
detrendRemove polynomial trend
normalizeNormalize data
rescaleScale range of array elements
discretizeGroup data into bins or categories
groupcountsNumber of group elements
groupsummaryGroup summary computations
grouptransformTransform by group
histcountsHistogram bin counts
histcounts2Bivariate histogram bin counts
findgroupsFind groups and return group numbers
splitapplySplit data into groups and apply function
rowfunApply function to table or timetable rows
varfunApply function to table or timetable variables
accumarrayConstruct array with accumulation

Temas

Datos faltantes en MATLAB

Controle los valores faltantes en conjuntos de datos.

Limpie los datos desordenados y faltantes en tablas

En este ejemplo se muestra cómo buscar, limpiar y eliminar filas de tabla con datos que faltan.

Suavizado de datos y detección de valores atípicos

Elimine el ruido o el comportamiento no deseado de los datos y busque, rellene y quite los valores atípicos.

Detrending de datos

Eliminar tendencias lineales de los datos.

Agrupar variables para dividir datos

Puede utilizar variables de agrupación para clasificar las variables de datos.

Dividir datos en grupos y calcular estadísticas

En este ejemplo se muestra cómo agrupar datos y aplicar funciones de estadísticas a cada grupo.

Dividir variables de datos de tabla y aplicar funciones

Este ejemplo muestra cómo agrupar variables de datos y aplicar funciones a cada grupo.