Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Preprocesamiento de datos

Depuración, suavizado y agrupamiento de datos

Los datos pueden requerir técnicas de preprocesamiento con el fin de garantizar un análisis preciso, eficiente o significativo. La depuración de datos alude a todos aquellos métodos que se utilizan para buscar, eliminar y reemplazar datos incorrectos o ausentes. La detección de cambios de extremos locales y cambios abruptos puede ayudar a identificar tendencias de datos significativas. El suavizado y la eliminación de tendencia son procesos que se emplean para eliminar el ruido y las tendencias polinómicas de los datos, mientras que el escalado cambia los límites de los datos. Los métodos de agrupación y discretización identifican las características de los datos por grupos.

Apps

Data CleanerPreprocess and organize column-oriented data (desde R2022a)

Tareas de Live Editor

Clean Missing DataFind, fill, or remove missing data in the Live Editor
Clean Outlier DataFind, fill, or remove outliers in the Live Editor
Find Change PointsFind abrupt changes in data in the Live Editor
Find Local ExtremaFind local maxima and minima in the Live Editor
Smooth DataSmooth noisy data in the Live Editor
Find and Remove TrendsFind and remove polynomial or periodic trends from data in the Live Editor
Normalize DataCenter and scale data in the Live Editor (desde R2021b)
Pivot TableSummarize tabular data in pivoted table in the Live Editor (desde R2023b)
Compute by GroupSummarize, transform, or filter by group in the Live Editor (desde R2021b)

Funciones

expandir todo

anymissingDetermine if any array element is missing (desde R2022a)
ismissingFind missing values
rmmissingRemove missing entries
fillmissingFill missing entries
fillmissing2Fill missing entries in 2-D data (desde R2023a)
missingCreate missing values
standardizeMissingInsert standard missing values
isoutlierFind outliers in data
rmoutliersDetect and remove outliers in data
filloutliersDetect and replace outliers in data
clipClip data to range (desde R2024a)
movmadMoving median absolute deviation
ischangeFind abrupt changes in data
islocalminFind local minima
islocalmin2Find local minima in 2-D data (desde R2024a)
islocalmaxFind local maxima
islocalmax2Find local maxima in 2-D data (desde R2024a)
smoothdataSmooth noisy data
smoothdata2 Smooth noisy data in two dimensions (desde R2023b)
movmeanMedia móvil
movmedianMoving median
detrendRemove polynomial trend
trenddecompFind trends in data (desde R2021b)
normalizeNormalize data
rescaleScale range of array elements
discretizeGroup data into bins or categories
pivotSummarize tabular data in pivoted table (desde R2023a)
groupsummaryGroup summary computations
groupcountsNumber of group elements
groupfilterFilter by group
grouptransformTransform by group
histcountsHistogram bin counts
histcounts2Bivariate histogram bin counts
findgroupsFind groups and return group numbers
splitapplySplit data into groups and apply function
rowfunApply function to table or timetable rows
varfunApply function to table or timetable variables
accumarrayAccumulate vector elements

Temas

Ejemplos destacados