Contenido principal

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Preprocesamiento de datos

Limpie, normalice, agregue y analice datos

El preprocesamiento de datos es el proceso de transformación de datos sin procesar a un formato que sea más fácil de analizar. Este proceso puede incluir pasos de limpieza, como gestionar valores faltantes o suavizar datos ruidosos. Si limpia, organiza y resume los datos, puede identificar patrones, hacer predicciones y aportar información en la toma de decisiones.

Apps

expandir todo

Data CleanerPreprocess and organize column-oriented data (Desde R2022a)

Tareas de Live Editor

expandir todo

Clean Missing DataFind, fill, or remove missing data in the Live Editor
Clean Outlier DataFind, fill, or remove outliers in the Live Editor
Smooth DataSmooth noisy data in the Live Editor
Find Local ExtremaFind local maxima and minima in the Live Editor
Find Change PointsFind abrupt changes in data in the Live Editor
Stack Table VariablesCombine values from multiple table variables into one table variable in the Live Editor
Unstack Table VariablesDistribute values from one table variable to multiple table variables in the Live Editor
Retime TimetableResample or aggregate timetable data in the Live Editor
Normalize DataCenter and scale data in the Live Editor (Desde R2021b)
Find and Remove TrendsFind and remove polynomial or periodic trends from data in the Live Editor
Pivot TableSummarize tabular data in pivoted table in the Live Editor (Desde R2023b)
Compute by GroupSummarize, transform, or filter by group in the Live Editor (Desde R2021b)

Funciones

expandir todo

Valores faltantes

fillmissingFill missing entries
fillmissing2Fill missing entries in 2-D data (Desde R2023a)
standardizeMissingInsert standard missing values
rmmissingRemove missing entries
anymissingDetermine if any array element is missing (Desde R2022a)
ismissingFind missing values
missingCreate missing values

Valores atípicos

filloutliersDetect and replace outliers in data
rmoutliersDetect and remove outliers in data
isoutlierFind outliers in data
clipClip data to range (Desde R2024a)
isbetweenDetermine which elements are within specified range
allbetweenDetermine if all elements are within specified range (Desde R2025a)

Reducción de ruido

smoothdataSmooth noisy data
smoothdata2 Smooth noisy data in two dimensions (Desde R2023b)
movmeanMedia móvil
movmedianMediana móvil
movsumMoving sum

Puntos de extremos locales y de cambio

islocalminFind local minima
islocalmin2Find local minima in 2-D data (Desde R2024a)
islocalmaxFind local maxima
islocalmax2Find local maxima in 2-D data (Desde R2024a)
ischangeFind abrupt changes in data

Muestreo

isuniformDetermine if vector is uniformly spaced (Desde R2022b)
isregularDetermine if input times are regular with respect to time or calendar unit
retimeResample or aggregate data in timetable, and resolve duplicate or irregular times

Remodelar tablas

rows2varsReorient table or timetable so that rows become variables
stackStack data from input table or timetable into one variable of output table or timetable
unstackUnstack data from input table or timetable into multiple variables of output table or timetable

Ordenar y comparar elementos

sortOrdenar los elementos de un arreglo
sortrowsSort rows of matrix or table
issortedDetermine if array is sorted
issortedrowsDetermine if matrix or table rows are sorted
uniqueValores únicos
uniquetolUnique values within tolerance
alluniqueDetermine if all values are unique (Desde R2025a)
numuniqueNumber of unique values (Desde R2025a)
ismemberEncontrar miembros de conjuntos de datos
ismembertolFind set members of data within tolerance

Redimensionar

paddataPad data by adding elements (Desde R2023b)
trimdataTrim data by removing elements (Desde R2023b)
resizeResize data by adding or removing elements (Desde R2023b)

Normalizar

normalizeNormalize data
rescaleScale range of array elements

Encontrar y eliminar tendencias

detrendRemove polynomial trend
trenddecompFind trends in data (Desde R2021b)

Discretizar

discretizeGroup data into bins or categories
histcountsHistogram bin counts
histcounts2Bivariate histogram bin counts

Pivotar

pivotSummarize tabular data in pivoted table (Desde R2023a)

Resumir

summaryData summary
groupsummaryGroup summary computations
groupcountsNumber of group elements
groupfilterFilter by group
grouptransformTransform by group
findgroupsFind groups and return group numbers
splitapplySplit data into groups and apply function
accumarrayAccumulate vector elements

Temas

Limpiar datos

Eliminar tendencias

Resumir

Ejemplos destacados