Análisis de clusters y detección de anomalías
Los análisis de clusters, también denominados análisis de segmentación o análisis taxonómico, dividen los datos de muestra en grupos o clusters. Los clusters se forman de manera tal que los objetos del mismo cluster son similares y los de clusters diferentes son distintos. Statistics and Machine Learning Toolbox™ proporciona varias técnicas de formación de clusters y medidas de similitud (también denominadas métricas de distancia) para crear los clusters. Además, la evaluación de clusters determina el número óptimo de clusters en función de los datos mediante distintos criterios de evaluación. Las opciones para la visualización de clusters incluyen dendrogramas y gráficas de siluetas.
La detección de anomalías es una rama del machine learning que identifica observaciones que se desvían de un patrón o distribución esperados en datos de muestra. Statistics and Machine Learning Toolbox ofrece varias técnicas de detección de valores atípicos y novedades (consulte Unsupervised Anomaly Detection), así como métodos adicionales para detectar anomalías en los datos de transmisión (consulte Incremental Anomaly Detection Overview).
Aspectos básicos del análisis de clusters
Categorías
- Formación de clusters jerárquicos
 Elabore conjuntos de clusters anidados
 
- Formación de clusters de k-medias y k-medoides
 Agrupe minimizando la distancia a la media o al medoide, y calcule la distancia de Mahalanobis
 
- Formación de clusters espaciales basados en densidad de aplicaciones con ruido
 Encuentre clusters y valores atípicos utilizando el algoritmo DBSCAN
 
- Formación de clusters espectrales
 Encuentre clusters utilizando un algoritmo basado en gráficas
 
- Modelos de mixtura gaussianos
 Agrupe en función de modelos de mixtura gaussianos mediante el algoritmo de esperanza-maximización
 
- Vecinos más próximos
 Encuentre los vecinos más próximos mediante una búsqueda exhaustiva o una búsqueda en árbol Kd
 
- Modelos de Markov ocultos
 Modelos de Markov para la generación de datos
 
- Detección de anomalías
 Detecte valores atípicos y novedades
 
- Visualización y evaluación de clusters
 Represente clusters de datos y evalúe el número óptimo de clusters
 
- Coejecución de un modelo de Python
 Cargue y coejecute modelos de machine learning de Python para la predicción en Simulink
 

