Análisis de clusters y detección de anomalías
Los análisis de clusters, también denominados análisis de segmentación o análisis taxonómico, dividen los datos de muestra en grupos o clusters. Los clusters se forman de manera tal que los objetos del mismo cluster son similares y los de clusters diferentes son distintos. Statistics and Machine Learning Toolbox™ proporciona varias técnicas de formación de clusters y medidas de similitud (también denominadas métricas de distancia) para crear los clusters. Además, la evaluación de clusters determina el número óptimo de clusters en función de los datos mediante distintos criterios de evaluación. Las opciones para la visualización de clusters incluyen dendrogramas y gráficas de siluetas.
La detección de anomalías es una rama del machine learning que identifica observaciones que se desvían de un patrón o distribución esperados en datos de muestra. Statistics and Machine Learning Toolbox ofrece varias técnicas de detección de valores atípicos y novedades (consulte Unsupervised Anomaly Detection), así como métodos adicionales para detectar anomalías en los datos de transmisión (consulte Incremental Anomaly Detection Overview).
Aspectos básicos del análisis de clusters
Categorías
- Formación de clusters jerárquicos
Elabore conjuntos de clusters anidados
- Formación de clusters de k-medias y k-medoides
Agrupe minimizando la distancia a la media o al medoide, y calcule la distancia de Mahalanobis
- Formación de clusters espaciales basados en densidad de aplicaciones con ruido
Encuentre clusters y valores atípicos utilizando el algoritmo DBSCAN
- Formación de clusters espectrales
Encuentre clusters utilizando un algoritmo basado en gráficas
- Modelos de mixtura gaussianos
Agrupe en función de modelos de mixtura gaussianos mediante el algoritmo de esperanza-maximización
- Vecinos más próximos
Encuentre los vecinos más próximos mediante una búsqueda exhaustiva o una búsqueda en árbol Kd
- Modelos de Markov ocultos
Modelos de Markov para la generación de datos
- Detección de anomalías
Detecte valores atípicos y novedades
- Visualización y evaluación de clusters
Represente clusters de datos y evalúe el número óptimo de clusters
- Coejecución de un modelo de Python
Cargue y coejecute modelos de machine learning de Python para la predicción en Simulink