Statistics and Machine Learning Toolbox

 

Statistics and Machine Learning Toolbox

Analice y modele datos con estadística y Machine Learning

Statistics and Machine Learning Toolbox™ proporciona funciones y apps para describir, analizar y modelar datos. Puede utilizar estadística descriptiva, visualizaciones y agrupación en clusters para el análisis exploratorio de datos, ajustar distribuciones de probabilidad a datos, generar números aleatorios para simulaciones Montecarlo y realizar pruebas de hipótesis. Los algoritmos de regresión y clasificación permiten extraer inferencias de los datos y crear modelos predictivos de forma interactiva con las apps Classification Learner y Regression Learner, o de forma programática con AutoML.

Para el análisis de datos multidimensionales y la extracción de características, la toolbox proporciona métodos de análisis de componentes principales (PCA), regularización, reducción de dimensionalidad y selección de características que permiten identificar variables con la máxima capacidad predictiva.

La toolbox proporciona algoritmos de Machine Learning supervisado, semisupervisado y no supervisado, incluyendo máquinas de vectores de soporte (SVM), árboles de decisión boosted, redes neuronales superficiales, K-means y otros métodos de agrupación en clusters. Puede aplicar técnicas de interpretabilidad, tales como gráficas de dependencia parcial, valores de Shapley y LIME, además de generar automáticamente código C/C++ para despliegue integrado. Los bloques nativos de Simulink permiten utilizar modelos predictivos con simulaciones y diseño basado en modelos. Muchos algoritmos de esta toolbox se pueden emplear con conjuntos de datos que son demasiado grandes para almacenarlos en la memoria.

Estadísticas descriptivas y visualización

Explore los datos a través de representación estadística con gráficas interactivas y visuales, y estadísticas descriptivas. Comprenda y describa rápidamente conjuntos de datos de gran tamaño con estadísticas descriptivas, como medidas de tendencia central, dispersión, forma, correlación y covarianza.

Análisis de clusters

Identifique patrones y características aplicando K-means, DBSCAN, jerárquico y otros métodos de agrupación en clusters, así como dividiendo los datos en grupos o clusters. Determine el número óptimo de clusters para los datos utilizando distintos criterios de evaluación. Detecte anomalías para identificar valores atípicos y novedades.

ANOVA

Asigne una varianza de muestra a distintos orígenes y determine si la variación surge dentro o entre distintos grupos de población. Utilice análisis de la varianza (ANOVA) de un factor, de dos factores, multifactor, multivariante y no paramétrico, así como análisis de la covarianza (ANOCOVA) y análisis de la varianza de medidas repetidas (RANOVA).

Regresión

Utilice la app Regression Learner, o entrene y evalúe de manera programática modelos de regresión lineal, procesos gaussianos, máquinas de vectores de soporte, redes neuronales y ensembles.

Clasificación

Utilice la app Classification Learner, o entrene y valide de manera programática modelos de regresión logística, máquinas de vectores de soporte, árboles de decisión boosted y redes neuronales superficiales.

Reducción de la dimensionalidad y extracción de características

Extraiga características de imágenes, señales, texto y datos numéricos. Explore y cree nuevas características de manera iterativa, y seleccione las que optimicen el rendimiento. Reduzca la dimensionalidad transformando las características existentes en nuevas variables de predicción y descarte las características menos descriptivas después de la transformación, o bien aplicando una selección automatizada de características.

Distribuciones de probabilidad

Ajuste distribuciones continuas y discretas, utilice gráficas estadísticas para evaluar la bondad de ajuste, y calcule funciones de densidad de probabilidad y funciones de distribución acumulativa para más de 40 distribuciones diferentes.

Pruebas de hipótesis

Saque conclusiones sobre una población en base a la evidencia estadística de una muestra. Realice pruebas t, pruebas de distribuciones y pruebas no paramétricas para muestras únicas, pareadas o independientes. Pruebe la autocorrección y la aleatoriedad, y compare distribuciones.

Estadística industrial

Analice estadísticamente efectos y tendencias de datos. Diseñe experimentos para crear y probar planes prácticos sobre cómo manipular las entradas de datos para generar información sobre sus efectos en las salidas de datos. Visualice y analice datos de tiempo hasta el fallo con y sin censura, y monitorice y evalúe la calidad de los procesos industriales.

Análisis de big data con arrays altos

Utilice arrays altos y tablas con muchos algoritmos de clasificación, regresión y agrupación en clusters para entrenar modelos con conjuntos de datos que son demasiado grandes para la capacidad de la memoria, sin necesidad de modificar el código.

Generación de código

Genere código C/C++ portátil y legible para inferir modelos de clasificación y regresión, estadísticas descriptivas y distribuciones de probabilidad. Genere código C/C++ de predicción con precisión reducida, y actualice parámetros de modelos desplegados sin necesidad de volver a generar el código de predicción.

Obtenga una versión de prueba gratuita

30 días de exploración a su alcance.


¿Listo para comprar?

Obtenga información sobre precios y explore productos relacionados.

¿Es estudiante?

Es posible que su centro educativo ya ofrezca acceso a MATLAB, Simulink y otros productos complementarios mediante una infraestructura Campus-Wide License.