Statistics and Machine Learning Toolbox
Analice y modele datos con estadística y Machine Learning
¿Tiene preguntas? Comuníquese con ventas.
¿Tiene preguntas? Comuníquese con ventas.
Statistics and Machine Learning Toolbox proporciona funciones y apps para describir, analizar y modelar datos. Puede utilizar estadística descriptiva, visualizaciones y agrupación en clusters para el análisis exploratorio de datos, ajustar distribuciones de probabilidad a datos, generar números aleatorios para simulaciones Montecarlo y realizar pruebas de hipótesis. Los algoritmos de regresión y clasificación permiten extraer inferencias de los datos y crear modelos predictivos de forma interactiva con las apps Classification Learner y Regression Learner, o de forma programática con AutoML.
Para el análisis de datos multidimensionales y la extracción de características, la toolbox proporciona métodos de análisis de componentes principales (PCA), regularización, reducción de dimensionalidad y selección de características que permiten identificar variables con la máxima capacidad predictiva.
La toolbox proporciona algoritmos de Machine Learning supervisado, semisupervisado y no supervisado, incluyendo máquinas de vectores de soporte (SVM), árboles de decisión boosted, redes neuronales superficiales, K-means y otros métodos de agrupación en clusters. Puede aplicar técnicas de interpretabilidad, tales como gráficas de dependencia parcial, valores de Shapley y LIME, además de generar automáticamente código C/C++ para despliegue integrado. Los bloques nativos de Simulink permiten utilizar modelos predictivos con simulaciones y diseño basado en modelos. Muchos algoritmos de esta toolbox se pueden emplear con conjuntos de datos que son demasiado grandes para almacenarlos en la memoria.
Explore los datos a través de representación estadística con gráficas interactivas y visuales, y estadísticas descriptivas. Comprenda y describa rápidamente conjuntos de datos de gran tamaño con estadísticas descriptivas, como medidas de tendencia central, dispersión, forma, correlación y covarianza.
Identifique patrones y características aplicando K-means, DBSCAN, jerárquico y otros métodos de agrupación en clusters, así como dividiendo los datos en grupos o clusters. Determine el número óptimo de clusters para los datos utilizando distintos criterios de evaluación. Detecte anomalías para identificar valores atípicos y novedades.
Asigne una varianza de muestra a distintos orígenes y determine si la variación surge dentro o entre distintos grupos de población. Utilice análisis de la varianza (ANOVA) de un factor, de dos factores, multifactor, multivariante y no paramétrico, así como análisis de la covarianza (ANOCOVA) y análisis de la varianza de medidas repetidas (RANOVA).
Utilice la app Regression Learner, o entrene y evalúe de manera programática modelos de regresión lineal, procesos gaussianos, máquinas de vectores de soporte, redes neuronales y ensembles.
Utilice la app Classification Learner, o entrene y valide de manera programática modelos de regresión logística, máquinas de vectores de soporte, árboles de decisión boosted y redes neuronales superficiales.
Extraiga características de imágenes, señales, texto y datos numéricos. Explore y cree nuevas características de manera iterativa, y seleccione las que optimicen el rendimiento. Reduzca la dimensionalidad transformando las características existentes en nuevas variables de predicción y descarte las características menos descriptivas después de la transformación, o bien aplicando una selección automatizada de características.
Ajuste distribuciones continuas y discretas, utilice gráficas estadísticas para evaluar la bondad de ajuste, y calcule funciones de densidad de probabilidad y funciones de distribución acumulativa para más de 40 distribuciones diferentes.
Saque conclusiones sobre una población en base a la evidencia estadística de una muestra. Realice pruebas t, pruebas de distribuciones y pruebas no paramétricas para muestras únicas, pareadas o independientes. Pruebe la autocorrección y la aleatoriedad, y compare distribuciones.
Analice estadísticamente efectos y tendencias de datos. Diseñe experimentos para crear y probar planes prácticos sobre cómo manipular las entradas de datos para generar información sobre sus efectos en las salidas de datos. Visualice y analice datos de tiempo hasta el fallo con y sin censura, y monitorice y evalúe la calidad de los procesos industriales.
Utilice arrays altos y tablas con muchos algoritmos de clasificación, regresión y agrupación en clusters para entrenar modelos con conjuntos de datos que son demasiado grandes para la capacidad de la memoria, sin necesidad de modificar el código.
Genere código C/C++ portátil y legible para inferir modelos de clasificación y regresión, estadísticas descriptivas y distribuciones de probabilidad. Genere código C/C++ de predicción con precisión reducida, y actualice parámetros de modelos desplegados sin necesidad de volver a generar el código de predicción.
30 días de exploración a su alcance.
Obtenga información sobre precios y explore productos relacionados.
Es posible que su centro educativo ya ofrezca acceso a MATLAB, Simulink y otros productos complementarios mediante una infraestructura Campus-Wide License.