Técnica de Machine Learning para crear modelos predictivos a partir de datos de entrada y respuesta conocidos

El aprendizaje supervisado es un tipo de algoritmo de Machine Learning que emplea un conjunto de datos conocidos (el denominado conjunto de datos de entrenamiento) para realizar predicciones. El conjunto de datos de entrenamiento incluye datos de entrada y valores de respuesta. A partir de él, el algoritmo de aprendizaje supervisado busca crear un modelo que pueda realizar predicciones acerca de los valores de respuesta para un nuevo conjunto de datos. Con frecuencia se utiliza un conjunto de datos de prueba para validar el modelo. Si se utilizan conjuntos de datos de entrenamiento de mayor tamaño, a menudo se generan modelos cuya capacidad predictiva es mayor y que se pueden aplicar con buenos resultados sobre nuevos conjuntos de datos.

El aprendizaje supervisado incluye dos categorías de algoritmos:

  • Clasificación: para valores de respuesta categóricos, en los que los datos se pueden separar en “clases” específicas
  • Regresión: para valores de respuesta continua

Entre los algoritmos de clasificación comunes se incluyen:

Entre los algoritmos de regresión comunes se incluyen:

Para obtener más detalles sobre los algoritmos de aprendizaje supervisado, consulte Statistics and Machine Learning Toolbox™ y Deep Learning Toolbox™.

El aprendizaje supervisado se emplea en aplicaciones financieras para la calificación crediticia, el trading algorítmico y la calificación de bonos; en aplicaciones biológicas para la detección de tumores y el descubrimiento de fármacos; en aplicaciones energéticas para la predicción de carga y precio; y en aplicaciones de reconocimiento de patrones para el habla y las imágenes.

Common classification algorithms include:

Regression: Used for numerical continuous-response values. You can train regression models with the Regression Learner app with MATLAB.

Common regression algorithms include:

Supervised Learning Applications

Supervised learning is used in financial applications for credit scoring, algorithmic trading, and bond classification, in image and video applications for object classification and tracking, in industrial applications for outlier detection, in predictive maintenance for life of equipment estimates, in biological applications for tumor detection and drug discovery, and in energy applications for price and load forecasting.

Example

Let's assume you want to predict housing prices and have historical data on the housing sales with home sizes, locations, and year sold as features, and the actual sale price as known response. That is an excellent use case for supervised regression, and you can try this out yourself in this example. The weights of a linear model shown below make sense: type and size of home, year built, and neighborhood indeed determine home values. The residual plot indicates the linear model captures the relationship between variables and price reasonably well



También puede consultar estos temas: Statistics and Machine Learning Toolbox, redes neuronales, aprendizaje automático, unsupervised learning, AdaBoost, regresión lineal, nonlinear regression, ajuste de datos, data analysis, mathematical modeling, análisis predictivo, artificial intelligence, AutoML, regularization

Probar Statistics and Machine Learning Toolbox

How much do you know about machine learning?