Análisis predictivo
Tres cosas que es necesario saber
Tres cosas que es necesario saber
El análisis predictivo emplea datos históricos para predecir eventos futuros. Normalmente, los datos históricos se utilizan para crear un modelo matemático que capture las tendencias importantes. Este modelo predictivo se usa entonces con los datos actuales para predecir lo que pasará a continuación, o bien para sugerir acciones que llevar a cabo con el fin de obtener resultados óptimos.
El análisis predictivo ha recibido mucha atención en los últimos años debido a los avances en la tecnología que lo respalda, especialmente en las áreas de big data y aprendizaje automático.
A menudo se habla del análisis predictivo en el contexto del big data; los datos de ingeniería, por ejemplo, proceden de sensores, instrumentos y sistemas conectados del mundo real. Los datos de sistemas empresariales de una compañía podrían incluir datos de transacciones, resultados de ventas, quejas de clientes e información sobre marketing. Cada vez más, los negocios toman decisiones basadas en los datos procedentes de esta valiosa mina de información.
Con el aumento en la competitividad, los negocios buscan una ventaja a la hora de proporcionar productos y servicios a mercados saturados. Los modelos predictivos basados en datos pueden ayudar a las empresas a resolver problemas de toda la vida de maneras nuevas.
Los fabricantes de equipos, por ejemplo, pueden encontrar difícil innovar en el hardware exclusivamente. Los desarrolladores de productos pueden agregar capacidades predictivas a las soluciones existentes para aumentar el valor de cara al cliente. El uso del análisis predictivo para el mantenimiento de equipos, o mantenimiento predictivo, puede anticipar fallos de los equipos, pronosticar las necesidades de energía y reducir los costes operativos. Por ejemplo, los sensores que miden las vibraciones de las piezas de automoción pueden indicar la necesidad de mantenimiento antes de que el vehículo falle en carretera.
Las empresas también utilizan el análisis predictivo para crear predicciones más precisas, tales como pronosticar la demanda de electricidad de la red de suministro. Estas predicciones permiten planificar los recursos (por ejemplo, la planificación de diversas plantas de energía) de manera más efectiva.
Con el propósito de extraer valor del big data, los negocios aplican algoritmos a grandes conjuntos de datos mediante herramientas como Hadoop y Spark. Las fuentes de datos pueden ser bases de datos transaccionales, archivos de registro de equipos, imágenes, vídeo, audio, datos de sensores u otros tipos de datos. La innovación a menudo surge de la combinación de los datos de diversas fuentes.
Con todos estos datos, se necesitan herramientas para extraer conocimiento y tendencias. Las técnicas de aprendizaje automático se emplean para localizar patrones en los datos y crear modelos que pronostiquen los resultados futuros. Hay disponible una amplia gama de algoritmos de aprendizaje automático, incluidos regresión lineal y no lineal, redes neuronales, máquinas de vectores de soporte, árboles de decisión, etc.
El análisis predictivo ayuda a los equipos de sectores tan diversos como los siguientes: financiero, sanidad, farmacéutico, automoción, aeroespacial y fabricación.
El análisis predictivo es el proceso de utilizar el análisis de datos para realizar predicciones basadas en los datos. En este proceso se hace uso de los datos junto con técnicas analíticas, estadísticas y de aprendizaje automático a fin de crear un modelo predictivo para predecir eventos futuros.
El término “análisis predictivo” describe la aplicación de una técnica estadística o de aprendizaje automático para crear una predicción cuantitativa sobre el futuro. Con frecuencia, se utilizan técnicas de aprendizaje automático supervisado para predecir un valor futuro (¿Cuánto tiempo puede funcionar esta máquina antes de necesitar mantenimiento?) o para calcular una probabilidad (¿Qué posibilidad existe de que este cliente no pueda pagar un préstamo?).
El análisis predictivo empieza con un objetivo comercial: utilizar los datos para reducir los residuos, ahorrar tiempo o reducir costes. El proceso emplea conjuntos de datos heterogéneos, a menudo masivos, en modelos que pueden generar resultados claros y permiten actuar sobre ellos con el objetivo de lograr el resultado en cuestión, ya sea reducir los materiales de desecho, reducir el inventario o fabricar productos que coincidan con las especificaciones.
Todos estamos familiarizados con los modelos predictivos para la previsión meteorológica. Una de las aplicaciones cruciales de los modelos predictivos está relacionada con la predicción de la carga energética para pronosticar la demanda. En este caso, los productores de energía, los operadores de la red de suministro y los distribuidores necesitan predicciones precisas sobre la carga energética para tomar decisiones encaminadas a la gestión de las cargas en la red eléctrica. Hay disponibles grandes cantidades de datos y, mediante el análisis predictivo, los operadores pueden convertir esta información en conocimiento que permite pasar a la acción.
Figura 1. Flujo de trabajo de análisis predictivo.
Normalmente, el flujo de trabajo para una aplicación de análisis predictivo incluye los siguientes pasos básicos.
Figura 2. Aplicación de análisis predictivo para la predicción de la carga energética en el estado de Nueva York.
Los datos agregados cuentan una historia compleja. Para extraer el conocimiento que albergan, se necesita un modelo predictivo preciso.
El modelado predictivo utiliza métodos matemáticos y de cálculo para predecir un evento o un resultado. Estos modelos pronostican un resultado en algún estado o tiempo futuros en función de los cambios en las entradas del modelo. Mediante un proceso iterativo, se desarrolla el modelo mediante un conjunto de datos de entrenamiento y después se prueba y se valida para determinar su precisión con el fin de realizar predicciones. Puede probar distintos enfoques de aprendizaje automático para localizar el modelo más efectivo.
Algunos ejemplos son modelos de regresión de series temporales para predecir el volumen de tráfico aéreo o predecir la eficiencia del combustible en función de un modelo de regresión lineal del motor frente a la carga.
La organizaciones que han implementado correctamente el análisis predictivo consideran el análisis prescriptivo como el siguiente objetivo. El análisis predictivo crea una estimación de lo que pasará a continuación; el análisis prescriptivo indica cómo reaccionar de la mejor forma posible de acuerdo con la predicción.
El análisis prescriptivo es una rama del análisis de datos que emplea modelos predictivos para sugerir las acciones que realizar a fin de obtener resultados óptimos. El análisis prescriptivo confía en la optimización y en las técnicas basadas en reglas para tomar decisiones. Pronosticar la carga en la red eléctrica durante las siguientes 24 horas es un ejemplo de análisis predictivo, mientras que decidir cómo gestionar las plantas energéticas en función de esta predicción representa el análisis prescriptivo.
Las empresas están encontrando formas innovadoras de aplicar el análisis predictivo mediante MATLAB® para crear nuevos productos y servicios, así como para resolver problemas de toda la vida de maneras nuevas.
Los ejemplos siguientes ilustran el análisis predictivo en acción.
Los camiones de Baker Hughes están equipados con bombas de desplazamiento positivo que inyectan una mezcla de agua y arena en lo más profundo de los pozos perforados. Estas bombas suponen alrededor de 100 000 dólares de los 1,5 millones que cuesta en total el camión, así que Baker Hughes necesitaba determinar cuándo una bomba estaba a punto de fallar. Procesaron y analizaron un terabyte de datos recopilados en 50 000 muestras por segundo mediante sensores instalados en diez camiones que trabajaban sobre el terreno, y entrenaron una red neuronal para utilizar los datos de los sensores con objeto de predecir los fallos de las bombas. Se espera que el software reduzca los costes de mantenimiento en un 30 %-40 % (es decir, más de diez millones de dólares).
Los sistemas de calefacción, ventilación y aire acondicionado (HVAC) de grandes edificios comerciales son ineficientes a menudo porque no tienen en cuenta los patrones de clima variables, los costes variables de la energía o las propiedades térmicas de los edificios. La plataforma de software basada en la nube de BuildingIQ emplea algoritmos avanzados para procesar continuamente gigabytes de información procedente de medidores de potencia, termómetros y sensores de presión HVAC. El aprendizaje automático se emplea para segmentar los datos y determinar las contribuciones relativas del gas, la electricidad, el vapor y la energía solar en los procesos de calefacción y refrigeración. Se emplea la optimización para determinar la mejor planificación de calefacción y refrigeración en cada edificio a lo largo del día. La plataforma de BuildingIQ reduce el consumo de energía de climatización en edificios comerciales de gran tamaño en un 10%–25% durante el funcionamiento normal.
Las falsas alarmas de los electrocardiógrafos y otros dispositivos de monitorización de pacientes son un problema serio en las unidades de cuidados intensivos (UCI). El ruido de las falsas alarmas perturba el sueño de los pacientes y las alarmas falsas frecuentes insensibilizan al personal clínico frente a las advertencias reales. Los participantes en el PhysioNet/Computing in Cardiology Challenge debían desarrollar algoritmos que pudieran distinguir entre alarmas reales y falsas en las señales registradas por los dispositivos de monitorización de la UCI. Los investigadores de la Academia de las Ciencias de la República Checa obtuvieron el primer puesto en la categoría de tiempo real del reto con algoritmos de MATLAB que podían detectar complejos QRS, distinguir entre latidos normales y ventriculares, y filtrar los complejos QRS falsos provocados por estímulos de un marcapasos. Los algoritmos produjeron una tasa de positivos reales (TPR) y una tasa de negativos reales (TNR) del 92% y el 88%, respectivamente.
Para desvelar el valor de los datos empresariales y de ingeniería con objeto de tomar decisiones informadas, los equipos que desarrollan aplicaciones de análisis predictivo recurren a MATLAB cada vez con más frecuencia.
Mediante las herramientas y las funciones de MATLAB, es posible llevar a cabo análisis predictivos con datos de ingeniería, datos científicos y datos de campo, así como datos empresariales y transaccionales. MATLAB permite implementar aplicaciones predictivas en sistemas de producción a gran escala y sistemas embebidos.
Figura 3. MATLAB para el análisis predictivo.
Según esta visión simplificada, los datos de ingeniería proceden de sensores, instrumentos y sistemas conectados del mundo real. Los datos se recopilan y almacenan en un sistema de archivos, ya sea de forma local o en la nube.
Figura 4. Arquitectura del análisis basado en los datos de ingeniería.
“No importa el sector al que pertenezca el cliente ni los datos que nos pida analizar —texto, audio, imágenes o vídeo—, el código de MATLAB nos permite proporcionar resultados claros con mayor rapidez.”
Estos datos se combinan con datos procedentes de sistemas empresariales tradicionales tales como datos sobre costes, resultados de ventas, quejas de clientes e información sobre marketing.
Tras ello, un ingeniero o experto en la materia desarrolla los análisis mediante MATLAB. Casi siempre se requiere preprocesamiento para gestionar los datos ausentes, los datos atípicos u otros problemas de calidad de los datos no previstos. Al hilo de esto, se emplean métodos analíticos tales como las estadísticas y el aprendizaje automático para producir una “analítica”, es decir, un modelo predictivo de su sistema.
Para que resulte útil, ese modelo predictivo se despliega entonces —ya sea en un entorno de TI de producción que alimente un sistema transaccional o de TI en tiempo real, como un sitio de comercio electrónico o un dispositivo embebido— en un sensor, un controlador o un sistema inteligente del mundo real, como podría ser un vehículo autónomo.
La aplicación de MATLAB y Simulink® como parte de esta arquitectura resulta ideal, ya que las herramientas permiten vías de implementación fáciles en sistemas embebidos gracias al diseño basado en modelos, o bien en sistemas de TI gracias a productos de despliegue de aplicaciones.
Figura 5. Implementación de modelos predictivos en sistemas embebidos y sistemas de TI.
“MATLAB ha contribuido a acelerar nuestros procesos de I+D y despliegue con sus robustos algoritmos numéricos, sus exhaustivas herramientas de visualización y análisis, las rutinas de optimización fiables, soporte a la programación orientada a objetos y la capacidad de ejecución en la nube con nuestras aplicaciones Java de producción.”
Amplíe sus conocimientos con documentación, ejemplos, vídeos y mucho más.
Explore áreas temáticas similares comúnmente asociadas con productos de MATLAB y Simulink.
30 días de exploración a su alcance
Más informaciónSeleccione un país/idioma
Seleccione un país/idioma para obtener contenido traducido, si está disponible, y ver eventos y ofertas de productos y servicios locales. Según su ubicación geográfica, recomendamos que seleccione: .
También puede seleccionar uno de estos países/idiomas:
Cómo obtener el mejor rendimiento
Seleccione China (en idioma chino o inglés) para obtener el mejor rendimiento. Los sitios web de otros países no están optimizados para ser accedidos desde su ubicación geográfica.
América
Europa