MATLAB® cuenta con diversas capacidades para explorar y analizar conjuntos de Big Data. Entre ellas se encuentra MapReduce, una potente y consolidada técnica de programación que permite aplicar filtrado, estadísticas y otros métodos de análisis generales al Big Data.
La funcionalidad de MapReduce integrada en MATLAB permite analizar datos que no caben en la memoria. Al ejecutar los algoritmos basados en MapReduce de forma paralela (mediante Parallel Computing Toolbox™), se pueden aprovechar mejor los recursos de procesamiento del equipo sin cambiar los algoritmos.
Para analizar datos en MATLAB mediante MapReduce:
Aunque MapReduce de MATLAB se ha optimizado para el análisis basado en arrays, es totalmente compatible con MapReduce de Hadoop, así que puede ejecutar sus algoritmos basados en MapReduce dentro del marco correspondiente a MapReduce para Hadoop:
- Ejecute en Hadoop los algoritmos basados en MapReduce directamente desde el escritorio de MATLAB gracias a MATLAB Parallel Server™.
- Empaquete los algoritmos basados en MapReduce para su despliegue en sistemas de producción basados en Hadoop gracias a MATLAB Compiler™.
MapReduce en el escritorio
Explore y analice conjuntos de Big Data en su escritorio con la técnica de programación MapReduce integrada en MATLAB.
Creación de algoritmos mediante MapReduce: máximo, media, media por grupo, histogramas, covarianza y cantidades relacionadas, estadísticas de resumen por grupo, regresión logística, QR alta y delgada
MapReduce en Hadoop
Ejecute los algoritmos basados en MapReduce de MATLAB dentro de MapReduce de Hadoop para explorar y analizar los datos almacenados y gestionados en Hadoop mediante MATLAB Parallel Server.
Cree aplicaciones y bibliotecas basadas en MapReduce de MATLAB para su despliegue en instancias de producción de Hadoop mediante MATLAB Compiler.
Véase también: Big Data con MATLAB, Análisis predictivo