Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Amplíe los arreglos altos con otros productos

Productos utilizados: Statistics and Machine Learning Toolbox™, Database Toolbox™, Parallel Computing Toolbox™, MATLAB® Distributed Computing Server™, MATLAB Compiler™

Varias cajas de herramientas mejoran las capacidades de los arreglos altos. Estas mejoras incluyen la escritura de algoritmos de aprendizaje de la máquina, la integración con grandes sistemas de datos, y la implementación de aplicaciones independientes.

Estadísticas y aprendizaje de máquinas

Statistics and Machine Learning Toolbox le permite realizar cálculos estadísticos avanzados en arreglos de discos altos. Las capacidades incluyen:

  • Clustering K-means

  • Ajuste de regresión lineal

  • Estadísticas agrupadas

  • Clasificación

Consulte Analysis of Big Data with Tall Arrays (Statistics and Machine Learning Toolbox) para obtener más información.

Controla dónde se ejecuta el código

Cuando se ejecutan cálculos en matrices altas, el entorno de ejecución predeterminado utiliza la sesión MATLAB local o una agrupación paralela local si tiene Parallel Computing Toolbox. Utilice la función mapreducer para cambiar el entorno de ejecución de las matrices altas al utilizar Parallel Computing Toolbox, MATLAB Distributed Computing ServerO MATLAB Compiler:

  • Parallel Computing Toolbox — Ejecuta cálculos en paralelo usando trabajadores locales para acelerar grandes cálculos de arreglo de discos altos. Consulte Use Tall Arrays on a Parallel Pool (Parallel Computing Toolbox) para obtener más información.

  • MATLAB Distributed Computing Server : Permite ejecutar cálculos de arreglo de discos altos en un clúster, incluidos los clústeres Hadoop® habilitados para Apache Spark™ . Esto puede reducir significativamente el tiempo de ejecución de cálculos muy grandes. Consulte Use Tall Arrays on a Spark Enabled Hadoop Cluster (Parallel Computing Toolbox) para obtener más información.

  • MATLAB Compiler : Implemente aplicaciones MATLAB que contengan arreglos altos como aplicaciones independientes en Apache Spark. Consulte Spark Applications (MATLAB Compiler) para obtener más información.

Uno de los beneficios de desarrollar sus algoritmos con arreglos altos es que sólo tiene que escribir el código una vez. Usted puede desarrollar su código localmente, a continuación, utilizar mapreducer para ampliar y aprovechar las capacidades ofrecidas por Parallel Computing Toolbox, MATLAB Distributed Computing ServerO MATLAB Compiler, sin necesidad de reescribir su algoritmo.

Nota

Cada matriz alta está enlazada a un único entorno de ejecución cuando se construye usando tall(ds). Si el entorno de ejecución se modifica o elimina posteriormente, la matriz alta se convierte en inválida.

Por esta razón, cada vez que cambie el entorno de ejecución debe reconstruir la matriz alta.

Trabajar con bases de datos

Database Toolbox permite crear una tabla alta a partir de un DatabaseDatastore que está respaldado por datos de una base de datos. Para obtener más información, consulte .

Nota

DatabaseDatastore tiene estas limitaciones:

  • DatabaseDatastore debe utilizar la sesión MATLAB local como entorno de ejecución. Configure este entorno mediante el comando mapreducer(0).

  • Las aplicaciones independientes que contienen matrices altas que utilizan DatabaseDatastore no se pueden implementar contra Apache Spark mediante MATLAB Compiler.

Consulte también

| |

Temas relacionados