Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Datastore

Read large collections of data

The datastore function creates a datastore, which is a repository for collections of data that are too large to fit in memory. A datastore allows you to read and process data stored in multiple files on a disk, a remote location, or a database as a single entity. If the data is too large to fit in memory, you can manage the incremental import of data, create a tall array to work with the data, or use the datastore as an input to mapreduce for further processing. For more information, see Introducción al almacén de.

Funciones

expandir todo

datastoreCreate datastore for large collections of data
TabularTextDatastoreDatastore for tabular text files
SpreadsheetDatastoreDatastore for spreadsheet files
ImageDatastoreDatastore for image data
FileDatastoreDatastore with custom file reader
KeyValueDatastoreDatastore for key-value pair data for use with mapreduce
TallDatastoreDatastore for checkpointing tall arrays
readRead data in datastore
readallRead all data in datastore
previewSubset of data in datastore
partitionPartition a datastore
numpartitionsNumber of datastore partitions
hasdataDetermine if data is available to read
resetReset datastore to initial state

Clases

expandir todo

matlab.io.Datastore Base datastore class
matlab.io.datastore.PartitionableAdd parallelization support to datastore
matlab.io.datastore.HadoopFileBased(Not recommended) Add Hadoop file support to datastore
matlab.io.datastore.DsFileSet File-set object for collection of files in datastore
matlab.io.datastore.DsFileReader File-reader object for files in a datastore

Temas

Introducción al almacén de

Un almacén de datos es un objeto para la lectura de un solo archivo o una colección de archivos o información.

Select Datastore for File Format or Application

Choose the right datastore based on the file format of your data or application.

Leer y analizar archivos de texto tabulares grandes

En este ejemplo se muestra cómo crear un almacén de datos para un archivo de texto de gran tamaño que contiene información tabular y, a continuación, leer y procesar los datos de un fragmento a la vez o de un archivo a la vez.

Leer y analizar archivos de imagen

En este ejemplo se muestra cómo crear un almacén de datos para una colección de imágenes, leer los archivos de imagen y buscar las imágenes con el tono, la saturación y el brillo promedio máximo (HSV).

Lea y analice el archivo MAT con datos de valor clave

En este ejemplo se muestra cómo crear un almacén de datos para los valores de par clave-valor en un archivo MAT que es la salida de mapreduce.

Leer y analizar el archivo de secuencia Hadoop

En este ejemplo se muestra cómo crear un almacén de datos para un archivo de secuencia que contenga información de valor clave.

Leer datos remotos

Utilice datastore para acceder a datos remotos en Amazon S3™, Windows Azure® BLOB Storage o HDFS™.

Configurar almacén de equipos para su procesamiento en diferentes máquinas o clústeres

Configure un almacén de equipos en el equipo que se pueda cargar y procesar en otro equipo o clúster.

Desarrollo de almacenes de almacenamiento personalizados

Cree un almacén de datos completamente personalizado para su información personalizada o propietaria.

Directrices de prueba para almacenes de almacenamiento personalizados

Después de implementar su almacén de resultados personalizado, siga este procedimiento de prueba para calificar su almacén de almacenamiento personalizado.