Main Content

dataset Clase

(No recomendado) Arreglos para datos estadísticos

El tipo de datos dataset no se recomienda. Para trabajar con datos heterogéneos, utilice el tipo de datos table de MATLAB® en su lugar. Para obtener más información, consulte la documentación de table de MATLAB.

Descripción

Los arreglos de conjuntos de datos se utilizan para recopilar datos y metadatos heterogéneos, incluyendo los nombres de variables y observaciones, en una única variable contenedora. Los arreglos de conjuntos de datos son adecuados para almacenar datos tabulares u orientados a columnas que suelen almacenarse como columnas en un archivo de texto o en una hoja de cálculo, y pueden dar cabida a variables de distintos tipos, tamaños, unidades, etc.

Los arreglos de conjuntos de datos pueden contener distintos tipos de variables, como numéricas, lógicas, de caracteres, de cadena, categóricas y de celda. Sin embargo, la clase de un arreglo de conjuntos de datos es diferente de las variables que contiene. Por ejemplo, incluso un arreglo de conjuntos de datos que solo contenga variables que sean arreglos dobles no puede utilizarse como si el propio arreglo de conjuntos de datos fuera un arreglo doble. Sin embargo, si se utiliza la notación de puntos, puede operar con una variable de un arreglo de conjunto de datos como si fuera una variable del área de trabajo.

Se puede utilizar la notación de paréntesis con arreglos de conjuntos de datos, de forma muy similar a los arreglos numéricos ordinarios, pero además de índices numéricos y lógicos, puede utilizar nombres de variables y observaciones como índices.

Construcción

Utilice el constructor dataset para crear un arreglo de conjuntos de datos a partir de variables en el área de trabajo de MATLAB. También puede crear un arreglo de conjuntos de datos leyendo datos de un archivo de texto u hoja de cálculo. Puede acceder a cada variable de un arreglo de conjuntos de datos como si se tratara de campos de una estructura, utilizando la indexación por puntos mediante subíndices. Para ver una lista de las operaciones disponibles para los arreglos de conjuntos de datos, consulte la siguiente sección.

dataset(Not Recommended) Construct dataset array

Métodos

cat(Not Recommended) Concatenate dataset arrays
cellstr(Not Recommended) Create cell array of character vectors from dataset array
dataset2cell(Not Recommended) Convert dataset array to cell array
dataset2struct(Not Recommended) Convert dataset array to structure
datasetfun(Not Recommended) Apply function to dataset array variables
disp(Not Recommended) Display dataset array
display(No recomendado) Mostrar un arreglo de tipo dataset
double(Not Recommended) Convert dataset variables to double array
end(No se recomienda) Último índice en la expresión de indexación del arreglo del conjunto de datos
export(Not Recommended) Write dataset array to file
get(Not Recommended) Access dataset array properties
horzcat(Not Recommended) Horizontal concatenation for dataset arrays
intersect(Not Recommended) Set intersection for dataset array observations
isempty(Not Recommended) True for empty dataset array
ismember(Not Recommended) Dataset array elements that are members of set
ismissing(Not Recommended) Find dataset array elements with missing values
join(Not Recommended) Merge dataset array observations
length(Not Recommended) Length of dataset array
ndims(Not Recommended) Number of dimensions of dataset array
numel(Not Recommended) Number of elements in dataset array
replaceWithMissing(Not Recommended) Insert missing data indicators into a dataset array
replacedata(Not Recommended) Replace dataset variables
set(Not Recommended) Set and display dataset array properties
setdiff(Not Recommended) Set difference for dataset array observations
setxor(Not Recommended) Set exclusive or for dataset array observations
single(Not Recommended) Convert dataset variables to single array
size(Not Recommended) Size of dataset array
sortrows(Not Recommended) Sort rows of dataset array
stack(Not Recommended) Stack dataset array from multiple variables into single variable
subsasgn(Not Recommended) Subscripted assignment to dataset array
subsref(Not Recommended) Subscripted reference for dataset array
summary(Not Recommended) Print summary of dataset array
union(Not Recommended) Set union for dataset array observations
unique(Not Recommended) Unique observations in dataset array
unstack(Not Recommended) Unstack dataset array from single variable into multiple variables
vertcat(Not Recommended) Vertical concatenation for dataset arrays

Propiedades

Un arreglo de conjuntos de datos D tiene propiedades que almacenan metadatos (información sobre los datos). Acceda a estos metadatos o asígnelos a una propiedad mediante P = D.Properties.PropName o D.Properties.PropName = P, donde PropName es uno de los siguientes:

Description

Description es un vector de caracteres que describe el arreglo de conjuntos de datos. El valor predeterminado es un vector de caracteres vacío.

DimNames

Un arreglo de celdas de dos elementos de vectores de caracteres que da los nombres de las dos dimensiones del arreglo de conjuntos de datos. El valor predeterminado es {'Observations' 'Variables'}.

ObsNames

Un arreglo de celdas de vectores de caracteres distintos y no vacíos que da los nombres de las observaciones del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de observaciones.

Units

Un arreglo de celdas de vectores de caracteres que da las unidades de las variables del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de variables. Cualquier vector de caracteres individual puede estar vacío para una variable que no tenga unidades definidas. El valor predeterminado es un arreglo de celdas vacío.

UserData

Cualquier variable que contenga información adicional que deba asociarse al arreglo de conjuntos de datos. El valor predeterminado es un arreglo vacío.

VarDescription

Un arreglo de celdas de vectores de caracteres que da las descripciones de las variables del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de variables. Cualquier vector de caracteres individual puede estar vacío para una variable que no tenga una descripción definida. El valor predeterminado es un arreglo de celdas vacío.

VarNames

Un arreglo de celdas de vectores de caracteres distintos y no vacíos que da los nombres de las variables del arreglo de conjuntos de datos. El número de vectores de caracteres debe ser igual al número de variables. El valor predeterminado es el arreglo de celdas de los nombres de las variables utilizadas para crear el conjunto de datos.

Semántica de copia

Valor. Para saber cómo afecta esto al uso de la clase, consulte Comparing Handle and Value Classes en la documentación sobre la programación orientada a objetos de MATLAB.

Ejemplos

Cargue un arreglo de conjuntos de datos desde un archivo .mat y cree algunos subconjuntos sencillos:

load hospital
h1 = hospital(1:10,:)
h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'})

% Access and modify metadata
hospital.Properties.Description
hospital.Properties.VarNames{4} = 'Wgt'

% Create a new dataset variable from an existing one
hospital.AtRisk = hospital.Smoker | (hospital.Age > 40)

% Use individual variables to explore the data
boxplot(hospital.Age,hospital.Sex)
h3 = hospital(hospital.Age<30,...
   {'LastName' 'Age' 'Sex' 'Smoker'})

% Sort the observations based on two variables
h4 = sortrows(hospital,{'Sex','Age'})

Consulte también

| |