Main Content

Calcular con estadísticas descriptivas

Si necesita funcionalidades estadísticas más avanzadas, es posible que quiera utilizar el software Statistics and Machine Learning Toolbox™.

Funciones para calcular estadísticas descriptivas

Utilice las siguientes funciones de MATLAB® para calcular estadísticas descriptivas para sus datos.

Nota

Para datos de matrices, las estadísticas descriptivas de cada columna se calculan de forma independiente.

Resumen de funciones de estadísticas

Función

Descripción

max

Valor máximo

mean

Valor medio o promedio

median

Valor de la mediana

min

Valor más pequeño

mode

Valor más frecuente

std

Desviación estándar

var

Varianza, que mide la extensión o dispersión de los valores

En los ejemplos siguientes se aplican las funciones de MATLAB para calcular estadísticas descriptivas:

Ejemplo 1: calcular el valor máximo, la media y la desviación estándar

En este ejemplo se muestra cómo utilizar las funciones de MATLAB para calcular el valor máximo, la media y la desviación estándar para una matriz de 24 por 3 llamada count. MATLAB calcula estas estadísticas independientemente para cada columna de la matriz.

% Load the sample data
load count.dat
% Find the maximum value in each column
mx = max(count)
% Calculate the mean of each column
mu = mean(count)
% Calculate the standard deviation of each column
sigma = std(count)

Los resultados son

mx =
          114          145          257

mu = 
      32.0000      46.5417      65.5833

sigma =
      25.3703      41.4057      68.0281

Para obtener los números de fila en los que se producen los valores máximos en cada columna de datos, especifique un segundo parámetro de salida indx para devolver el índice de la fila. Por ejemplo:

[mx,indx] = max(count)

Estos resultados son

mx =
      114     145     257

indx =
      20    20    20

En este caso, la variable mx es un vector fila que contiene el valor máximo en cada una de las tres columnas de datos. La variable indx contiene los índices de la fila de cada columna que corresponden a los valores máximos.

Para encontrar el valor mínimo de toda la matriz count, convierta la matriz de 24 por 3 en un vector columna de 72 por 1 utilizando la sintaxis count(:). Después, para encontrar el valor mínimo en la única columna, utilice la siguiente sintaxis:

min(count(:))

ans =
      7

Ejemplo 2: restar la media

Reste la media de cada columna de la matriz utilizando la siguiente sintaxis:

% Get the size of the count matrix
[n,p] = size(count)
% Compute the mean of each column
mu = mean(count)
% Create a matrix of mean values by
% replicating the mu vector for n rows
MeanMat = repmat(mu,n,1)
% Subtract the column mean from each element
% in that column
x = count - MeanMat

Nota

Restar la media de los datos también se denomina eliminación de tendencia. Para obtener más información acerca de la eliminación de la media o la línea mejor ajustada de los datos, consulte Eliminar tendencias lineales de datos en tablas horarias.

Ejemplo: Usar las Estadísticas de datos en MATLAB

Estadísticas de datos

El cuadro de diálogo Estadísticas de datos le ayuda a calcular y representar estadísticas descriptivas con los datos. En este ejemplo se muestra cómo utilizar las Estadísticas de datos en MATLAB para calcular y representar estadísticas para una matriz de 24 por 3, denominada count. Los datos representan la cantidad de vehículos que pasaron por estaciones de recuento de tráfico en tres calles.

Esta sección contiene los siguientes temas:

Nota

Las Estadísticas de datos en MATLAB solo están disponibles para gráficas 2D.

Calcular y representar estadísticas descriptivas

  1. Cargue y represente los datos:

    load count.dat
    [n,p] = size(count);
    
    % Define the x-values
    t = 1:n;
    
    % Plot the data and annotate the graph
    plot(t,count)
    legend('Station 1','Station 2','Station 3','Location','northwest')
    xlabel('Time')
    ylabel('Vehicle Count')
    

    Plot of Time and Vehicle Count variables with lines for Station 1, Station 2, and Station 3 data.

    Nota

    La leyenda contiene el nombre de cada conjunto de datos, como se especifica mediante la función legend: Station 1, Station 2 y Station 3. Un conjunto de datos hace referencia a cada columna de datos del arreglo que ha representado. Si no asigna un nombre a los conjuntos de datos, se asignan nombres por defecto: data1, data2, etc.

  2. En la ventana Figura, seleccione Tools > Data Statistics.

    Se abre el cuadro de diálogo Estadísticas de datos y se muestran estadísticas descriptivas para los datos de X e Y del conjunto de datos Station 1.

    Nota

    El cuadro de diálogo Estadísticas de datos muestra un rango, que es la diferencia entre los valores mínimo y máximo del conjunto de datos seleccionado. El cuadro de diálogo no muestra el rango en la gráfica.

  3. Seleccione un conjunto de datos diferente en la lista Data Statistics for: Station 2.

    Se muestran estadísticas descriptivas para los datos de X e Y del conjunto de datos Station 2.

  4. Seleccione la casilla de verificación para cada estadística que quiera mostrar en la gráfica y, después, haga clic en Save to Workspace.

    Por ejemplo, para representar la media de Station 2, seleccione la casilla de verificación mean de la columna Y.

    Data Statistics dialog with the Station 2 y mean selected.

    Esto traza una línea horizontal para representar la media de Station 2 y actualiza la leyenda para incluir esta estadística.

    Plot of Time and Vehicle Count variables with a horizontal line representing the y mean.

Formato de las estadísticas de datos en gráficas

El cuadro de diálogo Estadísticas de datos utiliza colores y estilos de línea para distinguir las estadísticas de los datos de la gráfica. Esta parte del ejemplo muestra cómo personalizar la visualización de las estadísticas descriptivas en una gráfica, como el color, la anchura de línea, el estilo de línea o el marcador.

Nota

No edite las propiedades de visualización de las estadísticas hasta que termine de representar todas las estadísticas con los datos. Si añade o elimina estadísticas después de editar las propiedades de la gráfica, se perderán los cambios en las propiedades de la gráfica.

Para modificar la visualización de estadísticas de datos en una gráfica:

  1. En la ventana Figura de MATLAB, haga clic en el botón de la barra de herramientas (Edit Plot).

    Este paso permite la edición de la gráfica.

  2. Haga doble clic en la estadística de la gráfica en la que desea editar las propiedades de visualización. Por ejemplo, haga doble clic en la línea horizontal que representa la media de Station 2.

    Este paso abre el Inspector de propiedades, donde puede modificar la apariencia de la línea utilizada para representar esta estadística.

    Property Inspector dialog with line color, line style, line width, marker type, and marker size options.

  3. En la ventana Inspector de propiedades, especifique los estilos, tamaños y colores de línea y del marcador.

    Sugerencia

    También puede hacer clic con el botón secundario en la estadística de la gráfica y seleccionar una opción del menú contextual.

Guardar estadísticas en el área de trabajo de MATLAB

Siga estos pasos para guardar las estadísticas en el área de trabajo de MATLAB.

Nota

Cuando la gráfica contenga varios conjuntos de datos, guarde las estadísticas de cada conjunto de datos de forma individual. Para mostrar las estadísticas de un conjunto de datos diferente, selecciónelo en la lista de Data Statistics for del cuadro de diálogo Estadísticas de datos.

  1. En el cuadro de diálogo Estadísticas de datos, haga clic en el botón Save to Workspace.

  2. En el cuadro de diálogo Guardar estadísticas en el área de trabajo, seleccione las opciones para guardar estadísticas para datos de X, datos de Y o ambas. Después, introduzca los nombres de las variables correspondientes.

    En este ejemplo, guarde solo los datos de Y. Introduzca el nombre de la variable como Loc2countstats.

    Dialog specifying to save Y stats to a MATLAB struct named Loc2countstats.

  3. Haga clic en OK.

    Este paso guarda las estadísticas descriptivas en una estructura. La nueva variable se añade al área de trabajo de MATLAB.

Para ver la nueva variable de estructura, escriba el nombre de la variable en la línea de comandos de MATLAB:

Loc2countstats
Loc2countstats = 

  struct with fields:

       min: 9
       max: 145
      mean: 46.5417
    median: 36
      mode: 9
       std: 41.4057
     range: 136

Generar archivos de código

En esta parte del ejemplo se muestra cómo generar un archivo que contiene el código de MATLAB que reproduce el formato de la gráfica y las estadísticas representadas con nuevos datos. La generación de un archivo de código no está disponible en MATLAB Online™.

  1. En la ventana Figura, seleccione File > Generate Code.

    En este paso se crea un archivo de código de función y se muestra en el editor de MATLAB.

  2. Cambie el nombre de la función de la primera línea del archivo de createfigure a algo más específico, como countplot. Guarde el archivo en la carpeta actual con el nombre de archivo countplot.m.

  3. Genere algunos datos de recuento nuevos aleatorios:

    rng('default')
    randcount = 300*rand(24,3);
  4. Reproduzca la gráfica con los nuevos datos y las estadísticas recalculadas:

    countplot(t,randcount)

    Plot of Time and Vehicle Count variables with a horizontal line representing the y mean.