Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Agrupar variables

¿Qué son las variables de agrupamiento?

son variables de utilidad utilizadas para agrupar, o categorizar, observaciones.Agrupar variables Las variables de agrupación son útiles para resumir o visualizar datos por grupo. Una variable de agrupamiento puede ser cualquiera de estos tipos de datos:

  • Vector numérico

  • Vector lógico

  • La matriz de caracteres

  • Matriz de cadenas

  • Matriz de vectores de caracteres

  • Vector categórico

Una variable de agrupación debe tener el mismo número de observaciones (filas) que la tabla, la matriz de DataSet o la matriz numérica que está agrupando. Las observaciones que tienen el mismo valor de variable de agrupación pertenecen al mismo grupo.

Por ejemplo, las siguientes variables comprenden los mismos grupos. Cada variable de agrupamiento divide cinco observaciones en dos grupos. El primer grupo contiene las observaciones primera y cuarta. Las otras tres observaciones se encuentran en el segundo grupo.

Tipo de datosVariable de agrupación
Vector numérico[1 2 2 1 2]
Vector lógico[0 1 1 0 1]
Matriz de cadenas["Male","Female","Female","Male","Female"]
Matriz de vectores de caracteres{'Male','Female','Female','Male','Female'}
Vector categóricoMale Female Female Male Female

Utilice las variables de agrupación con etiquetas para dar a cada grupo un nombre descriptivo. Un vector categórico es una elección eficiente y flexible de la variable de agrupamiento.

Definición de grupo

Normalmente, hay tantos grupos como valores únicos en la variable de agrupación. Sin embargo, los vectores categóricos pueden tener niveles que no están representados en los datos. Los grupos y el orden de los grupos dependen del tipo de datos de la variable de agrupación. Supongamos que es una variable de agrupación.G

  • Si es un vector numérico o lógico, los grupos corresponden a los valores distintos en, en el orden ordenado de los valores únicos.GG

  • Si se trata de una matriz de caracteres, una matriz de cadenas o una matriz de vectores de caracteres, los grupos corresponden a los elementos distintos de, en el orden de su primera aparición.GG

  • Si es un vector categórico, los grupos corresponden a los niveles de categoría únicos en, en el orden devuelto por.GGcategories

Algunas funciones, como, por ejemplo, aceptan varias variables de agrupamiento especificadas como una matriz de celdas de agrupación de variables.grpstats{G1,G2,G3} En este caso, los grupos se definen mediante combinaciones únicas de valores en las variables de agrupamiento. La orden se decide primero por el orden de la primera variable de agrupamiento, luego por el orden de la segunda variable de agrupamiento, y así sucesivamente.

Análisis mediante variables de agrupación

Esta tabla enumera las tareas comunes que puede que desee realizar mediante la agrupación de variables.

Tarea de agrupaciónFunción que acepta la variable de agrupación
Dibuje diagramas de caja en paralelo para datos en diferentes grupos.boxplot
Dibuje un gráfico de dispersión con marcadores de color por grupo.gscatter
Dibuje una matriz de gráfico de dispersión con marcadores coloreados por grupo.gplotmatrix
Calcular estadísticas de resumen por grupo.grpstats
Prueba de las diferencias entre los medios del grupo.anovan
Cree un vector de índice a partir de una variable de agrupación.grp2idx

Los valores de grupo faltantes

Las variables de agrupamiento pueden tener valores faltantes siempre que incluya un indicador válido.

Agrupar tipo de datos variableIndicador de valor faltante
Vector numéricoNaN
Vector lógico(No puede faltar)
La matriz de caracteresFila de espacios
Matriz de cadenasO<missing>""
Matriz de vectores de caracteres''
Vector categórico<undefined>

Consulte también

Ejemplos relacionados

Más acerca de