Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

crosstab

Tabulación cruzada

Descripción

ejemplo

tbl = crosstab(x1,x2) Devuelve una tabulación cruzada, de dos vectores de la misma longitud y.tblx1x2

ejemplo

tbl = crosstab(x1,...,xn) Devuelve una tabulación cruzada multidimensional, de datos para varios vectores de entrada,,,...,.tblx1x2xn

ejemplo

[tbl,chi2,p] = crosstab(___) también devuelve el estadístico de Chi-cuadrado y su valor, para una prueba que es independiente en cada dimensión.chi2pptbl Puede utilizar cualquiera de las sintaxis anteriores.

ejemplo

[tbl,chi2,p,labels] = crosstab(___) también devuelve una matriz de celdas, que contiene una columna de etiquetas para cada argumento de entrada,....labelsx1xn

Ejemplos

contraer todo

Cree dos vectores de datos de ejemplo, que contengan tres y cuatro valores distintos, respectivamente.

x = [1 1 2 3 1]; y = [1 2 5 3 1];

Tabulación cruzada y.xy

table = crosstab(x,y)
table = 3×4

     2     1     0     0
     0     0     0     1
     0     0     1     0

Las filas en corresponden a los tres valores distintos en, y las columnas corresponden a los cuatro valores distintos en.tablexy

Genere dos vectores independientes y, cada uno conteniendo 50 números aleatorios uniformes discretos en el rango.x1x21:3

rng default;  % for reproducibility x1 = unidrnd(3,50,1); x2 = unidrnd(3,50,1);

Tabulación cruzada y.x1x2

[table,chi2,p] = crosstab(x1,x2)
table = 3×3

     1     6     7
     5     5     2
    11     7     6

chi2 = 7.5449 
p = 0.1097 

El valor devuelto indica que, en el nivel de significancia del 5%, no puede rechazar la hipótesis nula que es independiente en cada dimensión.p0.1097crosstabtable

Cargue los datos de la muestra, que contiene mediciones de coches modelo grandes durante los años 1970-1982.

load carbig

Tabulación cruzada de los datos de los coches de cuatro cilindros () según el año del modelo () y el país de origen ().cyl4whenorg

[table,chi2,p,labels] = crosstab(cyl4,when,org);

Se utiliza para determinar la ubicación del índice en el número de coches de cuatro cilindros fabricados en los EE.UU. durante el período tardío de los datos.labelstable

labels
labels = 3x3 cell array
    {'Other'   }    {'Early'}    {'USA'   }
    {'Four'    }    {'Mid'  }    {'Europe'}
    {0x0 double}    {'Late' }    {'Japan' }

La primera columna de corresponde a los datos en, e indica que la fila de contiene datos en coches con cuatro cilindros.labelscyl42table La segunda columna de corresponde a los datos en, e indica que la columna de contiene datos sobre los coches realizados durante el período tardío.labelswhen3table La tercera columna de corresponde a los datos en, e indica que la ubicación de la tercera dimensión de contiene datos sobre automóviles fabricados en los EE.UU.labelsorg1table

Por lo tanto, contiene el número de coches de cuatro cilindros fabricados en los Estados Unidos durante el período tardío.table(2,3,1)

table(2,3,1)
ans = 38 

Los datos contienen coches de 38 4 cilindros fabricados en los EE.UU. durante el período tardío.

Cargue los datos del hospital.

load hospital

La matriz de DataSet contiene datos sobre 100 pacientes hospitalarios, incluyendo el apellido, sexo, edad, peso, estado de tabaquismo, y mediciones de la presión arterial sistólica y diastólica.hospital

Para determinar si el estado de tabaquismo es independiente del género, se utiliza para crear una tabla de contingencia de 2 por 2 de fumadores y no fumadores, agrupados por género.crosstab

[tbl,chi2,p,labels] = crosstab(hospital.Sex, hospital.Smoker)
tbl = 2×2

    40    13
    26    21

chi2 = 4.5083 
p = 0.0337 
labels = 2x2 cell array
    {'Female'}    {'0'}
    {'Male'  }    {'1'}

Las filas de la tabla de contingencia resultante corresponden al sexo del paciente, con la fila 1 que contiene datos para las hembras y la fila 2 que contiene datos para varones.tbl Las columnas corresponden al estado de tabaquismo del paciente, con la columna 1 que contiene datos para los no fumadores y la columna 2 que contiene datos para los fumadores. El resultado devuelto es el valor de la estadística de prueba chi-cuadrada para la prueba de independencia Chi cuadrado de Pearson.chi2 = 4.5083 El valor devuelto es un aproximadop = 0.0337

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor basado en la distribución Chi cuadrado.

Argumentos de entrada

contraer todo

Vector de entrada, especificado como vector de las variables de agrupamiento. Todos los vectores de entrada, incluyendo,,...,, deben tener la misma longitud.x1x2xn

Tipos de datos: single | double | char | string | logical

Vector de entrada, especificado como vector de las variables de agrupamiento. Todos los vectores de entrada, incluyendo,,...,, deben tener la misma longitud.x1x2xn

Tipos de datos: single | double | char | string | logical

Vectores de entrada, especificados como vectores de variables de agrupamiento. Si utiliza esta sintaxis para especificar más de dos vectores de entrada, a continuación, genera una tabla de tabulación cruzada multidimensional.crosstab Todos los vectores de entrada, incluyendo,,...,, deben tener la misma longitud.x1x2xn

Tipos de datos: single | double | char | string | logical

Argumentos de salida

contraer todo

Tabla de tabulación cruzada, devuelta como una matriz de valores enteros.

Si especifica dos vectores de entrada y, a continuación, es una-por-matriz, donde es el número de valores distintos en y es el número de valores distintos en.x1x2tblmnmx1nx2

Si especifica tres o más vectores de entrada, entonces es un recuento de índices donde está, es, es, etc.tbl(i,j,...,n)grp2idx(x1)igrp2idx(x2)jgrp2idx(x3)k

Estadístico de Chi-cuadrado, devuelto como un valor escalar positivo. La hipótesis nula es que la proporción en cualquier entrada de es el producto de las proporciones en cada dimensión.tbl

valor p para el estadístico de prueba de Chi-cuadrado, devuelto como un valor escalar en el intervalo. pruebas independientes en cada dimensión.[0,1]crosstabtbl

Etiquetas de datos, devueltas como una matriz de celdas. Las entradas de la primera columna son etiquetas para las filas de, las entradas de la segunda columna son etiquetas para las columnas, y así sucesivamente, para una multidimensional.tbltbl

Algoritmos

utiliza para asignar un entero positivo a cada valor distinto. es un recuento de índices donde está y está.crosstabgrp2idxtbl(i,j)grp2idx(x1)igrp2idx(x2)j El orden numérico y las filas y columnas de orden de, respectivamente.grp2idx(x1)grp2idx(x2)tbl

En este caso, el valor devuelto de es un recuento de índices donde es, es, es, y así sucesivamente.tbl(i,j,...,n)grp2idx(x1)igrp2idx(x2)jgrp2idx(x3)k

Capacidades ampliadas

Consulte también

|

Introducido antes de R2006a