Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Método de Kaplan-Meier

La función produce el riesgo acumulativo empírico, la supervivencia y las funciones de distribución acumulativa mediante el método no paramétrico de Kaplan-Meier.Statistics and Machine Learning Toolbox™ecdf El estimador de Kaplan-Meier para la función superviviente también se llama el.product-limit estimator

El método de Kaplan-Meier utiliza datos de supervivencia resumidos en tablas de vida. Las tablas de vida ordenan los datos según los tiempos de falla ascendentes, pero no tiene que introducir los tiempos de falla/supervivencia de una manera ordenada para usar.ecdf

Una tabla de vida generalmente consiste en:

  • Los tiempos de falla

  • Número de elementos fallidos en un período de tiempo/tiempo

  • Número de elementos censurados en un período de tiempo/tiempo

  • Número de artículos en riesgo al comienzo de un período de tiempo/tiempo

El número en riesgo es el número total de sobrevivientes al comienzo de cada período. El número en riesgo al comienzo del primer período es todos los individuos en el estudio de por vida. Al comienzo de cada período restante, el número en riesgo se reduce por el número de fracasos más los individuos censurados al final del período anterior.

Esta tabla de vida muestra datos ficticios de supervivencia. Al comienzo del primer tiempo de falla, hay siete artículos en riesgo. En el tiempo 4, tres fallan. Así que al principio del tiempo 7, hay cuatro artículos en riesgo. Sólo uno falla en el tiempo 7, por lo que el número en riesgo al principio del tiempo 11 es tres. Dos fallan en el tiempo 11, así que al principio del tiempo 12, el número en riesgo es uno. El artículo restante falla en el tiempo 12.

Tiempo de falla (t)Número fallidoNúmero en riesgo
437
714
1123
1211

Puede estimar las funciones de riesgo, riesgo acumulado, supervivencia y distribución acumulativa utilizando las tablas de vida como se describe a continuación.

Cumulative Hazard Rate (Failure Rate)

La tasa de peligro en cada período es el número de fallas en el período dado dividido por el número de individuos supervivientes al comienzo del período (número en riesgo).

Tiempo de falla ()tTasa de riesgo (())htTasa de riesgo acumulado
000
t1d1/r1d1/r1
t2d2/r2(ht1) +d2/r2
.........
tndn/rn(htn – 1) + dn/rn

Survival Probability

Para cada período, la probabilidad de supervivencia es el producto del complemento de las tasas de riesgo. La probabilidad de supervivencia inicial al comienzo del primer período de tiempo es 1. Si la tasa de peligro para cada período es (hti), entonces la probabilidad de sobreviviente es como se muestra.

Tiempo ()tProbabilidad de supervivencia (())St
01
t11 * (1 – (ht1))
t2(St1) * (1 – (ht2))
......
tn(Stn – 1) * (1 – (htn))

Cumulative Distribution Function

Debido a que la función de distribución acumulativa (CDF) y la función de superviviente son complementos entre sí, puede encontrar la CDF de las tablas de vida usando () = 1 – ().FtSt

Puede calcular la tasa de riesgo acumulada, la tasa de supervivencia y la función de distribución acumulativa para los datos simulados en la primera tabla de esta página de la siguiente manera.

t Número fallido ()dNúmero en riesgo ()rTasa de riesgoProbabilidad de supervivenciaFunción de distribución acumulativa
4373/71 – 3/7 = 4/7 = 0,57140,4286
7141/44/7 * (1 – 1/4) = 3/7 =. 42860,5714
11232/33/7 * (1 – 2/3) = 1/7 = 0,14290,8571
12111/11/7 * (1 – 1) = 01

Estas tarifas en este ejemplo se basan en los tiempos de falla discretos, y por lo tanto los cálculos no siguen necesariamente la definición basada en derivaciones en¿Qué es el análisis de supervivencia?

Aquí es cómo puede introducir los datos y calcular estas medidas utilizando.ecdf Los datos no necesariamente tienen que estar en orden ascendente. Supongamos que los tiempos de error se almacenan en una matriz.y

y = [4 7 11 12]; freq = [3 1 2 1]; [f,x] = ecdf(y,'frequency',freq)
f =           0     0.4286     0.5714     0.8571     1.0000   x =       4      4      7     11     12

Cuando haya censurado datos, la tabla de vida podría tener el siguiente aspecto:

Tiempo ()t Número fallado ()dCensuraNúmero en riesgo ()rTasa de riesgoProbabilidad de supervivenciaFunción de distribución acumulativa
42172/71 – 2/7 = 0,71430,2857
71041/40.7143 * (1 – 1/4) = 0,53570,4643
111132/30.5357 * (1 – 1/3) = 0,35710,6429
121011/10.3571 * (1 – 1) = 01,0000

En un momento dado, los elementos censurados también se consideran en el total del número en riesgo, y la fórmula de la tasa de peligro se basa en el número fallado y el número total en riesgo. Al actualizar el número en riesgo al comienzo de cada período, el número total fallido y censurado en el período anterior se reduce del número en riesgo al comienzo de ese período.

Durante el uso, también debe introducir la información de censura utilizando una matriz de variables binarias.ecdf Ingrese 1 para los datos censurados, y ingrese 0 para el tiempo exacto del error.

y = [4 4 4 7 11 11 12]; cens = [0 1 0 0 1 0 0]; [f,x] = ecdf(y,'censoring',cens)
f =           0     0.2857     0.4643     0.6429     1.0000  x =       4      4      7     11     12

, de forma predeterminada, genera los valores de función de distribución acumulativa.ecdf Debe especificar la función de superviviente o la función de peligro utilizando argumentos de par nombre-valor opcionales. También puede trazar los resultados de la siguiente manera.

figure() ecdf(y,'censoring',cens,'function','survivor'); 

figure() ecdf(y,'censoring',cens,'function','cumulative hazard'); 

Referencias

[1] Cox, D. R., and D. Oakes. Analysis of Survival Data. London: Chapman & Hall, 1984.

[2] Lawless, J. F. Statistical Models and Methods for Lifetime Data. Hoboken, NJ: Wiley-Interscience, 2002.

[3] Kleinbaum, D. G., and M. Klein. Survival Analysis. Statistics for Biology and Health. 2nd edition. Springer, 2005.

Consulte también

| |

Ejemplos relacionados

Más acerca de