Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

¿Qué es el análisis de supervivencia?

Introducción

El análisis de supervivencia es un análisis de tiempo a evento, es decir, cuando el resultado de interés es el tiempo hasta que se produce un evento. Ejemplos de tiempo-a-eventos son el tiempo hasta la infección, la reaparición de una enfermedad, o la recuperación en las Ciencias de la salud, la duración del desempleo en la economía, el tiempo hasta el fracaso de una parte de la máquina o la vida de las bombillas en la ingeniería, y así sucesivamente. El análisis de supervivencia es parte de los estudios de confiabilidad en ingeniería. En este caso, se utiliza generalmente para estudiar la vida útil de los componentes industriales. En los análisis de confiabilidad, los tiempos de supervivencia suelen denominarse tiempos de falla, ya que la variable de interés es cuánto tiempo un componente funciona correctamente antes de fallar.

El análisis de supervivencia consta de métodos paramétricos, semiparamétricos y no paramétricos. Puede utilizarlos para estimar las medidas más utilizadas en los estudios de supervivencia, las funciones de superviviente y de peligro, compararlas para diferentes grupos y evaluar la relación de las variables predictoras con el tiempo de supervivencia. Algunas distribuciones de probabilidad estadística describen bien los tiempos de supervivencia. Las distribuciones de uso común son las distribuciones exponenciales, Weibull, lognormal, Burr y Birnbaum-Saunders. funciones y calcular las estimaciones de densidad empírica y del kernel de las funciones CDF, de riesgo acumulativo y de superviviente. se ajusta al modelo de peligros proporcionales de Cox a los datos.Statistics and Machine Learning Toolbox™ecdfksdensitycoxphfit

Censura

Un concepto importante en el análisis de supervivencia es la censura. Los tiempos de supervivencia de algunas personas podrían no ser observados completamente debido a diferentes razones. En las Ciencias de la vida, esto puede suceder cuando el estudio de supervivencia (por ejemplo, el ensayo clínico) se detiene antes de que se puedan observar los tiempos de supervivencia completos de todas las personas, o una persona abandona un estudio, o para estudios a largo plazo, cuando el paciente se pierde para el seguimiento. En el contexto industrial, no todos los componentes pudieron haber fallado antes del final del estudio de confiabilidad. En tales casos, el individuo sobrevive más allá del tiempo del estudio, y se desconoce el tiempo exacto de supervivencia. Esto se llama censura a la derecha.

Durante un estudio de supervivencia o bien se observa que el individuo falla en el tiempo, o la observación en ese individuo cesa en el tiempo.Tc A continuación, la observación es min (,) y una variable indicadoraTcIc muestra si el individuo está censurado o no. Los cálculos para las funciones de peligro y superviviente deben ajustarse para tener en cuenta la censura. funciones como,,, cuenta para censurar.Statistics and Machine Learning Toolboxecdfksdensitycoxphfitmle

Datos

Los datos de supervivencia generalmente consisten en el tiempo hasta que se produce un evento de interés y la información de censura para cada individuo o componente. La siguiente tabla muestra el tiempo de desempleo ficticio de las personas en un estudio de 6 meses. Dos individuos tienen derecho censurado (indicado por un valor de censura de 1). Un individuo estaba todavía desempleado después de la semana 24, cuando el estudio terminó. El contacto con el otro individuo censurado se perdió al final de la semana 21.

Tiempo de desempleo (semanas)Censura
140
230
70
211
190
160
241
80

Los datos de supervivencia también pueden incluir el número de fallas en un momento determinado (el número de veces que se observó una supervivencia o un tiempo de falla en particular). La siguiente tabla muestra el tiempo simulado hasta que los diodos emisores de luz descienda al 70% de su nivel de salida de luz completo, en horas, en una prueba de vida acelerada.

Tiempo de falla (hrs)Frecuencia
86006
1530019
2200011
2860020
3530017
4200014
487008
554002
621000
688002

Los datos también pueden tener información sobre las variables predictoras, para usarlas en métodos de regresión semi-paramétrica como la regresión de peligros proporcionales de Cox.

Tiempo hasta la recuperación (semanas)CensuraGéneroPresión arterial sistólicaPresión arterial diastólica
121masculino12493
200Mujer10977
70Mujer12583
130masculino 11775
91masculino12280
150Mujer12170
171masculino13088
80Mujer11582
140masculino11886

Función superviviente

La función de superviviente es la probabilidad de supervivencia como una función del tiempo. También se llama la función de supervivencia. Da la probabilidad de que el tiempo de supervivencia de un individuo exceda un cierto valor. Dado que la función de distribución acumulativa, (), es la probabilidad de que el tiempo de supervivencia sea menor o igual a un punto determinado en el tiempo, la función de supervivencia para una distribución continua, (), es el complemento de la función de distribución acumulativa:FtSt

() = 1 – ().StFt

Por ejemplo, para los datos procedentes de una distribución de Burr con los parámetros 50, 3 y 1, puede calcular y trazar la función de superviviente.

x = 0:0.1:200; figure() plot(x,1-cdf('Burr',x,50,3,1)) xlabel('Failure time'); ylabel('Survival probability');

La función superviviente también está relacionada con el.función de riesgo Si los datos tienen la función de peligro, (), entonces la función superviviente esht

S(t)=exp(0th(u)du),

que corresponde a

S(t)=exp(H(t)),

Where () es la función de riesgo acumulado.Ht

Función de riesgo

La función de peligro da la tasa de fracaso instantáneo de un individuo condicionado en el hecho de que el individuo sobrevivió hasta un momento dado. Es decir

h(t)=limΔt0P(tT<t+Δt|Tt)Δt,

donde Δ es un intervalo de tiempo muy pequeño.t La tasa de peligro, por lo tanto, a veces se llama la tasa de error condicional. La función de peligro siempre tiene un valor positivo. Sin embargo, estos valores no corresponden a las probabilidades y pueden ser mayores que 1.

La función de riesgo está relacionada con la función de densidad de probabilidad, (), la función de distribución acumulativa, () y la función de superviviente, (), de la siguiente manera: ftFtSt

h(t)=f(t)S(t)=f(t)1F(t),

que también equivale a

h(t)=ddtlnS(t).

Por lo tanto, si conoce la forma de la función de supervivencia, también puede derivar la función de peligro correspondiente.

Por ejemplo, para los datos procedentes de una distribución de Burr con los parámetros 50, 3 y 1, puede calcular y trazar la función de peligro.

x = 0:1:200; Burrhazard = pdf('Burr',x,50,3,1)./(1-cdf('Burr',x,50,3,1)); figure() plot(x,Burrhazard) xlabel('Failure time'); ylabel('Hazard rate');

Existen diferentes tipos de funciones de peligro. La figura anterior muestra una situación en la que la tasa de peligro aumenta para los períodos de tiempo tempranos y luego disminuye gradualmente. La tasa de peligro también puede ser monótona disminuyendo, aumentando o constante con el tiempo. La figura siguiente muestra ejemplos de diferentes tipos de funciones de peligro para los datos procedentes de diferentes distribuciones de Weibull.

ax1 = subplot(3,1,1); x1 = 0:0.5:30; hazard1 = pdf('wbl',x1,3,0.6)./(1-cdf('wbl',x1,3,0.6)); plot(x1,hazard1)  ax2 = subplot(3,1,2); x2 = 0:0.05:2; hazard2 = pdf('wbl',x2,0.9,4)./(1-cdf('wbl',x2,0.9,4)); plot(x2,hazard2,'color','r')  ax3 = subplot(3,1,3); x3 = 0:0.05:5; hazard3 = pdf('wbl',x3,2.5,1)./(1-cdf('wbl',x3,2.5,1)); plot(x3,hazard3)  set(ax1,'Ylim',[0 0.4]); legend(ax1,'a=3, b=0.6'); legend(ax2,'a=0.9, b=4','location','northwest'); legend(ax3,'a=2.5, b=1');

En el tercer caso, la distribución de Weibull tiene un valor de parámetro de forma de 1, que corresponde a la distribución exponencial. La distribución exponencial siempre tiene una tasa de riesgo constante en el tiempo.

Referencias

[1] Cox, D. R., and D. Oakes. Analysis of Survival Data. London: Chapman & Hall, 1984.

[2] Lawless, J. F. Statistical Models and Methods for Lifetime Data. Hoboken, NJ: Wiley-Interscience, 2002.

[3] Kleinbaum, D. G., and M. Klein. Survival Analysis. Statistics for Biology and Health. 2nd edition. Springer, 2005.

Consulte también

| |

Ejemplos relacionados

Más acerca de