June 29, 2020

948 words 5 mins read

Factores de riesgo COVID-19

En este post analizaremos los factores de riesgo que incrementan la probabilidad de hospitalización en los casos positivos a SARS-CoV-2 en México.

Para ello, usaremos una técnica básica, no por la dificultad sino por ser una de las primeras que se aprenden para el análisis estadístico de datos, llamada regresión logística.

Explicaremos brevemente los datos a usar, crearemos el modelo y finalmente presentaremos los hallazgos.

Mostraremos, además, cómo usar el modelo para estimar la probabilidad de hospitalización de un nuevo registro.

Datos

Puedes ir directamente a los hallazgos dando click aquí..

La información usada es la que se reporta diariamente por la Dirección General de Epidemiología.

Los datos abiertos se pueden descargar en este sitio en formato csv o bien podemos instalarlos directamente en R usando:

# install.packages("devtools")
devtools::install_github("alberto-mateos-mo/datoscovid19mx")

La información reportada considera a todas las personas a quienes les ha sido aplicada la prueba de detección del virus por lo que nos enfocaremos únicamente en aquellos con resultados positivo.

La Dirección General de Epidemiologia proporciona, además del resultado de la prueba, información demográfica y de salud de cada caso registrado, usaremos esa información como las covariables del modelo y la variable tipo paciente como la variable a modelar; ésta identifica a cada registro como Ambulatorio y Hospitalizado.

Las variables: neumonía, diabetes mellitus (DM), EPOC (Enfermedad Pulmonar Obstructiva Crónica), asma, inmunosupresión, hipertensión, enfermedad cardiovascular, obesidad, enfermedad renal crónica (ERC) y tabaquismo, indican si el caso presenta esa condición o no; la variable otra comorbilidad indica si el caso presenta alguna otra comorbilidad.

Algo a considerar es que estas variables, además de los campos si y no, contienen las opciones no aplica, se ignora y no especificado; estas últimas las codificaremos como no.

Modelo de riesgo de hospitalización

Como ya mencionabamos, usaremos el modelo de regresión logística para analizar el impacto de cada factor de riesgo en la probabilidad de hospitalización.

N.B. En un primer modelo observamos que la variable que indica presencia de enfermedad cardiovascular no es estadísticamente significativa para el riesgo de hospitalización y por ello fue removida del análisis.

## 
## Call:
## glm(formula = tipo_paciente ~ ., family = "binomial", data = train)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -3.2804  -0.5142  -0.3738   0.3639   2.9175  
## 
## Coefficients:
##                   Estimate Std. Error  z value Pr(>|z|)    
## (Intercept)     -3.7291801  0.0264566 -140.954  < 2e-16 ***
## sexoMUJER       -0.4039366  0.0148085  -27.277  < 2e-16 ***
## edad             0.0393934  0.0005096   77.307  < 2e-16 ***
## neumoniaSI       3.4102234  0.0170046  200.547  < 2e-16 ***
## diabetesSI       0.5290637  0.0193096   27.399  < 2e-16 ***
## epocSI           0.2528590  0.0518983    4.872 1.10e-06 ***
## asmaSI          -0.1683823  0.0467407   -3.602 0.000315 ***
## inmusuprSI       0.6073466  0.0577203   10.522  < 2e-16 ***
## hipertensionSI   0.2183957  0.0188248   11.601  < 2e-16 ***
## otra_comSI       0.6635279  0.0398129   16.666  < 2e-16 ***
## obesidadSI       0.1033378  0.0180061    5.739 9.52e-09 ***
## renal_cronicaSI  0.8895913  0.0466298   19.078  < 2e-16 ***
## tabaquismoSI    -0.1085512  0.0277820   -3.907 9.34e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 221047  on 181211  degrees of freedom
## Residual deviance: 128837  on 181199  degrees of freedom
## AIC: 128863
## 
## Number of Fisher Scoring iterations: 5

El modelo muestra que todas las covariables incluidas son estadísticamente significativas para riesgo de hospitalización y la validación confirma que éste es bastante robusto.

Factores de riesgo

A partir de los coeficientes del modelo, también conocidos como logits, podemos identificar aquellas características con un impacto positivo, ceteris paribus, en la probabilidad de hospitalización.

Como regla de dedo, los coeficientes negativos tienen asociada una probabilidad de hospitalización menor al 50% y los coeficientes positivos, mayor al 50%.

En este sentido, las características con mayor impacto al riesgo de hospitalización son: presencia de neumonía, diabetes mellitus, epoc, inmunosupresión, hipertensión, obesidad, enfermedad renal crónica (ERC), otras comorbilidades y edad avanzada.

Por el contrario, las características con menor riesgo de hospitalización son: asma y tabaquismo.

En cuanto al sexo del paciente, las mujeres, en comparación con los hombres, tienen menor riesgo de hospitalización.

Estimación de riesgo de hospitalización.

El modelo anterior además de ayudarnos a entender qué características derivan en un mayor riesgo de hospitalización, también es útil como un modelo predictivo, el cual, dadas las características de un nuevo caso, nos dará la probabilidad que este tiene de ser hospitalizado.

Supongamos un caso positivo con las siguientes características:

  • Sexo: hombre
  • Edad: 30
  • Neumonia: no
  • Diabetes Mellitus: no
  • Epoc: no
  • Asma: no
  • Inmunosupresión: no
  • Hipertensión: no
  • Obesidad: si
  • Enfermedad renal crónica (ERC): no
  • Otra comorbilidad: no
  • Tabaquismo: si

Esta persona tendría una probabilidad de 7% de ser hospitalizada, en el caso de contraer el virus SARS-CoV-2.

¿Cómo se compararía el riesgo con una persona similar pero que además tenga diabetes mellitus?

La probabilidad de hospitalización sería de 12%, esto es, el hecho de tener diabetes mellitus en esta persona derivó en un incremento de 4%.

¿Y si no tuviera obesidad?

En este caso la probabilidad sería de: 11%.

Calculadora en línea

Con el modelo obtenido se desarrolló una calculadora online para dispositivos móviles que permite estimar el riesgo de hospitalización para un paciente con ciertas características.

Esta calculadora puede ser consultada dando click aquí.

N.B. La calculadora se actualizará semanalmente para reflejar el comportamiento más reciente por lo que los resultados en ella pueden diferir de los aquí expuestos.

Hallazgos

El modelo creado arrojó que las variables con mayor impacto al riesgo de hospitalización por SARS-CoV-2 en México son (en orden de importancia):

  • Neumonía
  • Enfermedad renal crónica (ERC)
  • Inmunosupresión
  • Otra comorbilidad
  • Diabetes Mellitus
  • EPOC
  • Hipertensión
  • Obesidad
  • Edad

Aquellas variables con un menor impacto al riesgo de hospitalización son:

  • Sexo femenino
  • Asma
  • Tabaquismo