Recuerdo haber discutido con directivos de una escuela de Medicina. Yo alegaba la importancia de enseñar estadística a los médicos para que pudieran distinguir anécdotas y coincidencias de correlaciones y causas reales. La respuesta fue –¿para qué enseñarles estadística a nuestros alumnos? Lo importante es que aprendan y apliquen los protocolos. Pero Medicina no es la única carrera donde se menosprecian las disciplinas matemáticas. Al final de una charla sobre Matemáticas y Sociedad que impartí años atrás en una escuela de Antropología una estudiante me criticó, –ay profe, cómo se le ocurrió un título tan malo, quienes escogimos esta carrera no queremos saber nada de matemáticas. No es raro incluso, escuchar a algún ingeniero confesar a sus alumnos –desde que terminé la carrera, jamás he realizado una integral. Sin embargo, las Matemáticas tienen esta capacidad de meterse en todos los aspectos de nuestra vida, nos gusten o no, a veces con consecuencias de vida o muerte. Este es el caso de la pandemia de la enfermedad Covid-19 provocada por el virus SARS-Cov-2 que ha trastocado nuestras vidas las últimas semanas. No hay más remedio que recurrir a las matemáticas para entender cómo se propaga una epidemia y para poder prever las consecuencias de nuestras acciones, así como las consecuencias de nuestras omisiones.
Las gráficas nos ayudan a visualizar datos
En la Figura 1 se muestra una gráfica de la evolución del número acumulado de casos confirmados de covid-19 detectados en México. Como referencia, se muestra también la curva correspondiente a China. En la gráfica es claro que cada día hay más personas que han sido infectados por esta nueva enfermedad. En México el número de infectados diarios también aumenta cada día, lo cual es motivo de preocupación. Puede parecer reconfortante que el ritmo de crecimiento en México es menor que lo que fue en China, donde surgió la pandemia. Sin embargo, en China se controló y revirtió finalmente, mientras que en México aún no.
Figura 1. Número de casos totales confirmados en México y China como función del número de días transcurridos a partir de tener 25 casos.
Gráficas como la Figura 1, las hemos visto hasta en la sopa a últimas fechas, pero tienen varios problemas. Por un lado, no nos permiten extrapolar hacia el futuro y predecir cuál será nuestra situación dentro de unas semanas. ¿Seguirá creciendo el número de infectados a una velocidad cada vez mayor? O, de manera opuesta ¿llegaremos a una saturación del número de casos totales y a una disminución en el número de casos nuevos? Es difícil saberlo de observar la gráfica. Otro problema radica en cómo comparar el desarrollo de la enfermedad en distintos países. La enfermedad empezó en China antes que en México, de manera que, ¿a partir de cuándo empezamos a contar los días transcurridos en ambos lugares? En la gráfica anterior empecé a contar el tiempo cuando el número de casos llegó a 25, en fechas distintas para cada país, pero no hay nada mágico en dicho número y bien pude empezar en otro punto. Cambiar la fecha en que iniciamos la gráfica es como mover la curva hacia la derecha o la izquierda, lo cual vuelve difícil saber si vamos peor o mejor que otros.
Muchos datos y cómo cambian: Ecuaciones diferenciales
Una forma más adecuada de presentar la evolución de la epidemia es concentrando nuestra atención en el número de nuevas infecciones cada día, en la velocidad con la que aparecen nuevos casos, y graficándolos no como función del tiempo sino como función del número total de casos. En Física llamamos rimbombantemente Espacio Fase a aquel en que estudiamos la relación entre cómo cambiamos (por ejemplo, cuál es nuestra velocidad) y cómo estamos (por ejemplo, cuál es nuestra posición). Muchos análisis se facilitan al estudiar el espacio fase en lugar del Espacio de Configuración.
Para saber qué esperamos encontrar en el espacio fase, hagamos un primer modelo matemático, aunque sea simplista, sobre la propagación de una enfermedad. Una persona se infecta sólo por estar en contacto, directo o indirecto, con un enfermo. Mientras más enfermos haya, más probable es que nos encontremos a uno durante nuestro quehacer y más probable es que nos enfermemos. Por tanto, el número de casos diarios ha de ser proporcional al número total de infectados. En el lenguaje del cálculo diferencial esto se puede escribir como dI(t)/dt=a I(t), donde I(t) es el número de infectados al tiempo t y a es una constante. Quienes no saben cálculo, interpreten los símbolos “dI(t)/dt” simplemente como el número diario de nuevos casos. Ecuaciones como la anterior se conocen como ecuaciones diferenciales. Ésta, en particular, es una de las ecuaciones más simples y su solución es un crecimiento exponencial, I(t)= exp (at), cada vez más rápido, cualitativamente como la parte inicial de la gráfica anterior.
¿Cómo distinguir un crecimiento exponencial de otros crecimientos acelerados y saber si en algún sentido hemos empezado a vencer a la pandemia? Una idea muy simple es tomar el logaritmo de nuestra ecuación diferencial log( dI(t)/dt )=log( a I(t) ). Usar logaritmos nos ayudan a manejar fácilmente números muy grandes empleando números más pequeños. Por ejemplo, el logaritmo (base 10) de 10 es igual a 1, mientras que el logaritmo de 100 es igual a 2 y como ya lo supondrá el lector, logaritmo de 1000 es apenas igual a 3. Además, el logaritmo es una función que tiene una propiedad muy útil: al aplicarlo a un producto obtenemos la suma de los logaritmos de los multiplicandos. Por ejemplo, log( xy )=log( x )+ log( y ) para cualesquiera dos números x y y. Por lo tanto, pasar de 1 a 10, de 10 a 100 y de 100 a 1000, intervalos cada vez mayores, se representa por pasos del mismo tamaño cuando tomamos el logaritmo. La ranita saltarina que nos enseñó a sumar puede ayudarnos a multiplicar cuando empleamos escalas logarítmicas. Algunos ingenieros y arquitectos maduros recordarán con cierta nostalgia las reglas de cálculo que les permitían hacer multiplicaciones sumando distancias, sin usar calculadoras, computadoras ni teléfonos inteligentes, y sin recurrir siquiera al lápiz y papel. Empleando gráficas logarítmicas podemos visualizar procesos que empiezan lentamente pero que gradualmente adquieren velocidades enormes, como una pandemia que empieza con unos cuantos enfermos, pero que en pocas semanas se vuelven cientos, miles, decenas de miles o, tristemente, más.
La pandemia usando ecuaciones diferenciales y logaritmos
Aplicando el logaritmo a nuestra ecuación diferencial y empleando la propiedad anterior, obtenemos log( dI(t)/dt )=log( I(t) ) + log( a ). Quienes hayan estudiado geometría analítica reconocerán aquí la ecuación de una línea recta, de la forma y=mx+b, en la cual la pendiente m toma el valor 1. Esto significa que durante un crecimiento exponencial, la gráfica logarítmica del número diario de infectados contra el número acumulado es una línea recta con la misma inclinación para todos los países.
En la Figura 2 se muestran gráficas logarítmicas del número diario de casos confirmados como función del número total de casos para varios países que han seguido estrategias distintas contra el Covid-19. Notamos que todos los países empiezan esencialmente siguiendo una línea recta, la misma para todos ellos. Las curvas para algunos países se van acostando ligeramente conforme pasa el tiempo y el número de casos se acumula, y para unos pocos, los que han logrado controlar la enfermedad, descienden abruptamente hacia el lado derecho de la gráfica. Es interesante notar, al recorrer la gráfica de izquierda a derecha, que México (la línea roja con círculitos llenos) abandonó muy pronto esta línea recta con pendiente m=1 acostándose ligeramente, pero alcanzando una nueva recta con pendiente m=0.75. Esto quiere decir que afortunadamente abandonamos la perniciosa fase de crecimiento exponencial y seguimos una ley de potencia más benévola. Desafortunadamente, nos hemos estabilizado en un comportamiento (la nueva línea recta) que, además de habernos llevado a superar el número de casos en China, de seguir inalterado como en el último mes, ¡nos llevará a superar el número de casos de Alemania, Italia, España y quizás EUA!
Figura 2. Número de casos de covid-19 confirmados cada día vs. número total de casos para diversos países. Cada punto representa cinco días transcurridos. La curva roja con círculos sólidos corresponde a México.
¿Cómo podemos modelar la evolución de una epidemia?
Los epidemiólogos son esa especie extraña de médicos que sí recurren entusiastamente a las matemáticas, y desarrollan modelos matemáticos típicamente basados en ecuaciones diferenciales. El modelo más simple es conocido como SIR debido a que consiste en tres ecuaciones diferenciales acopladas para obtener cómo evolucionan en el tiempo tres importantes números: el número de personas susceptibles (S), infectadas (I) y recuperadas (R).
- El número de personas susceptibles disminuye cada vez que una persona se enferma. El número de nuevos contagios es proporcional al número de veces que una persona susceptible se encuentra con una persona infectada, y por tanto, es proporcional a cuántos susceptibles hay y a la probabilidad I/N de que sus contactos estén infectados, donde N es el tamaño de la población. Escribimos esto como la ecuación dS(t)/dt=-b S(t)I(t)/N, donde b es alguna constante.
- Cada vez que una persona susceptible se enferma, aumenta el número de infectados. Cada vez que un infectado se recupera (por simplicidad, pero con pésimo tacto, en este modelo se llama recuperados no sólo a quienes se curan, sino también a quienes fallecen), disminuye el número de infectados. Mientras más enfermos haya, más personas se recuperarán cada día. Resumimos esto como dI(t)/dt=(b S(t)/N-g)I(t), donde g es otra constante, cuyo significado es la fracción de los enfermos que se recuperan en un día.
Cuando apenas inicia la epidemia, toda la población es susceptible S(0)=N. Por tanto, el factor bS(t)/N-g toma el valor inicial b-g=g(R0-1), el cual se mantiene casi constante mientras no haya muchos casos, como en la primera ecuación diferencial que presentamos arriba y que condujo al crecimiento exponencial. Aquí se introdujo la cantidad R0=b/g, que se puede interpretar como el número de personas que son contagiadas por cada enfermo. Por ejemplo, R0=2 significa que un enfermo contagia a dos, que a su vez contagian a cuatro, que contagian a 8, 16, 32… Es claro entonces por qué la fase inicial de una epidemia es exponencial. En el caso del Covid-19, R0 es muy alto, R0=2-2.5, aunque se han reportado estimaciones cercanas a 6. El propósito de las estrategias de control de una epidemia es disminuir R0 y volverlo menor a 1, pues de lograrlo, la epidemia se esfumaría en corto tiempo.
- El número de personas recuperadas, como vimos en las previas líneas, crece en proporción al número de personas infectadas, dR(t)/dt=gI(t).
Estudiando el comportamiento de los datos epidemiológicos se pueden asignar valores a los parámetros mencionados arriba y resolver las ecuaciones diferenciales para poder predecir el comportamiento futuro de la epidemia y poder planear y tomar decisiones. En la Figura 3 se muestra el número de personas enfermas simultáneamente como función del tiempo transcurrido desde el primer caso, calculadas para México (nota 1) para distintos valores del parámetro R0. Por ejemplo, R0=2 llevaría a un pico a los 4 meses de alrededor de veinte millones. Nuestro sistema médico y hospitalario no tiene la capacidad para atender este número de pacientes simultáneamente. Los resultados son extremadamente sensibles al valor de R0. Si resultase más grande, alrededor de 3, como inicialmente se estimó, llegaríamos a la tercera parte de nuestra población enferma simultáneamente. Si lo lográramos bajar a alrededor de 1.25, la duración de la epidemia sería mucho mayor, pero el número de casos simultáneamente enfermos bajaría a dos millones; enorme, pero mucho menor. Es a esto a lo que se le ha llamado aplanar la curva.
Figura 3. Número de enfermos activos como función de los días transcurridos desde el primer caso.
De la solución de las mismas ecuaciones diferenciales se puede obtener el número total de casos, que es la simple suma I+R de todos los enfermos y todos los recuperados. Mostramos estos en la Figura 4, que ilustra que de no disminuir R0 casi toda la población enfermaría tras pocos meses, mientras que bajando R0 a 1.25, tras un par de años sólo se habría enfermado la tercera parte de la población.
Figura 4. Número total de casos como función de los días transcurridos desde el primer caso.
Efectos del confinamiento y desconfinamiento
No es fácil manipular R0, parámetro que depende de qué tan contagiosa es la enfermedad, cuánto tarda un enfermo en recuperarse y a cuánta gente se encuentra en ese tiempo. En México hemos recurrido al distanciamiento social, a tratar de disminuir el número de contagios manteniendo a la población aislada lo más posible unos de otros. Hay modelos matemáticos análogos al SIR que incorporan explícitamente este distanciamiento. Por ejemplo, el modelo SIRC introduce una tercera categoría de población, que es la población confinada (C). Cada día hay una fracción c de personas susceptibles que, quizás gracias a campañas mediáticas, por convencimiento o por coacción, se confinan, evitando enfermarse y contagiar a otros. Sin embargo, hay una fracción d de estas personas confinadas que cada día se reintegran al grupo de susceptibles, quizás por la necesidad de trabajar, de ir de compras, por no creer que vivimos una gran crisis de salud o por simple inconciencia. En la Figura 5 muestro el número de enfermos activos calculado con el modelo SIRC suponiendo un parámetro R0=3 y suponiendo que el porcentaje d de confinados que cada día regresan a la normalidad es del 10%. Notamos que una variación muy pequeña del parámetro de confinamiento c produce cambios enormes en la duración de la epidemia y en el número máximo de enfermos activos. Por ejemplo, al pasar c de 0.15 a 0.17 el número máximo de enfermos bajaría en un millón, de 1.7 millones a 700 mil. La misma sensibilidad se obtiene para el parámetro de desconfinamiento d. Por lo tanto, es importantísimo no permitir que baje el primero ni que suba el segundo hasta que hayamos superado la crisis o hasta que se implementen otros métodos para controlarla, como sería hacer pruebas para identificar contagiados, aislarlos y aislar a sus contactos, permitiendo a los recuperados regresar a una actividad normal.
Figura 5. Enfermos activos como función del tiempo desde el primero, calculado con el modelo SIRC para distintos valores de los parámetros c con d=0.1.
En resumen, todas las profesiones requieren de las matemáticas, como nos ha enseñado esta crisis sanitaria. En este artículo mostré cómo visualizar mejor los datos existentes para poder identificar fácilmente sus tendencias, y como elaborar modelos simples que permiten ayudar a tomar decisiones y monitorear las consecuencias de las mismas.
Agradezco el apoyo de DGAPA-UNAM bajo el proyecto IN111119.
Esta columna se prepara y edita semana con semana, en conjunto con investigadores morelenses convencidos del valor del conocimiento científico para el desarrollo social y económico de Morelos. Desde la Academia de Ciencias de Morelos externamos nuestra preocupación por el vacío que genera la extinción de la Secretaría de Innovación, Ciencia y Tecnología dentro del ecosistema de innovación estatal que se debilita sin la participación del Gobierno del Estado.
Referencias
- Video How To Tell If We're Beating COVID-19 https://www.youtube.com/watch?v=54XLXg4fYsc.
- Repositorio de datos, gráficas y programas del autor, en https://github.com/wlm/covid.
- Video de la Conferencia Epidemiología y matemáticas, por Andreu Comas García, https://www.youtube.com/watch?v=v4PS2nnc5-I&feature=youtu.be
- Sanche et al., Emerging Infectious Diseases 26 (2020) https://doi.org/10.3201/eid2607.200282
- Castro, Mario, Saúl Ares, José A. Cuesta, and Susanna Manrubia. “Predictability: Can the Turning Point and End of an Expanding Epidemic Be Precisely Forecast?” ArXiv:2004.08842 [Physics, q-Bio], April 19, 2020. http://arxiv.org/abs/2004.08842.
Notas
- Usé para el parámetro g el valor 1/(6.08 días), ajustado a datos provistos por el gobierno mexicano sobre enfermos activos.