No meio desta turbulência, uma discussão que normalmente seria obscura e apenas para alguns com uma costela mais nerd acabou por despertar forte atenção pública (e até paixões e ódios): saber se o crescimento da epidemia pode ser previsto com a denominada curva exponencial. Jorge Buescu, num conjunto de artigos no Observador (aqui e aqui) e num grupo de discussão no Facebook, teve o mérito de lançar a discussão e de chamar a atenção com as previsões de doentes que a aplicação dessa metodologia gerou (análise de regressão com utilização de curva exponencial).
Porque há formas diferentes de obter previsões e porque é conhecido que numa fase inicial de uma epidemia esta se comporta com um padrão de crescimento exponencial. É igualmente sabido que, em algum momento, esse crescimento exponencial dará lugar a uma inversão, com abrandamento do crescimento (o chamado ponto de inflexão, em que a taxa de crescimento de novos doentes passa a ser menor do que no dia anterior).
Daqui resulta que se a intenção for prever o número de doentes com Covid-19 identificados pelo sistema de saúde num futuro próximo (medido em poucos dias) numa fase inicial do processo (como aquele em que nos encontramos), então a curva exponencial é uma forma simples e relativamente expedita de fazer essa previsão. E muitos têm sido os que a utilizam (aliás, se me pedirem a melhor previsão para amanhã, com base nos dados mais recentes, então essa também será a minha melhor previsão). A este respeito, deixo também aqui a ligação para o site da Associação Nacional de Médicos de Saúde Pública (ANMSP), que estabeleceu um acompanhamento da situação, com uma previsão, com a disponibilização da descrição da metodologia usada (tab “métodos” na página da ANMSP).
Diferente é se o objetivo for prever para daqui a uma semana ou daqui a 15 dias, por exemplo. Para um horizonte mais longo, é inevitável que o processo de crescimento deixe de ser exponencial (basta pensar que no prazo de um mês não é possível ter 12 milhões de doentes de Covid-19 num país com pouco mais de 10 milhões de habitantes). Este elemento é conhecido dos que estão a estimar modelos de curva exponencial para esta fase (mas com base em comentários de outras pessoas, há ainda alguma confusão sobre esse aspecto).
Daí que a previsão além dos próximos dias exija outras abordagens e esteja sujeita a mais incerteza. A utilização da curva logística como instrumento permite acomodar a redução da taxa de crescimento ao fim de algum tempo que irá necessariamente ocorrer. A questão que se coloca em termos técnicos é qual a melhor forma de estabelecer essa curva logística – o que iremos observar será influenciado pela dinâmica natural do processo de contágio da doença e pelas políticas adoptadas com a intenção de o influenciar. A este respeito, deixo esta ilustração muito bem conseguida no Washington Post.
Claro que há alternativas à utilização da curva logística, construindo modelos mais detalhados, em que a dinâmica de contágio de pessoas saudáveis depende explicitamente de quantos indivíduos infectados circulam na população e quantos contactos realizam antes de deixar essa situação. Estas dinâmicas complicam-se quando são influenciadas por medidas adoptadas (se ainda não viu a ilustração do Washington Post, vá ao link no final do parágrafo acima). A complexidade é maior se se vier a dar o caso de que ter a Covid-19 não gera imunidade futura, podendo voltar a ser contraída. A construção desse tipo de modelos demora mais tempo e exige mais informação, bem como o conhecimento técnico adequado.
A curva logística surge aqui como uma forma resumida de apanhar esses vários efeitos, e sendo a mais rápida construção uma vantagem, perde na capacidade de avaliar explicitamente efeitos das medidas distanciamento social e de contenção. Permite porém de uma forma célere ter uma ideia do impacto global da infecção, em número de pessoas que previsivelmente terão Covid-19.
No atual momento, dois aspectos são claros nas tentativas de construir uma curva logística: a) a sua parte inicial, tendo também um comportamento perto da curva exponencial, permite igualmente uma boa previsão a curto prazo; b) dependendo de parâmetros de caracterização, a forma de cálculo destes influencia o resultado final, podemos assim obter resultados diversos para a estimativa final do número de pessoas que contrairá a Covid-19.
A curva logística vai apresentar valores a médio prazo muito mais baixos que a curva exponencial, pela natureza explosiva desta última.
A figura seguinte ilustra o segundo ponto: com formas diferentes de dar valores à curva logística chegamos a estimativas de pessoas com Covid-19 diferentes – a figura abaixo apresenta duas dessas possibilidades (“curva logística” e “curva logística suave”, na Figura 1). Claro que conforme formos avançando no processo, a informação do que for sucedendo irá levar a uma revisão das estimativas e a uma convergência de valores. Mas esse efeito é de pouca utilidade quando se quer ter hoje uma ideia de quantas pessoas terão a Covid-19, para ajudar na definição dos recursos necessários.
Figura 1: curvas logísticas e exponencial calculadas com os valores diários de doentes (DGS) (versões mais suaves, provavelmente demasiado optimistas) (atualizada a 19/03/2020)
Luis Sá (Univ Minho) fez contas similares, e com uma parametrização ligeiramente diferente obteve resultados diferentes, que mudaram muito de ontem para hoje, dado o valor favorável publicado hoje (19 de março de 2020, referente a 18 de março de 2020), mostrando a sensibilidade da estimação a médio e longo prazo à informação disponível.
Figura 2: curva logistica (calculada por Luis Sá, U Minho, atualizada a 19/03/2020)
Figura 3: curva logística (calculada por Luis Sá, U Minho, atualizada a 18/03/2020)
Para Itália, Gonçalo Correia Lopes (U Aveiro) tem uma comparação similar entre as duas curvas, exponencial e logística.
O debate que tem havido, por vezes com posições desnecessariamente extremadas, acaba por ser útil por trazer ideias, explicações, informação que é importante para estabelecer a melhor forma de prever as situações futuras. Por exemplo, elaborar um modelo matemático para descrição dos dados que é muito elegante mas impossível nos mecanismos biológicos da doença, ter um biólogo a apontar esse aspecto é relevante para rever o modelo de previsão.
Por isso, manter uma abertura intelectual e uma capacidade de escuta das visões dos outros, com sentido crítico mútuo, sem ser adversarial, ter disponibilidade de dados e fazer uma sua utilização adequada, será a melhor forma de avançar no objectivo de uma boa previsão.
As consequências de cada um se isolar no seu mundo são ilustradas por um dos melhores gráficos que surgiu nos últimos dias, disponibilizado por Pedro Magalhães no Facebook, que trazendo algum humor nos questiona sobre as oportunidades que devemos não perder para fazermos melhor estas previsões. Para que possam ser úteis a quem as quiser usar.
(nota: a escala dos casos é logaritmica)
A propósito desta discussão recebi muitos comentários que me fizeram pensar em argumentos e ângulos novos, e perceber limitações e possíveis extensões deste tipo de análises, bem como sugestões de leituras / videos. Deixo aqui alguns, por mero gosto pessoal (são anónimos porque me foram enviados privadamente, e pedi autorização aos autores para os divulgar, editados por mim), e sem qualquer ordem especial:
- Creio que a tua explicação só peca por mecânica: teria sido interessante explicar porque é logística a curva. (…) A curva começa a crescer menos e a estacionar na parte superior devido à tal “herd immunity”, ou imunidade de grupo ou de “horda”. Tal acontece quando vai diminuindo o número dos “suscetíveis”, por dentro do grupo estarem a ser muitos mais os infetados, com ou sem sintomas clínicos. É por isso que é tão importante o confinamento dos grupos, para que não haja contactos, muito menos esporádicos, de uns com os outros. A decisão do encerramento foi desastrosa em Itália por ter levado os estudantes para as residências secundárias de pais e avós, situadas a centro e sul do foco inicial. A nossa decisão, embora para mim devesse ter esperado cinco dias, foi tomada por óbvia pressão social e [levou a] encerramentos não supervisionados. Estes só não foram desastrosos como em Itália por o Governo ter ordenado o confinamento quase imediato. E mesmo assim ainda iremos amargar as 36 horas entre a aplicação prática de ambas as decisões.
Informação sobre a Herd immunity pode ser obtida em Lilianfeld, Abraham, Principles of Epidemiology (…); - Tudo se torna mais difícil de calcular quando aquilo que se conhece são só os casos graves, havendo, pelo que se conhece da informação transmitida, muitos casos ligeiros não diagnosticados. Por cá ainda só existe indicação para testar os casos de doença respiratória grave. Países como a Alemanha e Coreia que foram mais além no testar têm uma taxa de mortalidade mais baixa.
A Itália terá uma taxa mais alta de mortalidade porque, tal a como na China, quando deu por isso já a doença estava disseminada na comunidade, havendo muito subdiagnóstico. Aliás só assim se explica como tantos estrangeiros se “infectaram” em Itália e “exportaram” a doença para os seus países, quando ainda havia relativamente poucos casos conhecidos.
Não sei se a curva de “doentes” será a mesma da dos “infectados” (formas minor+formas graves). - Plano das autoridades italianas,aqui, com a descrição das medidas adoptadas e do seu timing.
- Ted Talk de Bill Gates, 2015, The next outbreak? we’ re not ready – nem naquela altura, bem agora.
- O texto de André Peralta-Santos no Público,Pandemias, instituições e open source.
- Sobre o meu artigo no Observador (resultante do meu post anterior): “(…) não se trata de uma questão de crença. É antes uma questão do domínio da biologia em conjunto com a matemática. Na verdade, este tipo de discussões demostra a importância de abordagens multidisciplinares. Enquanto biólogo, penso que a questão passa por analisar taxas de crescimento e ter a noção de que são os recursos do sistema que limitam o crescimento. Neste caso específico, é a “disponibilidade de humanos” que faz o factor exponencial ser maior ou menor. Assim, os modelos têm de ser ajustados no dia a dia e para isso é importante ter bons números, para ajustar as previsões e poder ter dados mais fiáveis. Certo que os modelos são dependentes da quantidade dos dados existentes, por isso a importância de integrar conhecimento de diferentes disciplinas à priori, para evitar más previsões a longo prazo.”
- Duas sugestões de leitura no Facebook: Luis Vicente (aqui) e Filipa Vala (via Guadalupe Simões) (aqui), além do grupo criado pelo Jorge Buescu (aqui) (acesso por autorização), onde se encontram muitos comentários interessantes.
Em resumo:
a) muitas das diferenças que surgem na discussão resultam de perspectivas distintas- prever os próximos dois ou três dias, versus perceber o que será a dimensão total;
b) a incerteza a prever a mais de dois ou três dias é ainda bastante grande; c) a discussão tem tido uma considerável participação cívica.
Para os próximos dias, parece-me importante continuar o caminho de redução iniciado de contenção e evitar a ansiedade criada por estar sempre a vigiar a revelação de novos números (uma vez que uns dias serão mais positivos e outros mais negativos).
(texto adaptado do blog http://www.momentoseconomicos.com)
Comentários