AtualidadesOpinião

Tratamento Precoce na Pandemia

O propósito deste texto é expor algumas evidências sobre a polêmica do tratamento precoce do Covid19. Tenho para mim que a imprensa deveria estar fazendo o que me estou propondo aqui, mas não fez até o momento. De fato, a desinformação é grande, frequentemente fomentada por médicos e seus órgãos representativos, como será mostrado. Então, eu diria que este artigo promove alguns questionamentos de caráter mais metodológico, assim diferenciando-se do excelente texto sobre o mesmo tema do Paulo Buchsbaum, que me precede aqui no Boteco.

Antes de prosseguir, convém explicar o que é tratamento precoce de Covid19. Trata-se da administração de certos medicamentos no estágio inicial dos sintomas, geralmente com menos de 3 dias de manifestação, mas podendo chegar a 5 dias, dado que é difícil estabelecer o momento mais exato dos sintomas.

Os fármacos utilizados nesse caso variam, mas em essência usa-se a hidroxicloroquina – HCL – ou ivermectina – IVM – associado a outros fármacos complementares como azitromicina. A discussão é se o tratamento precoce é eficaz ou não. A discussão não é sobre o uso desses medicamentos após o período inicial de sintomas ou em casos mais avançados de contágio. De fato, este último aviso é necessário, pois quem é contra o tratamento precoce usa trabalhos científicos que misturam pacientes em diferentes graus de evolução da doença e que apresentam sintomas há mais de cinco dias. É o caso, por exemplo deste artigo de pesquisadores brasileiros agregados no Coalização I.

Ainda, a comunidade médica contribui para essa discussão, à medida que se contradiz. Com efeito, a Sociedade Brasileira de Infectologia – SBI – desencoraja expressamente o tratamento precoce conforme documento expedido em 09/12/2020. Por sua vez, em abril de 2020 o Conselho Federal de Medicina – CFM – afirma em seu Parecer no 04/2020 que

“não há evidências sólidas de que esses medicamentos [HCQ, IVT etc.]  tenham efeito confirmado na prevenção e tratamento dessa doença”.

Como não há evidências sólidas, mas havia evidências fracas, cujos resultados clínicos ainda estavam em estudo à época, o CFM não desautorizou seu uso, permitindo-o com o consentimento do paciente, configurando a contradição com a SBI.

Por que se diz que HCQ não funciona?

Foram conduzidos vários estudos com HCQ que mostraram que os resultados entre o grupo tratado e o grupo de controle não eram estatisticamente significantes, isto é, não eram estatisticamente diferentes entre si. A conclusão desses estudos é que o tratamento precoce não funciona. Essa conclusão está baseada no fato de que a probabilidade dos grupos serem iguais é superior a 5%. Ou seja, para que se conclua pela diferença entre os grupos, a probabilidade de serem iguais, ou p-valor, deve ser menor que 5%. Como não acontece isso, os pesquisadores de saúde, fiéis ao que aprenderam nos bancos escolares, concluem que o tratamento precoce não funciona, por isso não se recomenda o uso, argumentando-se ademais que há efeitos colaterais. O nível de probabilidade de 5% é arbitrário, e significa que se a média de probabilidade tiver 6% de chances de serem iguais, conclui-se que são iguais e interpreta-se que o tratamento não teve efeito.

O problema é que, mesmo sem significância estatística, o grupo tratado apresenta consistentemente resultados mais favoráveis que o grupo de controle em diversas dimensões como menor tempo de hospitalização, por exemplo. O fato de não ser estatisticamente significante não significa, enfim, que o tratamento precoce necessariamente não funciona como será argumentado em breve.

De qualquer forma, há argumentos que contestam essas conclusões, os quais enquadram-se nos seguintes tipos:

  1. Os estudos que foram conduzidos entre tratado e controle não segmentam por estágio de sintomas, havendo mistura de pacientes em estado mais avançados com pacientes em estágios iniciais;
  2. A interpretação do p-valor maior que 5% está equivocada e precisa ser cotejada com a interpretação médica;
  3. O tamanho da amostra utilizada geralmente é pequeno para conclusões estatisticamente significantes;
  4. Novos estudos, com amostras mais bem dimensionadas, resultaram na significância estatística esperada, sugerindo que o tratamento precoce tem uma eficácia entre 20% e 47%.

A seguir discutem-se esses argumentos em mais detalhes.

Segmentação da Amostra e Interpretaçao do p-valor

De fato, vários estudos iniciais não segmentavam os pacientes pela gravidade dos sintomas. Obviamente a mistura de pacientes em diferentes graus de evolução da doença pode enviesar os resultados no sentido da ineficácia de um medicamento que funciona melhor nos estágios iniciais da doença.

Mesmo assim, alguns poucos segmentaram sua amostra pela gravidade e início dos sintomas e mostraram que a significância estatística ainda era superior a 5%. Portanto, não haveria evidência da eficácia.

A significância estatística não é a panaceia e requer melhor entendimento. Neste artigo publicado na Nature em março de 2019, pesquisadores mostram que a interpretação do p-valor seria equivocada. Este parágrafo resume o argumento:

Let’s be clear about what must stop: we should never conclude there is ‘no difference’ or ‘no association’ just because a P valor is larger than a threshold such as 0.05 or, equivalently, because a confidence interval includes zero. Neither should we conclude that two studies conflict because one had a statistically significant result and the other did not. These errors waste research efforts and misinform policy decisions. (grifo meu).

Esse artigo é importante para mostrar que a dificuldade de interpretação é muito mais abrangente do que os profissionais de saúde imaginam. Muitos deles sequer suspeitam que a interpretação de seus resultados está equivocada, haja vista que vai de encontro com o que aprenderam como melhores práticas.

E mais, essa dificuldade de interpretação não é exclusiva de pesquisadores em medicina, mas também em economia, e é mais antiga. McCloskey escreveu um artigo sobre a questão em 1985 no prestigioso periódico American Economic Review intitulado “The Loss Function Has Been Mislaid: The Rhetoric of Significance Tests”. Depois disso escreveu mais artigos, culminando com o livro intitulado “The cult of statistical significance: How the standard error costs us jobs, justice, and lives” em coautoria com Ziliak, cujo extrato pode ser encontrato aqui. Ênfase em lives, pois é disso que estamos falando aqui.

Finalmente, mais recentemente, um grupo de pesquisadores alertou de novo para o problema de interpretação, usando como exemplo estudos feitos segundo o protocolo de tratamento precoce, por meio de uma carta aberta. O documento detalha por que razão os estudos com p-valor maior que 5% não devem ser interpretados como se HCQ não tivesse qualquer eficácia. Um argumento contra a carta é que alguns dos seus signatários foram desautorizados pelos seus superiores. A resposta a esse tipo de crítica é perguntar: qual o argumento da carta que está equivocado ou errado e que precisa ser revisto? Segue-se um silêncio constrangedor.

Evidência Científica

Apesar de os estudos iniciais poderem ser contestados, a verdade é que a ciência avança e novos estudos foram conduzidos. Hoje há aproximadamente 200 estudos feitos, alguns com amostra de tratamento e controle aleatórios. Daí ser curioso que os pesquisadores da área e mesmo os órgãos representativos dos médicos se mantenham alheios aos novos artigos, como se determinadas conclusões na ciência não sofressem mutações assim como os vírus.

Aqui é preciso comentar que a estruturação da amostra em uma situação de pandemia é difícil (mais disso adiante). Particularmente, é difícil estabelecer quando os sintomas dos pacientes foram detectados e, a partir daí, ministrar placebo para um grupo e medicamentos para outro. Logo, é natural a demora para estudos dessa natureza e é difícil obter uma amostra numerosa. Isso explica muitos os resultados estatisticamente insignificantes encontrados, mesmo usando a melhor técnica disponível. Veja, quando a amostra é pequena, o desvio-padrão das estimativas tende a ser grande, daí que é fácil dizer que os efeitos são estatisticamente iguais mesmo substancialmente não sendo. Em oposição, dizer que os efeitos são diferentes é uma afirmação poderosa porque é difícil concluir isso.

É nesse contexto que surgem as metanálises, algumas das quais estão referenciadas nesta postagem, pois elas funcionam para ampliar a amostra ao agregar vários estudos. Quando se apresenta esse tipo de evidência científica a quem é contra o tratamento precoce, duas críticas emergem: ou que os dados estão comprometidos ou que há problemas metodológicos na metánalise. No primeiro caso, responde-se dizendo que foram usados os mesmos dados dos artigos que concluíram pela ineficácia do tratamento precoce, mas isso não quer dizer que os dados de diferentes artigos são comparáveis entre si (mais disso adiante).

A segunda crítica parece fazer mais sentido, porém artigos com esse tipo de metodologia são publicados há muito tempo, de modo que não há porque serem descartados. Contudo, uma crítica consistente nesse sentido seria a seguinte: se o pesquisador usar uma metodologia alternativa, os resultados não se mantêm, o que mostra que metanálises não são robustas. A questão é que nenhum crítico da metanálise que tive oportunidade de ler faz esse argumento.

A esse respeito, aliás, convém consultar este sítio que aglutina os 192 estudos dispostos em ordem cronológica de publicação sobre HCQ, IVM, Vitamina D entre outros feitos até hoje. No caso do HCQ, a principal imagem é esta:

O que está em acima da linha horizontal (em verde) mostra os estudos cujos efeitos do medicamento são positivos. Os que estão abaixo da linha horizontal (em vermelho) são aqueles que concluem por efeitos negativos do HCQ. O comentário importante aqui é a inexistência evidente de consenso científico sobre o tema, por isso o espanto quando se usa argumentos de que a ciência é que determina a conduta correta.

Para quem quer estudos RCT (randomized controlled trials) com HCQ, o zoom dos artigos desse tipo em ordem cronológica é este aqui:

Quando se apresentam essas evidências dos artigos publicados, alguns do RCTs com p-valor menor que 5%, é comum ouvir o argumento que esses artigos estão em pre-print ou que foram publicados em periódicos com relativamente baixo fator de impacto. Numa situação emergencial, talvez não haja tempo hábil de esperar a publicação definitiva de um artigo para agir. Ademais, viu-se a publicação de artigos fraudulentos contra a HCQ em um periódico respeitadíssimo na academia médica. Isso me leva a conjecturar que existe uma tendência dos editores dos periódicos mais importantes de rejeitarem artigos mais favoráveis à HCQ. Com efeito, a literatura acadêmica já identificou a possibilidade de vieses editoriais com respeito aos resultados dos artigos e da proximidade do editor com os autores. Este outro artigo é mais interessante, pois mostra a possibilidade de publicação de autores com proximidade ao editor. Não dá para saber se isso aconteceu no caso em discussão, mas também não vejo por que descartar à priori uma resistência mais dura a uma conclusão feita inicialmente. De qualquer forma, existem razões para não ser publicado num periódico de alto impacto e mesmo assim o resultado ser válido.

Protocolos médicos de tratamento

A medicina normalmente recomenda o tratamento precoce de qualquer doença. Ora, tratar uma doença em estágio mais avançado sempre vai ser mais custoso. Por isso, é difícil entender a recomendação da SBI de não fazer tratamento algum, aparentemente esperando-se uma evidência científica do tipo forte ou 1A. Mas esta é a prática usual? Creio que não: uma publicação de 2017 no BMJOpen mostrou que apenas 10% dos 9451 protocolos médicos têm recomendação forte com alta certeza. O quadro principal é este aqui:

Table 3

Distribution of the strength of the recommendations in UpToDate according to the certainty in evidence

Weak
recommendations
Strong
recommendations
All
recommendations
n (%) n (%) n (%)
Low certainty 4335 (66.7) 366 (12.4) 4701 (49.7)
Moderate certainty 2019 (31.1) 1740 (59.0) 3759 (39.8)
High certainty 147 (2.3) 844 (28.6) 991 (10.5)
Total 6501 (68.8% of all rec) 2950 (31.2% of all rec) 9451 (100)

Cerca de 50% desses mesmos protocolos têm baixa certeza e recomendações fracas, mostrando que a prática médica não é exatamente o que a SBI sugere.

Aliás, é curioso que seja prescrito paracetamol a quem tem sintomas leves de covid19 sem a devida fundamentação científica duplo-cego, aleatorizada, mostrando os efeitos positivos do paracetamol. No mínimo, trata-se de uma contradição de quem desencoraja o tratamento precoce.

Conclusões

Para rebater o que foi escrito aqui, é preciso mostrar a falha dos artigos que mostram a eficácia do HCQ. Argumentos de autoridade, como dizer que a SBI desencorajou o tratamento precoce não são exatamente científicos. Argumento ad hominen, dizendo que determinado pesquisador foi desautorizado por seus superiores também não vale. O que vale é desconstruir o que foi escrito aqui, preferencialmente usando a literatura pertinente.

Por que hospitais de referência e universidades de vanguarda não adotam o tratamento precoce? Isso não é argumento científico para desestimular o tratamento precoce, mas realmente é curioso e não tenho uma boa resposta para isso, embora esta publicação levante uma possibilidade. O único argumento que me ocorre é uma analogia com a Igreja da Idade Média. Mesmo errada, como dominante, calou vozes sensatas a respeito da Ciência, em que pese suas contribuições para a mesma ciência que renegou.

Parece haver evidências de que a IVM é mais eficaz que o HCQ. Há estudos nesse sentido, sendo que o último, publicado no Lancet, usa uma amostra realmente pequena de 12 tratados e 12 paciente de controle. Quando a amostra é pequena, a possibilidade de não rejeitar a hipótese nula de igualdade de resultados aumenta, mas no caso, o estudo constatou que:

Among patients with non-severe COVID-19 and no risk factors for severe disease receiving a single 400 mcg/kg dose of ivermectin within 72 h of fever or cough onset there was no difference in the proportion of PCR positives. There was however a marked reduction of self-reported anosmia/hyposmia, a reduction of cough and a tendency to lower viral loads and lower IgG titers which warrants assessment in larger trials. (grifo meu).

Finalmente, consistente com a publicação anterior este artigo mostra uma redução de 75% da mortalidade a partir de uma metánalise, conforme o seguinte trecho mostra:

[t]here was a 75% reduction in mortality (Relative Risk=0.25 [95%CI 0.12-0.52]; p=0.0002); 14/650 (2.1%) deaths on ivermectin; 57/597 (9.5%) deaths in controls) with favorable clinical recovery and reduced hospitalization. Many studies included were not peer reviewed and meta-analyses are prone to confounding issues. Ivermectin should be validated in larger, appropriately controlled randomized trials before the results are sufficient for review by regulatory authorities. (grifo meu)

Uma discussão metodológica e uma conclusão alternativa

Em uma discussão com o meu amigo Walter Belluzzo, professor de Economia na FEARP-USP, ele levantou questões metodológicas, aqui expostas quase que não palavras dele, que merecem reflexão. Elas não dizem respeito somente ao assunto em discussão, mas são mais gerais e sobre artigos publicados na área de saúde. Eu trago essa discussão em nome da honestidade intelectual e porque acho que tem mais substância que os argumentos que se leem comumente por aí.

Ele está numa posição privilegiada para analisar o assunto, pois, além de ser um econometrista de ponta e, por isso, muito melhor do que eu, ocasionalmente revisa artigos científicos da área de saúde traduzidos por sua esposa.

O problema desses estudos é muito maior do que isso. Após mais de 10 anos lendo artigos da área de saúde, conclui-se que sua condução metodológica é, de maneira geral, fraca e muitas vezes simplesmente errada. Como os pesquisadores de saúde têm menos segurança com estatística, não raro acabam contratando um estatístico que trata tudo como se fosse um problema de inferência simples com população bem definida.

Segundo, e talvez mais importante, a pandemia produziu um verdadeiro frenesi nas revistas científicas. A demanda por traduções explodiu, com prazo para tradução reduzido ao mínimo. Artigos sendo submetidos e publicados dentro de semanas, números especiais de revistas para todo lado. Com isso, o que foi explicado no parágrafo anterior ganhou proporções alarmantes, com uma probabilidade enorme de haver erros metodológicos importantes naqueles 200 estudos publicados.

Mas, há outros problemas a considerar, como segue.

Dados

Todos os estudos observacionais, sem uma estratégia de identificação bem definida, são inválidos para determinar efeitos causais, especialmente porque falham em enunciar claramente a hipótese de identificação do efeito. É importante definir a hipótese de identificação para superar problemas como características não observáveis e heterogeneidade da amostra. Tanto essas características quanto a heterogeneidade podem enviesar os resultados e refutar as conclusões.

Por exemplo, indivíduos que apresentam sintomas precoces da doença e alcançam tratamento são diferentes dos outros. Suponha um indivíduo que recebeu o tal tratamento precoce no Hospital Privado com sucesso aparente. Para considerar isso como evidência, é preciso supor que i) esse indivíduo é “igual” aos outros que vão para a rede pública, ou seja, não só em termos médicos/fisiológicos, mas também de comportamento e “eficiência” para identificar os sintomas precocemente; ii) que ser tratado no Hospital Particular é o mesmo que ser tratado no Hospital Público da periferia. Quem já esteve nos dois sabe que não é a mesma coisa. 

Como as duas condições anteriores falham, o conteúdo informacional desses estudos para estabelecer qualquer tipo de relação causal é, no mínimo, bastante discutível. Portanto, utilizar esse tipo de evidência para formulação de políticas públicas de saúde é bem mais complicado que isso. 

Metánalise

Com respeito à metanálise, o pressuposto número um e que os artigos são estatisticamente comparáveis. Acontece que isso é praticamente impossível de acontecer em vista da natureza do problema (i) e (ii) anteriores, pois a heterogeneidade entre procedimentos e eficiência condena qualquer esperança de saída.

Clinical Trial

Sobram os estudos do tipo Clinical Trial. Esse tipo de estudo é aparentemente impossível para o tratamento precoce. É fundamental num clinical trial que os sujeitos nos dois grupos sejam equivalentes, daí a necessidade de aleatorização. Quando o experimento é para o efeito de tratamento para pessoas doentes, a coisa complica bastante. Em geral, quem está no grupo de controle recebe algum outro tratamento. Não é possível, muitas vezes, simplesmente não tratar alguns pacientes. Essa é a primeira dificuldade: fixar o tratamento alternativo e todos os resultados são relativos a esse tratamento base. Essa parte pode ser resolvida com desenho cuidadoso do experimento. Só isso já complica para qualquer tipo de metanálise.

O verdadeiro problema com clinical trials para tratamento precoce é a introdução de uma característica temporal praticamente impossível de precisar num estudo. Não há como garantir que sua amostra contenha apenas pessoas identificadas com sintomas nos primeiros dias.

Assim, é difícil imaginar como é possível construir um experimento, que satisfaça as condições acima, e ainda comece o tratamento dentro de 3 ou 4 dias do início dos sintomas. De fato, existe muita heterogeneidade na resposta em termos de sintomas, entre os extremos, assintomático e sintomas graves. Nesse meio de caminho, entre os extremos, o surgimento de sintomas pode ocorrer em mais tempo. Além disso, tem dispersão em torno na média e, ao que parece, não é pequena. Se o experimento é para o medicamento e pronto, essa heterogeneidade se converte em dispersão e erro na estimativa do efeito de tratamento. Mas, se a definição da população alvo é determinada em termos de um evento aleatório, as coisas complicam bastante. Daí que talvez não haja como resolver esse problema, inviabilizando qualquer estudo sobre tratamento precoce.

Enfim, a qualificação “precoce” cria dificuldades praticamente intransponíveis para identificar efeitos causais de maneira minimamente aceitável, vez que talvez seja impossível controlar a dimensão temporal envolvida.

A conclusão dessa discussão é a seguinte, aparentemente é impossível determinar cientificamente e com grande grau de certeza de que o tratamento precoce funciona ou não funciona, como sugere o artigo publicado na BMJOpen, já mencionado. Em vista disso, cabe ao médico decidir o protocolo a seguir com seu paciente, como recomenda o CFM.

PS: Agradeço os comentários de Walter Belluzzo, Paulo Buchsbaum e Joelson Sampaio. Erros são somente meus.

Rodrigo De Losso

Rodrigo De Losso tem Ph.D em Economia pela Universidade de Chicago e é professor do Departamento de Economia da USP. A ideia aqui é mostrar como teoria econômica pode ser aplicada a temas do cotidanos, às vezes polêmicos, sem deixar de falar dos outros assuntos que o interessam com música, vinhos, literatura, cinema e política.

Artigos relacionados

5 Comentários

  1. “Aliás, é curioso que seja prescrito paracetamol a quem tem sintomas leves de covid19 sem a devida fundamentação científica duplo-cego, aleatorizada, mostrando os efeitos positivos do paracetamol. No mínimo, trata-se de uma contradição de quem desencoraja o tratamento precoce.” É isso mesmo que eu li? Isso foi escrito por um pH.D.?

  2. Sr jornalista parabéns
    Sugiro fazer uma comparação com casos de Covid na Africa onde se toma Ivermectina e a Hidroxicloroquina de rotina para outras doenças locais e os casos no mundo
    Dai se pode concluir que o ttto inicial(precoce) realmente é efetivo
    Na Africa os casos de covid são infinitamente menores

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo
%d blogueiros gostam disto:
Send this to a friend