Distribuição de Poisson: por que cientistas e mídia não entendem estatísticas de ensaios clínicos
A distribuição de Poisson tem aplicações cotidianas em ciência, finanças e seguros. Para comparar os resultados de alguns estudos biomédicos, mais pessoas deveriam estar familiarizadas com isso.
Crédito: Future Publishing / Getty Images
Principais conclusões- A mídia, e até mesmo muitos cientistas, não têm uma compreensão sólida o suficiente das estatísticas para distinguir entre descobertas significativas e não significativas em ensaios clínicos.
- Por exemplo, para determinar se os resultados de dois estudos sobre efeitos colaterais de vacinas são significativamente diferentes, é preciso entender a distribuição de Poisson.
- A distribuição de Poisson é relevante em muitos domínios, desde a biologia até a modelagem de risco para seguradoras.
No mês passado, o jogador do Bayern de Munique, Alphonso Davies, foi diagnosticado com miocardite leve após um reforço da vacina COVID. Ele não foi o primeiro atleta de alto perfil vacinado a sofrer miocardite. Preocupações com complicações cardíacas em pessoas saudáveis e vacinadas foram repetidamente noticiadas desde que as primeiras vacinas contra o COVID foram lançadas. Para investigar isso, ensaios clínicos estão monitorando a prevalência de miocardite em pessoas vacinadas.
Um estudo israelense descobriu que a miocardite ocorreu em 1 em 12.361 meninos vacinados de 12 a 15 anos. Comparando os resultados com os de um estudo anterior do CDC, o New York Times relatado que o número israelense é maior do que a estimativa dos Centros de Controle e Prevenção de Doenças de um caso por 16.129 adolescentes vacinados de 12 a 17 anos. estude sugerido em um carta para o editor que essas diferenças podem ser explicadas pela vigilância ativa em nossa população.
Devemos nos preocupar? O resultado israelense é uma prova de que a taxa de efeitos colaterais é maior do que pensávamos? Ou o resultado é devido ao acaso? Podemos responder definitivamente a essa pergunta, mas primeiro precisamos conhecer a distribuição de Poisson.
Uma cartilha sobre a distribuição de Poisson
Uma ferramenta estatística descrita pela primeira vez pelo matemático francês Simeon Poisson no início do século 19, modela eventos discretos e independentes que ocorrem dentro de um tempo ou espaço fixo. Os casos de miocardite, por exemplo, são discretos e independentes entre si. (Para os conhecedores: Casos em que os tamanhos das amostras são enormes e um dos resultados é altamente improvável (assim como neste caso), a distribuição de Poisson se aproxima da distribuição binomial.)
Aqui está como a distribuição de Poisson funciona. Vamos supor que você receba uma média de dez e-mails a cada hora. Qual é a probabilidade de você receber quatro e-mails na próxima hora? E os 12 e-mails? Ou 45 e-mails? Para quantificar isso, precisamos considerar a probabilidade de que a estatística amostrada (número de e-mails na próxima hora) possa se desviar da média conhecida. Dado que um fenômeno segue a distribuição de Poisson, a seguinte equação de aparência desagradável descreve a probabilidade de observar um certo número de eventos (k) dada uma determinada taxa média (λ).
P(k) = (λpara· E-λ)/para!
Desagradável, sim. Mas a equação não é muito difícil de utilizar. Colocando os números do nosso exemplo anterior (k = 10 emails e λ = 10 emails por hora, em média), a fórmula para calcular a probabilidade de receber exatamente 10 emails (P(10)) na próxima hora fica assim:
P(10) = (1010· E-10)/10! = 0,125
A letra e é uma constante estranha encontrada em toda a natureza (como pi) que é aproximadamente equivalente a 2,72. O ponto de exclamação não denota excitação; em vez disso, representa o fatorial (que, neste caso, é 10 x 9 x 8 x 7… x 1). Como mostrado, uma vez que toda a matemática é feita, a resposta é 0,125. Tradução: Há 12,5% de chance de você receber exatamente 10 e-mails na próxima hora.
Distribuição de Poisson para efeitos colaterais da vacina
O que isso tem a ver com a comparação de dois ensaios clínicos? Ótima pergunta. Quando você está tentando determinar a taxa de algo (λ, que neste caso é a taxa de miocardite como efeito colateral da vacina COVID), você precisa calcular um intervalo de confiança. Essa é uma maneira de os pesquisadores mostrarem que a resposta real está em algum intervalo específico de valores. Criticamente, isso estava faltando no relatório do NYT, bem como na análise da carta ao editor acima mencionada.
Os detalhes exatos envolvem algumas estatísticas minuciosas, mas podem ser calculados facilmente usando um software* (ou mesmo à mão com uma calculadora). O estudo israelense estimou uma taxa de miocardite de 1 em 12.361, mas o intervalo de confiança é de 1 em 7.726 a 1 em 30.902. Obviamente, a estimativa do CDC de 1 em 16.129 está dentro desse intervalo, o que significa que os estudos não são significativamente diferentes entre si.
Em outras palavras, o estudo israelense não sugere que a taxa de miocardite seja maior do que pensávamos. Seu resultado foi estatisticamente indistinguível do resultado do CDC.
Poisson: da biologia às finanças e além
A utilidade da distribuição de Poisson em biologia vai além da comparação de dois ensaios clínicos. Seu impacto abrange desde os primeiros trabalhos em genética bacteriana e distribuição de espécies até tecnologias ômicas que agora são predominantes na pesquisa em ciências da vida. Também tem aplicações em finanças e modelagem de risco para seguradoras.
Cientistas e escritores científicos, que muitas vezes precisam comparar os resultados de estudos biomédicos, devem estar mais familiarizados com a distribuição de Poisson . Essa fórmula obscura e abstrata tem um impacto maior em nossas vidas diárias do que se imagina.
* Para os aventureiros, o intervalo de confiança pode ser calculado usando R com o código:
x<- rpois(10000, 11)
baixo<- mean(x) – 2 * sqrt(var(x))
Alto<- mean(x) + 2 * sqrt(var(x))
Isso produz um intervalo de confiança de 4,4 a 17,6 casos de miocardite por tamanho da amostra de Israel (que foi de aproximadamente 135.971). Convertido em frações, isso é 1 em 30.902 e 1 em 7.726, respectivamente.
Neste artigo matemática Saúde Pública e EpidemiologiaCompartilhar:
