Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

SOBRE O AUTOR

Petrônio Fagundes de Oliveira Filho Professor aposentado de Pediatria, Epidemiologia e Bioestatística da Universidade de Caxias do Sul (UCS), RS. Mestre em Saúde Pública pela Universidade de São Paulo (USP). Especialista em Estatística Aplicada pela UCS, RS. Especialista em Pediatria pela Sociedade Brasileira de Pediatria (SBP). Graduado em Medicina pela UCS, RS.

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica – 2a edição foi concebida como uma introdução à epidemiologia e à bioestatística, salientando os assuntos que se constituem em uma instrumentação básica para a leitura crítica de artigos científicos na área da saúde. Para esta nova edição, houve a atualização de alguns capítulos e acréscimo de novos exemplos e mais 50 exercícios resolvidos. Entretanto, foi mantida a preocupação de não torná-lo muito complexo, focando naquilo que é mais encontrado na literatura científica biomédica. O objetivo é que ele continue a ter uma assimilação fácil tanto para o aluno da graduação quanto para o de pós-graduação, como também para os professores e outros profissionais da área da saúde. A finalidade, portanto, desta segunda edição do livro continua a ser a mesma: ajudar a evitar a intoxicação causada pela pseudociência.

Áreas de interesse Epidemiologia Bioestatística

9 786588 340363

Oliveira Filho - Epidemiologia.indd 1

01/06/22 14:40

00-Disfagia Orofaringea.indd 12

11/02/2022 09:23:46

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica, 2a edição Copyright © 2022 Editora Rubio Ltda. ISBN 978-65-88340-36-3 Todos os direitos reservados. É expressamente proibida a reprodução desta obra, no todo ou em parte, sem autorização por escrito da Editora. Produção Equipe Rubio Capa Bruno Sales Imagem de Capa ©iStock.com/arthobbit Editoração Eletrônica Edel

CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ O47e 2. ed. Oliveira Filho, Petrônio Fagundes de. Epidemiologia e bioestatística: fundamentos para a leitura crítica/Petrônio Fagundes de Oliveira Filho. – 2. ed. – Rio de Janeiro: Rubio, 2022. 272p. : il.; 24cm Inclui bibliografia e índice ISBN 978-65-88340-36-3 1. Epidemiologia. 2. Bioestatística. I. Título. 22-78004 Grabriela Faray Ferreira Lopes – Bibliotecaria – CRB-7/6643

Editora Rubio Ltda. Av. Franklin Roosevelt, 194 s/l. 204 – Centro 20021-120 – Rio de Janeiro – RJ Telefax: 55(21) 2262-3779 • 2262-1783 E-mail: rubio@rubio.com.br www.rubio.com.br Impresso no Brasil Printed in Brazil

CDD: 614.4 CDU: 616-036.22

Dedicatória

Este livro é dedicado à minha esposa, Lena; às minhas filhas, Nathalia e Andressa; e aos meus netos, Felix e Gabriel.

Agradecimentos

Obrigado aos nossos alunos na Universidade de Caxias do Sul que, nestas quatro décadas de magistério, facilitaram nosso trabalho, tornando-o uma diversão diária. Obrigado às crianças e aos adolescentes caxienses que, sem exigir recompensas, nos brindam com seus sorrisos. Obrigado aos Professores Wilson Paloschi Spiandorello e Emerson Rodrigues da Silva que gentilmente leram este livro, desde o início, apontando erros, dando ótimas sugestões e enriquecendo o resultado final. Obrigado aos amigos Professor Valter Teixeira Motta, parceiro em outra publicação (SPSS: Análise de Dados Biomédicos) e Professor Mário Bernardes Wagner, da Universidade Federal do Rio Grande do Sul, com quem muito aprendi. Obrigado aos colegas do Comitê de Ética em Pesquisa da Universidade de Caxias do Sul que, a cada reunião, nos enriquecem com seus conhecimentos. Obrigado à Editora Rubio por tornar possível este livro e colocar pessoas gentis para me orientar na sua confecção. Finalmente, um especial obrigado ao Professor José Mauro Madi, incansável incentivador e padrinho deste livro.

Apresentação

Este livro foi concebido como uma introdução à epidemiologia e à bioestatística, salientando os assuntos que se constituem em uma instrumentação básica para a leitura crítica de artigos científicos na área da saúde. Para a segunda edição, houve atualização de alguns capítulos e adição de novos exemplos e exercícios. Entretanto, foi mantida a preocupação de não tornar o livro muito complexo, focando naquilo que é mais encontrado na literatura científica biomédica, como mencionado na apresentação da primeira edição, acescido de algumas atualizações e com mais 50 exercícios resolvidos. O objetivo é que ele continue a ter uma assimilação fácil tanto para o aluno da graduação quanto para o de pós-graduação, mas também para os professores e outros profissionais da área da saúde.

A importância de separar a boa da má ciência se escancarou de maneira acentuada durante a pandemia de coronavírus, onde assistimos diariamente a divulgação de notícias sem nenhum fundamento científico e a publicação, mesmo por conceituadas revistas, de artigos científicos de qualidade duvidosa, criando grande confusão que alimenta os negacionistas da ciência. Como disse, Ben Goldacre, em seu interessante livro Bad Science (2008): “para essas pessoas a ciência é um monólito, um mistério e uma autoridade, em vez de um método”. A finalidade, portanto, desta segunda edição do livro continua a ser a mesma: ajudar a evitar a intoxicação causada pela pseudociência. O Autor

Prefácio da 1a edição

Há mais de 35 anos conheço Petrônio Fagundes de Oliveira Filho, médico formado pela Universidade de Caxias do Sul, professor e especialista em Pediatria, diretor de Ensino do Hospital Geral da Universidade de Caxias do Sul (UCS) e clínico ligado à Pediatria, à Bioestatística e à Epidemiologia. Mestre em Saúde Pública Materno-Infantil pela Universidade de São Paulo, o Professor Petrônio atua como pesquisador e faz parte do Núcleo de Capacitação e Consultoria em Bioestatística e Epidemiologia, onde realiza a análise estatística e epidemiológica de trabalhos de alunos e professores da UCS. Entre as suas principais obras, merece citação a publicação SPSS: Análise de Dados Biomédicos, publicado em 2009, em coautoria com o professor Valter Motta. Quando consultado, gentil e honrosamente, sobre a possibilidade de elaborar o Prefácio deste Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica, a ser lançado pela sempre excelente Editora Rubio, confesso que hesitei por alguns instantes, não só pela importância do livro que já se delineava, mas também pela responsabilidade de prefaciar uma publicação específica advinda de um profissional de estirpe. Some-se a este fato a grande admiração científica, ética, intelectual e pessoal que tenho por ele. Ao aceitar a incumbência, de imediato tive acesso aos trinta capítulos, elaborados magistralmente de modo didático, o que auxilia bastante no entendimento da Epidemiologia e da Bioestatística, pela clareza na exposição das

informações. Merecem ênfase as inovações na área estatística incluídas na Parte VI – Leitura Crítica e a proposição de exercícios aos leitores. Ficou explícito durante a leitura dos vários itens que o objetivo primordial foi o de fornecer uma referência de inestimável valor científico, não apenas para médicos e estudantes de Medicina, como também para outros profissionais da área da saúde. Além disso, o Professor Petrônio, tomado pela grande experiência adquirida ao longo de sua vida profissional e docente, decidiu traduzir sob a forma de texto o progresso alcançado, apresentando um livro de conteúdo abrangente e, acima de tudo, atualizado e ombreado com os congêneres internacionais. É um privilégio ter sido envolvido, de algum modo, com o surgimento deste bem-sucedido e importante compêndio. Isso porque, atualmente, o tema central desenvolvido nesta obra tem ocupado espaço amplo na área da pesquisa e fundamenta-se como relevante disciplina norteadora no campo da saúde. Espero que as atualizações e os conceitos expostos nos diversos capítulos deste livro sejam duradouros e se mantenham até que possamos reunir novos saberes para uma aperfeiçoada versão. Prof. Dr. José Mauro Madi

Professor Titular de Ginecologia e Obstetrícia na Universidade de Caxias do Sul (UCS). Professor do Programa de Pós-graduação em Ciências da Saúde da UCS. Mestre, Doutor e Pós-doutor pela Universidade Federal do Rio de Janeiro (UFRJ).

Prefácio da 2a edição

Há cerca de seis anos, a convite do professor Petrônio, me foi concedida a extremada regalia de preambular a 1a edição do Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica (Rio de Janeiro: Rubio, 2015. 248p. ISBN 978-85-8411-030-8). Para escrever o breve, mas sincero prólogo, confesso que compulsei o manuscrito que me foi encaminhado por várias vezes. E o fiz com a mesma ansiedade de um (jovem) aluno do curso de Medicina que folheia o livro da especialidade que recebe das mãos do seu professor, embora aquela não fosse a primeira vez que me havia sido conferida tal distinção. E, com base no que depreendi daquela observação crítica, tive a oportunidade de aprimorar, em muito, as minhas noções da especialidade que o professor Petrônio sempre dominou e discorreu com tanta maestria. A clareza e a objetividade que foram proporcionadas naquela 1a edição abrandaram, com certeza, os meus parcos conhecimentos de Epidemiologia e Bioestatística, obscurecidos com o decorrer dos anos. Na realidade, reconheço, à época, me esforcei muito para distinguir o autor da obra do meu querido amigo de cerca de 40 anos. Tentei, e confesso que em vão, interpretar e analisar exclusivamente a obra que estava sendo-me apresentada tal a dificuldade de dissociar o professor do amigo a quem sempre nutri tão grande afeição científica, moral, ética e intelectual. Conheço de sobejo o professor Petrônio Fagundes de Oliveira Filho, médico de estirpe, formado pela Universidade de Caxias do Sul, professor e especialista em Pediatria, ligado à Bioestatística e à Epidemiologia, e Mestre em Saúde Pública Materno-Infantil

pela Universidade de São Paulo. Some-se a todo o exposto, o fato de conhecer o professor Petrônio e toda a sua história familiar, profissional e de pesquisador, suas obras e análises estatísticas e epidemiológicas de trabalhos de alunos e professores da Universidade de Caxias do Sul, e a sua principal publicação, o SPSS: Análise de Dados Biomédicos, publicado em 2009. Agora, estou sendo apresentado a não menos importante 2a edição do Epidemiologia e Bioestatística, de novo apadrinhada pela sempre excelente Editora Rubio. Acréscimos, pequenas alterações, diminutas correções de rota, tornaram o texto mais aprazível, prazeroso e requintado. Tive a oportunidade de reavivar a minha memória com nótulas e orientações, agora mais encorpadas que as expostas na 1a edição. Enfim, repito, em parte, as minhas palavras incluídas nas primeiras páginas da versão anterior: continua sendo um privilégio e uma honra ter sido envolvido, mais uma vez e de algum modo, com o surgimento deste já bem-sucedido e importante compêndio. Isso porque, atualmente, o tema central desenvolvido nesta obra tem ocupado espaço amplo na área da pesquisa. Espero que as atualizações e os conceitos expostos nos diversos capítulos deste livro possam ser, por muitos anos ainda, reavaliados pela sapiência e competência do sempre estimado mestre. Prof. Dr. José Mauro Madi

Sumário

PARTE I DEFININDO DADOS, 1 1 Natureza dos Dados, 3 Variáveis e dados, 3 Tipos de variáveis, 3 Leitura complementar, 6

PARTE II DESCREVENDO OS DADOS, 7 2 Tabelas, 9 Introdução, 9

5 Resumo dos Dados Numéricos, 25 Introdução, 25 Medidas de tendência central, 25 Medidas de dispersão, 28 Leitura complementar, 31

PARTE III MEDIDAS BÁSICAS EM EPIDEMIOLOGIA, 33 6 Medidas de Frequência, 35 Razões, taxas e proporções, 35

Tabela de frequência para variáveis nominais, 9

Prevalência, 35

Tabela de frequência para variáveis ordinais, 10

Incidência, 36

Tabela de frequência para variáveis numéricas, 10

Relação entre prevalência e incidência, 38

Tabelas cruzadas, 12

Leitura complementar, 40

Leitura complementar, 12

3 Gráficos, 13

Epidemia e endemia, 38

7 Medidas de Associação, 41 Risco relativo, 41

Introdução, 13

Odds ratio, 42

Gráficos para dados ordinais e nominais, 13

Razão de prevalência, 44

Gráficos para dados numéricos discretos, 13 Gráficos para dados numéricos contínuos, 15 Dados cumulativos, 17 Curva de frequência percentual cumulativa, 17 Leitura complementar, 19

4 Distribuição dos Dados, 21

Tamanho de efeito padronizado, 44 Leitura complementar, 46

8 Medidas de Impacto, 47 Risco atribuível ou redução absoluta do risco, 47 Risco atribuível proporcional, 48 Redução relativa do risco, 48

Introdução, 21

Número necessário para tratar, 49

Distribuição normal, 22

Número necessário para causar dano, 50

Outras formas de distribuição, 22

Risco atribuível populacional, 50

Leitura complementar, 24

Leitura complementar, 51

9 Análise de Sobrevida, 53 Introdução, 53 Dados censurados, 53 Método de Kaplan-Meier, 53 Curva de Kaplan-Meier, 55 Mediana do tempo de sobrevida, 56 Comparando a sobrevida em dois ou mais grupos, 56 Leitura complementar, 59

Protocolo de uma revisão sistemática com metanálise, 82 Análise quantitativa de uma revisão sistemática (metanálise), 84 Uso de software, 84 Leitura complementar, 88

14 Testes Diagnósticos, 89 Introdução, 89 Sensibilidade e especificidade, 90 Valor preditivo, 91

PARTE IV DELINEAMENTOS DE PESQUISA, 61

Razão de probabilidades, 92

10 Delineamentos de Pesquisa, 63

Múltiplos testes, 97

Testes com variáveis contínuas, 95

Introdução, 63

Acurácia de um teste diagnóstico, 99

Questão de pesquisa, 63

Coeficiente de kappa, 99

Tipos de delineamentos, 64

Leitura complementar, 100

Elementos básicos de um delineamento, 64 Leitura complementar, 64

11 Estudos Observacionais, 65

15 Vieses, 101 Introdução, 101 Viés de seleção, 101

Introdução, 65

Viés de aferição, 102

Relato de caso ou série de casos, 65

Viés de confusão, 102

Estudos ecológicos, 65

Validade, 104

Estudos transversais, 66

Leitura complementar, 105

Estudos caso-controle, 67 Estudos de coorte, 69 Vantagens e desvantagens dos estudos de coorte, 72 Leitura complementar, 72

12 Ensaios Clínicos, 73 Introdução, 73 Características do ensaio clínico, 73 Elementos básicos de um ensaio clínico, 74

PARTE V INFERÊNCIA ESTATÍSTICA, 107 16 População e Amostra, 109 Introdução, 109 Tipos de amostras, 109 Estatísticas e parâmetros, 110 Tamanho amostral, 110 Leitura complementar, 112

17 Distribuições de Probabilidades, 113

Ensaios clínicos de equivalência e não inferioridade, 77

Distribuição normal, 113

Outros tipos de ensaios clínicos, 77

Distribuição t de Student, 116

Fases de experimentação, 79

Distribuição binomial, 118

Leitura complementar, 79

Leitura complementar, 121

13 Revisão Sistemática, 81

Distribuição normal padronizada, 115

18 Intervalo de Confiança e Valor P, 123

Introdução, 81

Introdução, 123

Revisões tradicionais (narrativas) e sistemáticas, 81

Intervalo de confiança, 123 Teste de hipótese, 127

Intervalo de confiança versus valor p, 132

Força da recomendação, 181

Leitura complementar, 133

Leitura complementar, 183

19 Testes Paramétricos, 135

25 Análise de um Estudo Terapêutico, 185

Introdução, 135

Introdução, 185

Teste t para amostras independentes, 135

Validade dos resultados, 185

Teste t para amostras emparelhadas, 137

Quais são os resultados?, 187

Análise de variância, 138

Aplicabilidade dos resultados, 187

Correlação e regressão, 143

Escala de Jadad, 188

Leitura complementar, 151

Leitura complementar, 189

20 Teste Qui-Quadrado, 153

26 Análise de um Estudo Diagnóstico, 191

Introdução, 153

Introdução, 191

Uso e restrições do χ2, 154

Validade dos resultados, 191

Correção para a continuidade de Yates, 154

Quais são os resultados?, 192

Teste exato de Fisher, 154

Aplicabilidade dos resultados, 192

Leitura complementar, 156

Leitura complementar, 194

21 Testes Não Paramétricos, 157

27 Análise de um Estudo Prognóstico, 195

Introdução, 157

Introdução, 195

Teste de Mann-Whitney, 157

Validade dos resultados, 195

Teste de Wilcoxon, 159

Quais são os resultados?, 197

Teste de Kruskal-Wallis, 161

Aplicabilidade dos resultados, 197

Coeficiente de correlação de Spearman, 163

Leitura complementar, 197

Leitura complementar, 165

PARTE VI LEITURA CRÍTICA, 167 22 Medicina Baseada em Evidências, 169 O que é medicina baseada em evidências?, 169 Etapas da medicina baseada em evidências, 170 Leitura complementar, 173

28 Análise de um Estudo Etiológico, 199 Introdução, 199 Validade dos resultados, 199 Quais são os resultados?, 200 Aplicabilidade dos resultados, 200 Leitura complementar, 201

Introdução, 175

PARTE VII EXERCÍCIOS RESOLVIDOS, 203

Estrutura de um artigo científico, 175

29 Exercícios, 205

23 Artigo Científico, 175

Esquema geral de avaliação de um artigo científico, 178 Leitura complementar, 179

Referências, 223

30 Respostas dos Exercícios, 225 Referências, 248

24 Avaliação da Qualidade da Evidência, 181 Qualidade da evidência, 181

Índice, 249

PARTE

Definindo Dados

Capítulo 1

Natureza dos Dados, 1

CAPÍTULO

^^ VARIÁVEIS

Natureza dos Dados

E DADOS

Variável é a característica de interesse medida em cada elemento da amostra ou da população. Conforme o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos. Por exemplo, idade, sexo e tipo sanguíneo são variáveis. Dados são informações obtidas quando se mede uma variável. Por exemplo, na Tabela 1.1, 32 anos é um dado para a variável idade e feminino (F) é um dado para a variável sexo. O termo “medida” é utilizado aqui em um sentido mais amplo, pois não se mede o gênero de alguém. TABELA 1.1 Variáveis e dados Paciente

Idade

Sexo

Grupo sanguíneo

Paciente 1

Paciente 2

Paciente 3

Isso porque obtemos tal informação observando-se o indivíduo ou solicitando ou aplicando um questionário a este. Em contrapartida, a altura e a pressão arterial são variáveis que podem ser mensuradas. ^^ TIPOS

DE VARIÁVEIS

Existem dois tipos principais de variáveis – as categóricas e as numéricas. Estas são subdivididas em dois subtipos, conforme mostrado na Figura 1.1, que também resume suas características principais.

Variáveis nominais Uma variável nominal é aquela cujos dados se enquadram em categorias que não podem ser colocadas em ordem numérica. Um exemplo desse tipo de variável é o tipo sanguíneo. Observe na Tabela 1.2 a distribuição hipotética dos quatro tipos sanguíneos (O, A, B e AB), em uma amostra de 100 indivíduos.

Variáveis categóricas

Variáveis numéricas

Nominal

Ordinal

Discreta

Contínua

Valores em categorias arbitrárias

Valores em categorias ordenadas

Valores inteiros em ordem numérica

Sem unidade

Unidade de contagem

Valores contínuos em ordem numérica ou escala

FIGURA 1.1 Tipos de variáveis

Unidade de medida

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

TABELA 1.2 Tipo sanguíneo de 100 pacientes (dados hipotéticos) Grupo sanguíneo

Número de pacientes

Total

100

Essa configuração de tabela é chamada de tabela de frequência. Ela mostra como o número ou a frequência dos tipos de sangue é distribuído entre as quatro categorias. Dessa maneira, 65 pacientes têm sangue do tipo O; 15 do tipo A e assim por diante. As variáveis nominais têm duas características: 1. Os dados não têm quaisquer unidades de medida. 2. A ordenação das categorias é completamente arbitrária. Pertencer a uma categoria não significa ter maior importância do que pertencer à outra. Quando uma variável nominal têm duas possibilidades, ela é dita dicotômica ou binária [p. ex., sexo (masculino/feminino), doente (sim/ não)]. As variáveis dicotômicas são bastante utilizadas em Epidemiologia.

Variáveis ordinais Uma variável é dita ordinal quando há uma ordem inerente ou uma hierarquia entre as categorias. Um exemplo de variável ordinal bastante conhecido é a Escala de Coma de Glasgow (ECG) – uma variável categórica ordinal. Tal escala mede o grau de comprometimento cerebral (p. ex., após traumatismo craniano). Na ECG, o paciente é avaliado por sua capacidade de resposta em três áreas: resposta à abertura ocular, resposta verbal e resposta motora. A pontuação da ECG pode variar de 3 (morte cerebral ou lesão grave) a 15 (sem lesão ou lesão leve). Em outras palavras, existem 13 possíveis valores ou categorias de lesão cerebral. Imagine que seja determinada a pontuação utilizando-se a ECG dos últimos 90 pacientes

com traumatismo craniano admitidos em uma unidade de emergência. Os resultados estão na tabela de frequência mostrada na Tabela 1.3. As variáveis ordinais têm duas características importantes: 1. Os dados não têm quaisquer unidades de medida (do mesmo modo que as variáveis nominais). 2. A ordenação das categorias não é arbitrária, como nas variáveis nominais. Assim, é possível ordenar as categorias de uma forma lógica, com sentido. Em outras palavras, pode-se dizer que um paciente na categoria “15” tem menor grau de lesão do que um na categoria “14”. Da mesma maneira, um paciente na categoria “14” tem menor grau de lesão do que aquele na categoria “13” – e assim por diante. No entanto, há outra característica muito importante desses escores (ou de qualquer outro conjunto de ordinais): a diferença entre dois escores adjacentes não é necessariamente a mesma entre qualquer outro par de escores adjacentes. Por exemplo, a diferença no grau de lesão entre os escores da ECG 5 e 6 não é necessariamente a mesma dos escores 6 e 7. Também não se pode dizer que um TABELA 1.3 Distribuição dos escores da Escala de Coma de Glasgow em 90 pacientes com traumatismo craniano Escala de Coma de Glasgow

Número de pacientes

Total

PARTE

Descrevendo os Dados

Capítulo 2

Tabelas, 9

Capítulo 3

Gráficos, 13

Capítulo 4

Distribuição dos Dados, 21

Capítulo 5

Resumo dos Dados Numéricos, 25

CAPÍTULO

Gráficos

^^ INTRODUÇÃO

A escolha adequada do tipo de gráfico ajuda a descrever os dados e visualizar as informações de maneira clara. O que é adequado depende, principalmente, do tipo de dados, bem como das características particulares do que se quer explorar. Um gráfico de frequência, por exemplo, pode ser utilizado para ilustrar, explicar uma situação complexa em que palavras ou uma tabela podem ser confusos, extensos ou de outro modo insuficiente. Além disso, um gráfico em um relatório pode causar um efeito positivo no leitor ou fazê-lo abandonar a leitura. Por outro lado, deve-se evitar usar gráficos nos quais poucas palavras expressam claramente o que se quer mostrar. ^^ GRÁFICOS

PARA DADOS ORDINAIS E NOMINAIS

Gráfico de setores ou pizza Cada segmento (fatia) do gráfico de pizza deve ser proporcional à frequência da categoria que representa. Por exemplo, a Figura 3.1 é um gráfico de pizza para a distribuição da escolaridade de um grupo de gestantes. A desvantagem de um gráfico de pizza é que ele só pode representar uma variável (na Figura 3.1, escolaridade). Portanto, há necessidade de um gráfico separado para cada variável que se deseja representar. Ademais, um gráfico de pizza pode perder clareza se for usado para representar mais do que quatro ou cinco categorias. Na

maioria das vezes, em um artigo científico ou relatório não há necessidade de se usar esse tipo de gráfico. Como regra, não se deve utilizar gráficos de pizza. Ele é usado mais no mundo dos negócios.

Gráfico de barras Uma alternativa para o gráfico de pizza para os dados nominais é o gráfico de barras. Este é um gráfico que costuma apresentar a frequência no eixo vertical e a categoria no eixo horizontal. O gráfico de barras simples é apropriado se apenas uma variável for mostrada. A Figura 3.2 é um gráfico de barras simples para os dados apresentados na Figura 3.1. Vale lembrar que todas as barras devem ter a mesma largura. Do mesmo modo, os espaços iguais devem ser iguais entre as barras. Esses espaços enfatizam a natureza categórica dos dados. Se houver mais de um grupo, pode-se usar o gráfico de barras agrupadas. A Tabela 3.1 mostra a frequência de parto normal e cesariana de acordo com a faixa etária de 866 partos a termo em uma maternidade. A Figura 3.3 apresenta os dados da tabela, em forma de um gráfico de barras agrupadas. Uma alternativa ao gráfico de barras agrupadas é o gráfico de barras empilhadas (Figura 3.4). ^^ GRÁFICOS

PARA DADOS NUMÉRICOS DISCRETOS

Os gráficos de barras podem ser utilizados para representar os dados numéricos discretos da

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica 2,4%

0,3%

Analfabeta

29,6%

Fundamental incompleto 46,0%

Fundamental completo Médio Superior

21,6%

FIGURA 3.1 Gráfico de setores mostrando a distribuição da frequência da escolaridade de 962 gestantes do Hospital Geral de Caxias do Sul (RS), em 2008

50%

Porcentagem

40%

30%

20%

10%

0% Analfabeta

Fundamental incompleto

Fundamental completo

Médio

Superior

Escolaridade

FIGURA 3.2 Gráfico de barras simples mostrando a distribuição da frequência da escolaridade de 962 gestantes do Hospital Geral de Caxias do Sul (RS), em 2008

Gráficos

TABELA 3.1 Distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008 Faixa etária

Tipo de parto Normal

Cesariana

<20 anos

104 (68,0%)

49 (32,0%)

20 a 35 anos

439 (61,9%)

270 (38,1%)

>35 anos

49 (49,5%)

50 (50,5%)

Total

592 (61,6%)

369 (38,4%)

mesma maneira que os dados ordinais. Teoricamente, os dados numéricos discretos deveriam ser representados por linhas verticais e não por barras, já que são valores “pontuais”, porém os pacotes estatísticos mais comuns não oferecem essa facilidade. Na Figura 3.5 vê-se, representado por um gráfico de barras, o número de consultas realizadas durante o pré-natal por 861 gestantes.

^^ GRÁFICOS

PARA DADOS NUMÉRICOS CONTÍNUOS

Histograma Uma variável numérica contínua pode ter um grande número de valores e é, geralmente, impraticável fazer um gráfico sem primeiro agrupar os valores. Os dados agrupados são representados utilizando um histograma de frequência, o qual é delineado no eixo vertical, com a amplitude do grupo no eixo horizontal. Um histograma parece um gráfico de barras, mas sem quaisquer espaços entre as barras adjacentes. Isso enfatiza a natureza contínua da variável. Se os grupos da tabela de frequência são todos da mesma largura, as barras do histograma também vão ter a mesma largura. A Figura 3.6 é um histograma dos dados agrupados de uma amostra aleatória da hemoglobina de 70 gestantes e possibilita que se examine o formato da distribuição dos dados. Observe que a distribuição é relativamente simétrica.

80%

70%

60%

50% Normal

40%

Cesariana

30%

20%

10%

0% <20 anos

20 a 35 anos

>35 anos

FIGURA 3.3 Gráfico de barras agrupadas mostrando a distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

100% 90% 80% 70% 60% Normal

50%

Cesariana

40% 30% 20% 10% 0% <20 anos

20 a 35 anos

>35 anos

FIGURA 3.4 Gráfico de barras empilhadas mostrando a distribuição da frequência de parto normal e cesariana de acordo com a faixa etária da parturiente, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008

125

Frequência

100

0 0

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Número de consultas no pré-natal

FIGURA 3.5 Gráfico de barras mostrando a distribuição do número de consultas realizadas no pré-natal por 861 gestantes de partos a termo, na Maternidade do Hospital Geral de Caxias do Sul (RS), em 2008

CAPÍTULO

Resumo dos Dados Numéricos

^^ INTRODUÇÃO

Conforme visto nos capítulos anteriores, é possível descrever o conjunto de dados brutos, organizando-os em forma de tabelas e de gráficos. Além disso, pode-se examinar a forma de sua distribuição. Esses procedimentos farão com que os dados deixem de ter uma imagem confusa e passem a fazer sentido. No entanto, muitas vezes é mais útil resumir ainda mais os dados numéricos, apresentando um ou alguns valores que sejam representativos desses dados. As maneiras mais utilizadas para resumir o conjunto de dados são: nn Primeiro, um valor em torno do qual os dados têm uma tendência para se reunir ou se agrupar, denominado medida sumária de localização ou medida de tendência central. nn Em segundo lugar, um valor que mede o grau em que os dados se dispersam, denominado medida de dispersão ou variabilidade. É possível comparar diferentes conjuntos de dados quantitativos com esses dois valores resumidores. ^^ MEDIDAS

DE TENDÊNCIA CENTRAL

Costuma ser empregada uma das seguintes medidas de posição central: a moda, a mediana ou a média.

Moda A moda (Mo) é a categoria ou valor dos dados que tem a maior frequência. A moda não é particularmente útil com dados contínuos

numéricos em que não há dois valores iguais. Outra desvantagem desta medida é que pode haver mais de uma moda em um conjunto de dados. Como exemplo, observe a Tabela 5.1 que mostra o volume expiratório forçado em 1s (VEF1) de 42 escolares asmáticos. Verifica-se que há dois valores que aparecem com maior frequência: 0,91 e 0,99L. Cada um deles ocorre três vezes na amostra. Nesse caso, tem-se uma amostra bimodal. Se houvesse um valor que ocorresse com maior frequência, teríamos uma distribuição unimodal. Caso não haja observação mais frequente, a distribuição é amodal.

Mediana A mediana (Md) representa o valor central em uma série ordenada de valores. Assim, metade dos valores será igual ou menor que o valor mediano e a outra metade igual ou maior do que ele. Suponha que se disponha de n valores dispostos em ordem crescente. Então, a mediana é o valor localizado na posição dada pela fórmula: 1 Md (n 1) 2

A equação correspondente à mediana dos dados da Tabela 5.1 é: 1 46 Md ( 42 1) 21, 5 valor 2 2

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

TABELA 5.1 Valores do VEF1 (L) de 42 escolares asmáticos no início do tratamento, no Ambulatório de Doenças Respiratórias Pediátricas (Adrep), Caxias do Sul (RS), em 1998 Paciente

VEF1

Paciente

VEF1

0,61

1,02

0,65

1,02

0,65

1,03

0,66

1,04

0,77

1,05

0,80

1,06

0,82

1,10

0,82

1,11

0,89

1,17

0,91

1,21

0,91

1,21

0,91

1,23

0,93

1,25

0,95

1,28

0,95

1,29

0,97

1,29

0,98

1,32

0,98

1,35

0,99

1,36

0,99

1,49

0,99

1,79

VEF1: volume expiratório forçado em 1s.

Portanto, a mediana é o 21,5o valor. Este é obtido somando-se o 21o valor com o 22o e dividindo por dois. Ou seja, a mediana (0,99 + 1,02)/2 = 1,005L. Consequentemente, pode-se afirmar que, nessa amostra de 42 escolares asmáticos em início de tratamento, 50% tiveram um VEF1 abaixo de 1,005L e 50% tiveram um VEF1 acima desse valor. A mediana é útil para resumir dados assimétricos, pois ela não é sensível aos valores extremos. No exemplo apresentado, se houvesse a substituição do valor 0,61 por 0,061, a mediana permaneceria a mesma.

Média A média é o resultado da razão entre a soma de todos os valores observados e o número total de observações. A média da população é

representada pela letra grega µ e a média da amostra pelo símbolo (leia-se, x barra). x 1 i xi N N

Média populacional

x 1 x i xi n n

Média amostral

Em que: N = número total de valores observados na população. n = número total de valores observados na amostra. xi = conjunto de valores observados, x1, x2, x3,..., xn. Como normalmente não se consegue trabalhar com toda a população, calcula-se . A média tem indicação de uso em distribuições simétricas. Possui o maior poder matemático e é a medida descritiva mais utilizada (e preferida). A média não é necessariamente igual a algum dos valores da amostra. Ela é apenas uma expectativa matemática. A média dos valores da Tabela 5.1 é igual a: 0 , 61 0 , 65 0 , 65 ... 1, 49 1, 79 42 43, 80 1, 04L 42

Uma das propriedades da média é que, se ela for subtraída de cada um dos valores da amostra, a soma destas diferenças é zero (Tabela 5.2). Quando o número de observações no conjunto de dados é pequeno e/ou a distribuição assimétrica, a média pode representar uma informação distorcida. Isso porque a média é muito sensível aos valores extremos. Por exemplo, se o valor 0,61 da Tabela 5.1 fosse substituído, por erro de digitação, por 0,061, a média diminuiria para 1,03L. Se esse erro fosse cometido com o valor 1,79, digitando-o 17,9, a média subiria para 1,43. Isto mostra a tendência da média em acompanhar os valores extremos. Conforme aumenta o número de observações, diminui a influência dos extremos.

Resumo dos Dados Numéricos

TABELA 5.2 Diferença entre os valores e a média Paciente

d = xi – x

0,61

1,04

–0,43

0,65

1,04

–0,39

0,65

1,04

–0,39

0,66

1,04

–0,38

0,77

1,04

–0,27

0,80

1,04

–0,24

FIGURA 5.1 Distribuição simétrica

0,82

1,04

–0,22

x: média da amostra; Md: mediana.

0,82

1,04

–0,22

0,89

1,04

–0,15

0,91

1,04

–0,13

—

0,99

1,04

–0,05

1,02

1,04

–0,02

—

1,21

1,04

0,17

1,23

1,04

0,19

1,25

1,04

0,21

1,28

1,04

0,24

1,29

1,04

0,25

1,29

1,04

0,25

1,32

1,04

0,28

1,35

1,04

0,31

1,36

1,04

0,32

1,49

1,04

0,45

1,79

1,04

0,75

Soma das diferenças

0,0

x: média da amostra; xi: conjunto de valores observados, x1, x2, x3,..., xn; d: diferença.

Além disso, a média não pode ser usada com os dados ordinais, pois, por não serem números reais, eles não podem ser somados ou divididos. Em distribuições simétricas, a média e a mediana têm o mesmo valor (Figura 5.1). No exemplo, a média e a mediana têm valores muito semelhantes. Isso leva a supor que a distribuição dessa amostra é simétrica. Quando a média é maior que a mediana, a distribuição tem assimetria positiva, pois a média tende a acompanhar os valores mais altos; quando a média é menor do que a mediana, diz-se que a distribuição tem assimetria negativa (Figura 5.2).

x Md

–

FIGURA 5.2 Distribuições assimétricas x: média da amostra; Md: mediana.

Qual a medida de localização mais apropriada? O principal aspecto a ser lembrado é que a média não pode ser utilizada com os dados ordinais. Isso porque estes não são números reais e a mediana pode ser usada para os dados ordinais e numéricos, particularmente quando os últimos têm distribuição assimétrica. A Tabela 5.3 resume a utilização das medidas de tendência central. TABELA 5.3 Escolha da medida de posição mais apropriada Tipo de variável

Medida de tendência central Moda

Mediana

Média

Nominal

Sim

Não

Ordinal

Sim

Não

Discreta

Sim

Contínua

Não

Sim, se a distribuição for assimétrica

Sim

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

^^ MEDIDAS

DE DISPERSÃO

Amplitude É a diferença entre o maior e o menor valor do conjunto de dados. No conjunto de medidas da Tabela 5.1 dos escolares asmáticos, a amplitude é igual a: Amplitude = 1,79 – 0,61 = 1,18L A amplitude é uma medida simples de dispersão, de variabilidade dos dados, mas é pouco informativa. Pode acarretar informações distorcidas da verdadeira variabilidade, pois são usados apenas dois dados da amostra para calculá-la. A amplitude não é afetada pela assimetria, mas é sensível à adição ou à remoção de um valor atípico.

Intervalo interquartil

1,75

P75

P25

–3s

–2s

–1s

1,25

1,00

0,75

25% 25%

25%

1,50

VEF1

Os percentis são valores específicos de uma distribuição que servem para dividi-la em 100 partes. Já os quartis são valores específicos de uma distribuição que a dividem em quatro partes. O primeiro quartil (percentil 25) delimita o primeiro quarto, ou seja, o ponto abaixo do qual temos 25% dos dados e acima do qual temos 75%. A mediana – ou percentil 50 – (segundo quartil) divide a série na metade e o quartil superior (P75 ou percentil 75) delimita a quarta parte restante (Figura 5.3). A distância entre o primeiro e o terceiro quartil é denominada intervalo (ou amplitude) interquartil (IIQ). Considere a frequência de distribuição de uma variável (p. ex., os valores do VEF1 dos 42 asmáticos mostrados na Tabela 5.1). O percentil

(P) é o valor na posição equivalente a P/100 (n + 1). Logo, a posição na série ordenada dos dados o P25 é igual a 25/100 (42 + 1) ≅ 11. O 11o valor é 0,91; logo, o P25 é igual a 0,91. Da mesma maneira, conclui-se que o P75 é igual a 1,21. Consequentemente, o IIQ é igual a 0,91 a 1,21L. Isto significa que 50% (75% – 25%) dos asmáticos, quando iniciaram o tratamento, tinham VEF1 variando de 0,91 a 1,21L. Além disso, costuma-se representar o intervalo interquartil por meio do box-and-whisker-plot, em que a borda superior da caixa representa o P75 e a borda inferior o P25. A altura da caixa é o IIQ. A linha média (Figura 5.4) representa a mediana (P50). As linhas que se projetam para fora da caixa em ambos os lados foram chamadas por John Wilder Tukey (1915-2000), idealizador do boxplot, de whiskers (“bigodes de gato”, em inglês). Em distribuições simétricas, as linhas representam os valores mínimos e máximos. Em conjunto de valores assimétricos, os dados dos valores mínimo e máximo podem se distanciar de forma substancial dos percentis 25 e 75. Assim, seus valores são assinalados separadamente no boxplot e as linhas são recolhidas para posições mais próximas. As linhas, ou whiskers, situam-se até 1,5 IIQ acima ou abaixo dos percentis 25 e 75. Os valores acima de 1,5 IIQ são considerados

25% Média

FIGURA 5.3 Intervalo interquartil

FIGURA 5.4 Valores do VEF1 no início do tratamento em 42 escolares asmáticos VEF1: volume expiratório forçado em 1s (L).

PARTE

III

Medidas Básicas em Epidemiologia

Capítulo 6

Medidas de Frequência, 35

Capítulo 7

Medidas de Associação, 41

Capítulo 8

Medidas de Impacto, 47

Capítulo 9

Análise de Sobrevida, 53

CAPÍTULO

^^ RISCO

Medidas de Associação

RELATIVO

O risco relativo (RR) é a razão entre a incidência do desfecho em indivíduos expostos e a incidência do desfecho em indivíduos não expostos. O RR estima a magnitude da associação entre a exposição e o desfecho (doença). Em outras palavras, compara a probabilidade de ocorrência do desfecho entre os expostos com a probabilidade de ocorrência do desfecho nos não expostos. A partir da tabela de contingência 2 × 2 (Tabela 7.1), tem-se que o estimador do RR é dado por: RR =

a/(a + b) Incidência em expostos = Incidência em não expostos c/(c + d)

Observando os resultados do estudo da Tabela 7.2, modificada, verifica-se que os autores usaram a taxa de incidência ou a densidade de incidência em função de que nem todos os indivíduos estiveram expostos pelo mesmo tempo. Por isso, a expressão pessoas-tempo (pessoasano) aparece como denominador no cálculo da incidência. TABELA 7.1 Tabela de contingência 2 × 2, para o cálculo do risco relativo Durante o acompanhamento Doença

Sem doença

Expostos

a+b

Não expostos

c+d

a+c

b+d

Apesar do enfoque dos autores do artigo estar correto ao usarem a taxa ou a densidade de incidência, os dados serão utilizados com objetivo didático, sem levar em consideração o tempo a que cada indivíduo ficou exposto. Também será calculado o RR, usando a incidência cumulativa. Nessa coorte de 2.889 indivíduos com transtornos de sono, encaminhada para avaliação em uma clínica do sono, 1.579 tinham, na avaliação inicial, apneia obstrutiva do sono (AOS) e se constituíram no grupo exposto. No acompanhamento evolutivo, no grupo exposto (com AOS), 627 indivíduos desenvolveram hipertensão arterial; no grupo controle de 310 indivíduos, sem AOS, 78 tornaram-se hipertensos (Tabela 7.3). 627 0, 397 1.579 78 0, 252 Inão exposto 310 I exposto 0, 397 RR Inão exposto 0, 252 Iexposto

1, 578 ( IC 95%: 1, 290 1, 930 )

Isto sugere que os indivíduos com AOS têm risco maior de desenvolver hipertensão quando comparados com os controles. Quanto maior o RR, mais forte é a associação entre a doença em questão e a exposição ao fator de risco. Um RR igual a 1 indica que a doença e a exposição ao fator de risco não estão relacionadas. Valores menores que 1 indicam uma associação negativa entre o fator de risco e a doença (efeito protetor).

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

TABELA 7.2 Taxa bruta de incidência de hipertensão em controles e em pacientes com apneia obstrutiva do sono tratados ou não tratados com pressão positiva contínua nas vias respiratórias Pacientes com AOS Controles n = 310

Inelegíveis para CPAP n = 462

Recusaram CPAP n = 195

Não aderiram ao CPAP n = 98

Tratados com CPAP n = 824

Hipertensão, n

175

119

280

Total de pessoas-ano, n

3.563

5.239

2.037

1.015

9.149

Densidade de incidência bruta, n por 100 pessoas-ano (IC95%)

2,19 (1,71 a 2,67)

3,34 (2,85 a 3,82)

5,84 (4,82 a 6,86)

5,12 (3,76 a 6,47)

3,06 (2,70 a 3,41)

AOS: apneia obstrutiva do sono; CPAP: pressão positiva contínua nas vias respiratórias. Fonte: adaptada de Marin et al., 2012.

TABELA 7.3 Tabela 2 × 2 modificada do estudo de Marin et al., 2012 Durante o acompanhamento desenvolveram Hipertensão

Não

AOS

627

952

1.579

Controles

232

310

Total

705

1.184

1889

AOS: apneia obstrutiva do sono.

^^ ODDS

Razão de chances A odds ratio (OR), ou razão de chances, é a razão entre dois odds. A OR costuma estar associada a estudos retrospectivos do tipo caso-controle com desfechos dicotômicos. Ela expressa a razão entre a odds de exposição entre os que têm o desfecho (casos) e a odds de exposição nos livres de desfecho (controles). Usando a Tabela 7.4, pode-se calcular a OR, também descrita como razão dos produtos cruzados, pela fórmula:

RATIO

A odds (chance) é a razão entre o número de observações em um grupo que tem determinada característica e aqueles que não a possuem. Representa a probabilidade de um caso ter sido exposto dividido pela probabilidade de um caso não ter sido exposto. A odds é a razão entre duas características complementares, ou seja, a probabilidade de que um evento ocorra (p) dividido pela probabilidade de que o evento não ocorra (1 – p). odds

p 1 p

OR =

a a× d = c = Oddsexposição Não doentes b c × b d Oddsexposição Doentes

Em um estudo caso-controle de base populacional (Tabela 7.5) para verificar a associação entre o uso de chupeta durante o sono e risco de síndrome da morte súbita infantil (SIDS; do inglês, sudden infant death syndrome), foi encontrada uma OR bruta igual a (ver também Capítulo 11, Estudos Observacionais, no item Estudos Caso-controle). TABELA 7.4 Tabela de contingência 2 × 2 para cálculo da odds ratio

Consequentemente: odds p 1 odds

Doença

Sem doença

Expostos

a+b

Não expostos

c+d

a+c

b+d

Medidas de Associação

TABELA 7.5 Tabela 2 × 2 da associação entre o uso de chupeta durante o sono e risco de SIDS Uso de chupeta

Casos* (SIDS)

Controles

Sim

Não

162

236

Total

169

309

*Os números na tabela não correspondem aos números totais (185 casos versus 312 controles), em razão de dados perdidos. SID: síndrome da morte súbita infantil (do inglês, sudden infant death syndrome) Fonte: adaptada de Li et al., 2006.

7 7 236 1.652 162 OR 0 ,14 73 162 73 11.826 236 IC95% 0 , 06 0 , 31

A OR varia de 0 ao infinito. Quando o valor da OR se aproxima de 1, a doença e o fator de risco não estão associados. Acima de 1, significa que existe associação e valores menores de 1 indicam uma associação negativa (efeito protetor). No exemplo citado, as crianças que usaram a chupeta na noite anterior tiveram efeito protetor para a SIDS. A distribuição da OR é assimétrica (skewed). Por isso, às vezes, utiliza-se o logaritmo natural (ln) OR, em vez da OR. Um exemplo é o ln OR comparando crianças que morreram de SIDS e sem SIDS com relação à chupeta – ln (0,14) = –2. Um ln OR igual a 0 significa que não há associação entre o fator de risco e o desfecho. Um ln OR acima de 2 indica grande associação entre o fator e o desfecho. No exemplo, tem-se um efeito protetor, pois o ln OR é negativo (–2).

Odds ratio e risco relativo A OR não deve ser entendida como uma medida aproximada do RR, exceto para doenças raras (doenças, em geral, com prevalência menor do que 10%). Caso contrário, a OR tenderá a superestimar a magnitude da associação e a OR afasta-se da hipótese nula da não associação (OR = 1), independentemente de ser um fator de risco ou de proteção. O viés responsável pela discrepância entre as estimativas do RR e da OR – built-in bias – pode ser definido como a razão entre a OR e o RR estimados. Multiplicando o built-in bias pelo RR, obtém-se a OR: 1 p doença não expostos OR RR 1 p doençaexpostos c 1 c d RR 1 a a b

Se o built-in bias é igual a 1, não há viés. No exemplo da provável proteção contra a SIDS pelo uso da chupeta, o viés é igual a: c 162 1 c d 1 162 236 0, 65 Viés 1 a 1 7 a b 7 73

Logo, multiplicando o RR = (7/80)/(162/398) = 0,215 pelo built-in bias, obtém-se: OR = RR × viés = 0,215 × 0,65 = 0,14 Na Tabela 7.6, é mostrada uma relação entre a OR e o RR.

TABELA 7.6 Força de associação do risco relativo comparado com a odds ratio Insignificante

Pequena

Moderada

Muito grande

Grande

Quase perfeita

Perfeita

1,0

1,2

1,9

3,0

5,7

∞

1,0

1,5

3,5

9,0

360

∞

Fonte: adaptada de http://www.sportsci.org/resource/stats/.

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

^^ RAZÃO

DE PREVALÊNCIA

Com o mesmo princípio das duas medidas anteriores, a razão de prevalências (RP) compara a prevalência do desfecho entre os expostos com a prevalência do desfecho entre os não expostos. Matematicamente, a RP é calculada de maneira semelhante ao RR. Apenas, deve-se ter em mente que o desfecho e a exposição foram medidos no mesmo momento, enquanto para o cálculo do RR há necessidade de estimar a incidência que exige passagem de tempo. Usando uma tabela de contingência 2 × 2 (Tabela 7.7), tem-se: a (a b) RP c Prevalência de doençanão expostos (c d) Prevalência de doençaexp ostos

Também é possível verificar a prevalência de exposição entre doentes e não doentes: RP

Prevalência de exposiçãodoentes Prevalência de exposiçãonão doentes

a (a c ) b (b d)

Em um estudo transversal, os autores encontraram maior prevalência de infecções congênitas entre as puérperas com idade acima de 20 anos, em comparação com as mulheres com menos de 20 anos (Tabela 7.8).

P 20 anos

129 0 ,102 1.266

TABELA 7.7 Tabela de contingência 2 × 2, para o cálculo da razão de prevalências No momento Doença

Sem doença

Expostos

a+b

Não expostos

c+d

a+c

b+d

TABELA 7.8 Infecções perinatais e idade da gestante Gestante infectada Sim

Não

>20 anos

129

1.137

1.266

≤20 anos

225

234

Total

138

1.362

1.500

Fonte: adaptada de Madi et al., 2010.

P 20 anos

9 0 , 038 234

129 RP 1, 266 2, 649 (IC95% : 1, 368 5,132) 9 234

A frequência de infecções congênitas entre as puérperas com mais de 20 anos de idade foi, aproximadamente, 2,7 vezes maior do que entre as com 20 anos ou menos. No Capítulo 2, Tabelas, na Tabela 2.8, é mos trado outro exemplo do uso da razão de prevalências. ^^ TAMANHO

DE EFEITO PADRONIZADO

O tamanho de efeito padronizado (TEP) compara a diferença das médias de dois grupos e estima a magnitude dessa diferença. Tal como as medidas anteriores, é considerada uma estatística de efeito para a avaliação das associações e suas magnitudes. Possui outros nomes: d de Cohen, tamanho de efeito (originado do inglês effect size) e diferença de médias padronizada. Ao contrário do RR, da OR e da RP, que são estatísticas usadas em variáveis categóricas, o TEP foi concebido para ser utilizado com variáveis quantitativas. TEP(d)

x1 x2 sc

CAPÍTULO

Medidas de Impacto

^^ RISCO

ATRIBUÍVEL OU REDUÇÃO ABSOLUTA DO RISCO

Diferentemente das medidas apresentadas anteriormente (risco relativo [RR], odds ratio [OR] e tamanho de efeito padronizado [TEP]), o risco atribuível (RA) tem características de medida de impacto. O RA, em vez de concentrar-se na associação em si, refere-se mais às consequências e às repercussões da exposição sobre a ocorrência do desfecho. O RA é a medida do excesso ou do acréscimo absoluto de risco que pode ser atribuído à exposição. Com o RA, é possível estimar o número de casos que podem ser prevenidos se a exposição for eliminada e, assim, mensurar a magnitude do impacto em termos de saúde pública imposto por essa exposição. O risco de desenvolver o desfecho (incidência) está aumentado em RA nos indivíduos expostos em comparação com os que não estão expostos. Nos estudos de coorte, costuma-se usar mais a expressão “risco atribuível” ou “diferença de risco”. Nos ensaios clínicos, emprega-se mais a expressão redução absoluta do risco (RAR), pois se espera que a intervenção reduza o risco. Calcula-se o RA ou a RAR pela diferença absoluta entre as incidências dos expostos (Ie) e não expostos (Ine): RA ou RAR = |Ie – Ine| Utilizando a tabela de contingência 2 × 2 (Tabela 8.1), fica expressa da seguinte maneira:

TABELA 8.1 Tabela de contingência 2 da RAR

× 2 para o cálculo do RA ou

Durante o acompanhamento Doença

Sem doença

Expostos

a+b

Não expostos

c+d

a+c

b+d

a c RA ouRAR a b c d

No Capítulo 7, Medidas de Associação, no estudo de coorte sobre apneia obstrutiva do sono (AOS) e hipertensão, verificou-se que a incidência de hipertensão arterial em indivíduos portadores e não portadores de AOS foi respectivamente: = Ie

627 78 = 0 , 397 = Ine = 0 , 252 1579 310

Dessa maneira, o RA é igual a: RA 0 , 397 0 , 252 0 ,145 IC95% : 0 , 091 a 0 ,199

Este resultado mostra que os indivíduos expostos (portadores de AOS) têm 15% a mais de risco (Figura 8.1) comparado com os não expostos de apresentar o evento em questão (hipertensão).

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Logo,

45% 40% 35%

RAP

15%

30% 25%

RR 1 RR

Substituindo no exemplo anterior, em que o RR = 0,397/0,252 = 1,575, tem-se:

20% 15% 10%

RAP

5% 0%

Incidência em expostos

Incidência em não expostos

FIGURA 8.1 Risco atribuível

^^ RISCO

ATRIBUÍVEL PROPORCIONAL

O RA expresso com relação à incidência nos expostos e apresentado em percentual é denominado risco atribuível proporcional (RAP) ou fração etiológica nos expostos. O RAP informa qual a proporção de desfecho, expressa em porcentagem, entre os expostos que poderiam ter sido prevenidos se a exposição fosse eliminada. É dada pela fórmula: RA

Ie Ine 100 Ie

^^ REDUÇÃO

0 , 397 0 , 252 100 0 , 365 100 36 , 5% 0 , 397

Dessa maneira, 36,5% da incidência de hipertensão nos expostos pode ser atribuída à AOS. Outra forma de se chegar a esse mesmo resultado é por meio do RR (ver Capítulo 7, Medidas de Associação), usando a seguinte fórmula: I I I I RAP e ne 100 e ne 100 I e Ie Ie 1 1 100 1 100 I RR e I ne

RELATIVA DO RISCO

O RAP é calculado quando o RR é maior do que 1, ou seja, quando a exposição é um fator de risco para a doença. Quando o RR é menor do que 1 e, portanto, a exposição é um fator de proteção, como se espera que ocorra nos ensaios clínicos, pode-se calcular a redução relativa do risco (RRR): RRR

Ine Ie 100 Ine

Como a incidência nos expostos é igual à taxa de eventos nos expostos (TEE) e a incidência em não expostos é igual à taxa de eventos nos controles (TEC), pode-se escrever a fórmula da seguinte maneira: RRR

Portanto, no exemplo mostrado no RA, tem-se: RAP

1, 575 1 100 36 , 5% 1, 575

TEC TEE 100 TEC

O Physicians’ Health Study (1989) é um ensaio clínico randomizado controlado, duplo-cego, desenvolvido com o objetivo de determinar se uma dose baixa de aspirina (325mg a cada 48h) diminui a mortalidade cardiovascular e se o betacaroteno reduz a incidência de câncer. Participaram desse estudo 22.071 indivíduos por uma média de 60,2 meses (Tabela 8.2). O estudo TABELA 8.2 Resultados do Physicians’ Health Study Desfechos por ano IAM

Sem IAM

Aspirina

139

10.898

11.037

Placebo

239

10.795

11.034

IAM: infarto agudo do miocárdio.

Medidas de Impacto

do componente aspirina mostrou os seguintes resultados: Calculando-se a incidência de infarto agudo do miocárdio (IAM) em ambos os grupos, tem-se: TEE(Ie ) =

Número de eventosexp ostos Total sujeitosexp ostos

139 = 11..037

= 0 , 0126 por ano

TEC(Ine ) =

Número de eventosnão exp ostos Total sujeitosnão exp ostos

239 = = 0 , 0217 por ano 11.034

Logo, a RRR encontrada é: RRR

0 , 0217 0 , 0126 100 0 , 42 100 42% 0 , 0217

^^ NÚMERO

NECESSÁRIO PARA TRATAR

O número necessário para tratar (NNT) é sempre um número inteiro e significa a estimativa do número de indivíduos que devem receber uma intervenção terapêutica, durante um período específico de tempo, para evitar um efeito adverso ou produzir um desfecho positivo. O NNT equivale à recíproca da redução absoluta do risco (RAR) ou diferença de risco: NNT =

1 RAR

Conhecer o NNT ajuda os médicos no processo de pesar os benefícios e os riscos de um tratamento. No exemplo, mostrado no Physicians’ Health Study (ver Tabela 8.2), tem-se que: RAR = |0,0126 – 0,0217| = 0,0091

Da mesma maneira que o RAP, a RRR pode também ser calculada facilmente pela seguinte fórmula, usando o RR: TEC TEE TEC TEE RRR 100 100 TEC TEC TEC (1 RR ) 100

No exemplo do Physicians’ Health Study, o RR = TEE/TEC = 0,0126/0,0217 = 0,58, consequentemente: RR = (1 – RR) × 100 = (1 – 0,58) × 100 = = 0,42 × 100 = 42% Ou seja, os resultados mostram redução de 42% no risco de IAM no grupo que usou aspirina e a conclusão dos autores foi que esse ensaio clínico evidenciou, com relação à prevenção primária de doença cardiovascular, diminuição no risco de IAM. No entanto, as evidências quanto ao acidente vascular encefálico (AVE) (dano) permanecem inconclusivas. Quando o risco de dano é muito alto ou esse dano é muito grave, deve-se fazer um balanço entre o risco e o benefício.

Logo, o NNT é igual a: NNT

1 109 , 9 110 0 , 0091

IC95% : 80 177

No exemplo, NNT igual a 110 significa que é necessário tratar 110 pacientes com aspirina para evitar IAM. Suponha que determinada doença tenha letalidade de 100% em indivíduos não tratados e 50% nos tratados. O RR é igual a 0,5; a RRR, a 0,5; a RAR, a 0,5; e o NNT, a 2. Agora, se a letalidade dos não tratados for igual 10% e 5% nos tratados, haverá o mesmo RR de 0,5 e a mesma RRR igual a 0,5 e RAR de 0,05 e NNT de 20. Portanto, com RRR constante, o NNT está inversamente relacionado com a proporção de indivíduos no grupo-controle que têm um evento adverso. O NNT também é inversamente proporcional à RRR. Com um mesmo risco basal, um tratamento mais efetivo com o dobro de RRR reduzirá o NNT pela metade. O NNT pode ser calculado também pela recíproca da multiplicação da TEC pela RRR. NNT

1 ( TEC RRR )

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

^^ NÚMERO

NECESSÁRIO PARA CAUSAR DANO

ARA = |TEE – TEC| = 0,0108 – 0,0089 = 0,0019

Deve-se comparar o NNT com o número necessário para causar dano (NND). O NND deve ser interpretado como o número de pacientes tratados para que um deles apresente um efeito adverso e é calculado pela recíproca do aumento do risco absoluto (ARA), equivalente à diferença de risco ou risco atribuível: NND =

ARA = |Ie – Ine| ou ARA = |TEE – TEC| No Physicians’ Health Study sobre o uso de aspirina na prevenção de IAM, foram verificados também os efeitos colaterais da aspirina (Tabela 8.3), como o AVE.

TEE (Ine ) = =

Número de eventosexp ostos Total de sujeitosexp ostos

9 119 = 0 , 0108 por ano 11.037

Número de eventosnão exp ostos Total de sujeitosnão exp ostos 98 = 0 , 0089 por ano 11.034

1 = 526 0 , 0019

Ou seja, para evitar um IAM, há a necessidade de tratar 110 pacientes. Além disso, a cada 526 tratados espera-se um caso de AVE, havendo um benefício bem maior. ^^ RISCO

1 ARA

O ARA é calculado da mesma maneira que a RAR:

TEE (Ie ) =

= NND

ATRIBUÍVEL POPULACIONAL

O RA estima o impacto da exposição em estudo apenas sobre os expostos, sem informar o excesso de casos em toda a população. O risco atribuível populacional (RApop) mede o excesso de incidência da doença em uma população total que está associada à exposição, informação útil no planejamento em saúde pública. O RApop é dado pela diferença entre a incidência da doença na população total (Ipop) e a incidência em não expostos (Ine). RApop = Ipop – Ine A incidência populacional (Ipop) é dada conhecendo-se a proporção da população que está exposta (p = prevalência) e a proporção não exposta na população (q = 1 – p). Dessa maneira, a Ipop é igual a: Ipop = (Ie × p) + (Ine × q)

Retornando ao exemplo mostrado no RA sobre AOS e hipertensão (ver Tabela 8.1), verificouse que o RA é igual a 0,145. Portanto, supondo que a prevalência de AOS na população seja de 4%, a Ipop é igual a: 627 = 0 , 397 1579 78 = Ine = 0 , 252 310

= Ie TABELA 8.3 Physicians’ Health Study: efeitos colaterais da aspirina (número necessário para causar dano) Desfechos por ano AVE

Sem AVE

Logo, o RApop é igual a:

Aspirina

119

10.918

11.037

Placebo

10.936

11.034

AVE: acidente vascular encefálico.

Ipop = (0,397 × 0,04) + (0,252 × 0,96) = 0,258

RApop = Ipop – Ine = 0,258 – 0,252 = = 0,006 ou 0,6%

PARTE

Delineamentos de Pesquisa

Capítulo 10

Delineamentos de Pesquisa, 63

Capítulo 11

Estudos Observacionais, 65

Capítulo 12

Ensaios Clínicos, 73

Capítulo 13

Revisão Sistemática, 81

Capítulo 14

Testes Diagnósticos, 89

Capítulo 15

Vieses, 101

CAPÍTULO

Ensaios Clínicos

^^ INTRODUÇÃO

Experimentos são os estudos em que o pesquisador manipula a variável preditora (a intervenção) e observa o efeito no desfecho avaliado ao longo do tempo. A abordagem experimental, especificamente o ensaio clínico randomizado controlado, é a ferramenta de escolha para comparar terapêuticas ou intervenções. Os estudos experimentais podem também comparar os cuidados prestados por serviços de saúde, programas de educação em saúde e estratégias administrativas. Os estudos experimentais realizados com seres humanos são denominados ensaios clínicos. Nos ensaios clínicos não controlados, os indivíduos servem como seus próprios controles (antes e depois). Os resultados desses estudos estão sujeitos a vários problemas: nn Melhora previsível: o paciente melhora espontaneamente e não pelo tratamento. nn Flutuação na gravidade da doença: o paciente melhora não pela intervenção, mas por oscilação na gravidade da doença. nn Efeito Hawthorne: o indivíduo melhora pela atenção e não pela terapêutica. Uma limitação importante surge quando se quer avaliar a evolução de um grupo selecionado por estar no extremo de uma distribuição sem que haja um grupo-controle. Empiricamente, observa-se que indivíduos encontrados em determinado momento, em um dos extremos de uma distribuição, tendem a estar menos distantes da média em um momento posterior, sem que qualquer intervenção se tenha

desenvolvido. Esse fenômeno é conhecido como efeito de regressão à média. Por exemplo, uma pessoa com doença crônica tem dias piores e outros melhores. Se ela é medicada com gotas homeopáticas ou faz uso de florais nos dias em que se sente excepcionalmente mal, vai notar frequente melhora, ao seguir esses “tratamentos”. Não que eles funcionem, mas eles atendem à regressão à média. ^^ CARACTERÍSTICAS

DO ENSAIO

CLÍNICO Um ensaio clínico deve ter algumas características fundamentais (Figura 12.1). Os indivíduos devem ser designados por meio de randomização para os grupos de comparação: nn A randomização é a melhor abordagem no delineamento de um ensaio clínico. ll Randomizar significa sortear (por meio de computadores, tábua de números aleatórios) os indivíduos para decidir a alocação destes em um dos grupos de estudo. O elemento decisivo da randomização é a imprevisibilidade da próxima alocação. nn O pesquisador compara o grupo de estudo com um grupo-controle apropriado. nn O investigador manipula a variável independente (preditora).

Exemplo de ensaio clínico Dexametasona oral para bronquiolite: um ensaio clínico randomizado.

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

População definida

Randomização

Grupo experimental

Desfecho clínico

Sem desfecho clínico

Grupo-controle

Desfecho clínico

Sem desfecho clínico

FIGURA 12.1 Desenho de um ensaio clínico randomizado controlado

RESUMO nn Objetivo:

determinar se o tratamento com dexametasona adicionado ao salbutamol reduz o tempo para alta em pacientes com bronquiolite e possível asma. nn Métodos: comparamos a eficácia e segurança da dexametasona, 1mg/kg, depois 0,6mg/kg por mais 4 dias, com placebo para bronquiolite aguda em pacientes com risco de asma, conforme determinado por eczema ou história familiar de asma em um parente de primeiro grau. Todos os pacientes receberam salbutamol inalado. O tempo rapidez para alta foi o resultado primário de eficácia. (Figura 12.2). nn Resultados: duzentos bebês previamente saudáveis com diagnóstico de bronquiolite, idade mediana de 3,5 meses, foram incluídos. Cinco lactentes que receberam placebo precisaram de internação na unidade de terapia intensiva durante o tratamento na enfermaria (p = 0,02). Entre 100 lactentes que receberam dexametasona, a média geométrica de tempo até a alta foi de 18,6h (IC95%, 14,9 a 23,1h); entre 90 pacientes controle, 27,1h (IC95%, 21,8 a 33,8 h). A proporção, 0,69 (IC95%, 0,51 a 0,93), revelou redução média de 31% do tempo de internação, favorecendo a dexametasona (p = 0,015). Vinte e dois pacientes com dexametasona e 19 pacientes controle foram readmitidos para a curta permanência na enfermaria na semana após a alta (p = 0,9). Nenhuma hospitalização ou efeitos colaterais foram relatados durante sete dias de observação. nn Conclusões: dexametasona com salbutamol encurtou o tempo permanência hospitalar durante episódios de bronquiolite em pacientes com eczema ou história familiar de asma em um parente de primeiro grau. As visitas à clínica na semana subsequente ocorreram de forma semelhante para os dois grupos. Fonte: adaptada de Alansari et al., 2013.

^^ ELEMENTOS

BÁSICOS DE UM ENSAIO CLÍNICO

Seleção dos sujeitos Os autores devem determinar e explicar detalhadamente os critérios de inclusão e exclusão (Tabela 12.1). O grau de detalhamento deve ser suficientemente preciso para que outros reproduzam o estudo. O tamanho da amostra é determinado pelo poder do teste estatístico. Poder é a habilidade de o teste estatístico detectar diferenças entre os grupos, uma vez existindo tais diferenças na população em estudo. Vale lembrar que resultados não significativos podem ser apenas uma evidência para um inadequado tamanho amostral. O grupo-controle deve ser selecionado utilizando-se os mesmos critérios do grupo experimental. Convém prestar atenção a possíveis armadilhas que podem gerar vieses: nn Uso de grupo-controle histórico (não concorrente). nn Grupo-controle selecionado de outros locais (outras clínicas, outros hospitais). O grupo-controle adequado é um grupocontrole concorrente, tratado no mesmo momento e no mesmo local do grupo experimental. O característico é o grupo-controle não receber tratamento. Mais comumente, recebem um placebo, indistinguível do tratamento experimental, porém sem componente ativo. Mesmo assim, pode haver melhora dos participantes do grupo-controle (efeito placebo). Quando não

Ensaios Clínicos

Avaliados para seleção (n=560)

Inscrição

Excluídos (n=360) Não atenderam os critérios de inclusão (n=200) Recusaram-se a participar (n=126) Outras razões (n=34)

Análise

Seguimento

Alocação

Randomizados (n=200)

Grupo dexametasona (n=102)

Grupo placebo (n=98)

Receberam a intervenção (n=101) Não receberam (n=1) Motivo: recusa após randomização

Receberam a intervenção (n=97) Não receberam (n=1) Motivo: recusa após randomização

Perda no seguimento (n=0)

Perda no seguimento (n=1) mas incluído na análise primária

Abandonou a intervenção (n=1) Motivo: excluído por critério: teve apneia antes da apresentação

Analizados (n=100) Excluídos da análise (n = 2), ver razões anteriores

Abandonou a intervenção (n=7) Motivo: 5 necessitaram de UTI; 2 excluídos por critério: sem eczema ou história familiar de asma

Analisados (n=90)

Excluídos da análise (n=8) Motivos: 5 necessitaram de UTI, 2 excluídos por critério, 1 recusou após randomização

FIGURA 12.2 Delineamento do estudo do exemplo de um ensaio clínico UTI: unidade de terapia intensiva.

TABELA 12.1 Função dos critérios de inclusão e exclusão nn Objetivos

dos critérios de inclusão e exclusão: ll Restringir a heterogeneidade da amostra ll Diminuir o número de variáveis independentes ll Fazer com que exista uma probabilidade maior de as diferenças nos desfechos estarem relacionadas com os tratamentos ll Melhorar a validade interna, ou seja, o grau em que os resultados do estudo são consistentes para aquela amostra particular de indivíduos. Ela depende, basicamente, do rigor metodológico usado para delinear o ensaio clínico, podendo ser ameaçada por dois tipos de erros: sistemático e aleatório ll Tornar a generalização (validade externa) mais precisa

nn Critérios

de inclusão e exclusão muito rígidos: a capacidade de generalização ll Reduzem a validade externa ll Diminuem

for ético suspender o tratamento e administrar placebo, o grupo-controle pode ser constituído por indivíduos que recebem o tratamento padrão.

Alocação A alocação deve ser aleatória. A randomização é a principal técnica para reduzir o viés, criando grupos homogêneos. Como foi visto, é uma das características fundamentais dos ensaios clínicos. O poder da randomização depende da ocultação da sequência de alocação. A randomização pode ser: nn Completa: os indivíduos que obedecem ao critério de inclusão e exclusão são randomizados de modo a todos terem a mesma probabilidade de pertencer a cada um dos grupos. Isto maximiza o poder. Pode ser feita por blocos para assegurar a igualdade numérica dos grupos (estudos multicên tricos). nn Estratificada: os participantes são estratificados de acordo com possíveis variáveis de confusão (gravidade da doença, idade, sexo etc.) e a randomização é realizada dentro de cada estrato.

76 nn

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Randomização alocação desigual: os sujeitos têm maior probabilidade de ser randomizados em um grupo (em geral, grupo experimental) do que o outro (placebo). Este tipo de randomização tem menor poder.

Condução/seguimento/avaliação Em um ensaio clínico, deve estar assegurado de que o estudo tem um tempo de seguimento adequado, pois nem todos os indivíduos participam conforme o planejamento original. Podem ocorrer perdas de alguns pacientes durante o acompanhamento, seja porque com o tempo se descobre que eles não têm a doença em estudo ou porque não aderiram ao tratamento ou intervenção e abandonaram o estudo. Quanto maior o número de pacientes perdidos e menos informações sobre eles, há menos confiança nos resultados do estudo. De modo geral, não se deve tolerar perdas maiores que a incidência do desfecho no estudo. Uma regra simples é que perdas menores que 5% produzem pouco viés e perdas maiores que 20% são uma ameaça importante à validade do estudo. As perdas entre 5% e 20% devem ser avaliadas com cuidado, se possível utilizando-se uma análise de sensibilidade e pior cenário. Principalmente, pelo maior risco de viés, se as perdas forem diferentes nos grupos. Neste tipo de análise, nos estudos com resultado positivo, todos os pacientes perdidos no grupo experimental, inicialmente, são considerados como tendo o desfecho. Posteriormente, analisa-se como se nenhum dos indivíduos perdidos no grupo-controle tivesse alcançado o desfecho. Se o resultado permanecer positivo, as perdas não afetarão a validade do estudo. Estudos sem relato adequado ou nenhum relato de perdas ou exclusões devem ser avaliados com muito cuidado. Outro aspecto importante, no seguimento dos sujeitos da pesquisa, é o tratamento igual de todos os grupos. Para garantir este princípio, utiliza-se da técnica de cegamento ou mascaramento. Tal técnica impede que os participantes da pesquisa (pesquisadores, avaliadores e participantes) tomem conhecimento de qual grupo de tratamento o participante se encontra. Esse conhecimento antecipado pode influenciar as

expectativas, as opiniões e as crenças com relação aos resultados do estudo. O cegamento tem como principal finalidade a eliminação do viés de aferição, além de melhorar a adesão ao tratamento, reduzir as perdas de seguimento e diminuir o viés causado por cointervenções (assistência suplementar maior para um dos grupos). Quando o cegamento ocorre nos pacientes e nos pesquisadores, diz-se que o estudo é duplocego. Se ele também incluir os avaliadores do estudo, ele é triplo-cego. Um ensaio clínico em que não há cegamento é dito aberto (open label, no caso de estudos com fármacos). A avaliação dos desfechos também pode afetar os resultados. É importante garantir-se que aqueles que registram os desfechos estejam cegados com relação a que grupo o sujeito da pesquisa pertence. Os autores devem estabelecer regras cuidadosas para decidir se um desfecho ocorreu ou não e despender esforços iguais para identificar desfechos para todos os pacientes no estudo.

Intenção de tratar Os pesquisadores prejudicam a randomização se omitirem da análise os pacientes que não receberam a intervenção designada. Pior ainda, se contarem eventos ocorridos nos sujeitos não aderentes que foram designados para a intervenção contra o grupo-controle. Os sujeitos de uma pesquisa, para evitar tal viés, devem ser analisados dentro do grupo para o qual eles foram alocados pela randomização. Ou seja, a análise deve incluir todos os indivíduos que iniciaram o ensaio clínico, independentemente se eles concluíram a intervenção e o período de seguimento. Esse princípio é denominado intenção de tratar.

Análise da magnitude do efeito Calcula-se uma série de parâmetros quantitativos para analisar a magnitude do efeito da intervenção em um ensaio clínico. Entre eles, destacam- se o risco relativo (RR), a redução relativa do risco (RRR) e o número necessário para tratar (NNT)/ número necessário para causar dano (NND), conforme foi visto no Capítulo 7, Medidas de Associação e no Capítulo 8, Medidas de Impacto.

CAPÍTULO

Vieses

^^ INTRODUÇÃO

Uma diferença encontrada entre duas amostras aleatórias independentes deve ser analisada com cautela. Sob o ponto de vista estatísti co, essa diferença pode ser em decorrência do “acaso”. Os testes estatísticos e o intervalo de confiança informam se as variações podem ou não ser resultantes do acaso (aleatoriedade) (ver também Capítulo 17, Distribuições de Probabilidades). Por outro lado, tais diferenças podem ser decorrentes de erros sistemáticos, denomina dos vieses, e devem ser investigadas. Os vieses podem ocorrer: nn Na seleção dos indivíduos que compõem os grupos. nn Na aferição dos eventos. nn Por efeitos dos fatores de confusão. ^^ VIÉS

DE SELEÇÃO

Ocorre quando são feitas comparações entre grupos de indivíduos que diferem em outros determinantes de desfecho, além daquele que está sendo estudado. Os procedimentos para a seleção dos indiví duos de uma pesquisa dependem de inúmeros fatores: nn Delineamento do estudo. nn Condições do estudo. nn Doença e exposição de interesse. É comum os indivíduos serem selecionados de modo conveniente ao pesquisador. Isto acarreta conclusões corretas para esse grupo, mas estas não podem ser extrapoladas para a

população (validade externa). Outro problema é o voluntariado, pois os indivíduos selecionados podem diferir dos não voluntários em vários aspectos, como idade, etnia, condições socio econômicas, nível educacional e gênero. Além disso, os voluntários podem ser mais saudá veis do que aqueles que não concordam em participar do estudo. Pessoas que trabalham, em geral, são mais saudáveis que as que não traba lham. Clínicas especializadas tendem a ter um perfil muito diferente dos ambulatórios gerais. Outro aspecto importante a ser considera do é que estudos de coorte e ensaios clínicos tendem a ter uma perda no acompanhamento. Os indivíduos podem decidir descontinuar sua participação. Certos tipos de pessoas são mais prováveis do que outras a desistirem do estudo. As pessoas também podem morrer por outras causas que não o evento de interesse. O viés de seleção é de particular interesse nos estudos caso-controle, nos quais o pesqui sador seleciona dois grupos em que a exposição já ocorreu. Há necessidade de selecionar casos prevalentes ou casos incidentes. Se o fator de risco também é um fator prognóstico, o uso de casos prevalentes pode resultar em conclu sões com viés. Os estudos caso-controle que envolvem pacientes hospitalizados também estão su jeitos a viés de seleção. Pacientes com duas condições clínicas tendem a ser mais hospitali zados dos que aqueles com uma condição. Esse tipo de viés costuma ser denominado viés de Berkson.

102

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

^^ VIÉS

DE AFERIÇÃO

O viés de aferição pode surgir quando há um erro sistemático na mensuração. Ele ocorre quando as medições individuais ou classifica ções de doenças ou exposições são imprecisas. Ou seja, elas não medem corretamente o que deveriam medir. Existem muitas fontes de viés de aferição. Por exemplo, as dosagens laborato riais bioquímicas ou fisiológicas podem não ser completamente precisas e, muitas vezes, produ zem resultados diferentes na mesma amostra. Se as amostras dos grupos exposto e controle são analisadas de modo aleatório por diferentes laboratórios, há menor probabilidade de erro sistemático de aferição do que na situação em que todas as amostras do grupo exposto são analisadas em um laboratório e as do grupocontrole são analisadas em outro. Um tipo de viés de aferição de particular im portância nos estudos caso-controle é conheci do como viés de memória. Isso ocorre quando as informações são lembradas de maneira di ferente por casos e controles. Os casos podem ser mais propensos a recordar exposições do passado, sobretudo se elas são amplamente co nhecidas por estarem associadas à doença em estudo – por exemplo, falta de exercício e doen ças cardíacas. O viés de memória pode exagerar ou subestimar o tamanho do efeito associado à exposição. As pessoas afetadas por doenças car díacas são mais propensas a admitir a falta de exercício no passado. Por outro lado, os casos tendem mais que os controles neguem a expo sição passada. Se o viés de aferição ocorre igualmente nos grupos que estão sendo comparados, quase sempre resulta em uma subestimação da ver dadeira força de associação. Tal viés não dife rencial pode explicar aparentes discrepâncias nos resultados de diferentes estudos epidemio lógicos. Se o investigador, técnico de laboratório ou o participante conhece o status de exposição, isso pode influenciar as medições e causar um viés de observação. Para evitar esse viés, as medições devem ser feitas de maneira cega ou duplo-cega. Nos estudos cegos, os investi gadores não sabem como os participantes são

classificados ou alocados quando há interven ção. Em um estudo duplo-cego, nem os pes quisadores, nem os participantes, sabem como ocorreu a classificação. ^^ VIÉS

DE CONFUSÃO

Os fatores de confusão constituem-se em im portante preocupação na análise de estudos epidemiológicos. Em um estudo de associa ção entre a exposição a uma causa (ou fator de risco) e a ocorrência da doença, pode ocorrer confusão quando existe outra exposição na po pulação em estudo e ela está associada tanto à doença quanto à exposição estudada. O pro blema surge quando esse fator estranho – em si um determinante ou fator de risco para o des fecho – é distribuído de forma desigual entre os subgrupos de exposição. Ocorre confusão quando o efeito de duas exposições (fatores de risco) não foi separado e a análise conclui que o efeito é decorrente de uma variável em vez da outra. Para ser um fator de confusão, ele deve estar associado tanto à exposição quanto à do ença (Figura 15.1). Muitas vezes, idade, condição socioeconômi ca e hábitos são fatores de confusão em estudos epidemiológicos. No exemplo da Figura 15.1, uma vez sabido que o consumo de café está associado ao tabagismo, a confusão pode ser a explicação para a relação demonstrada entre o consumo de café e o risco de doença cardíaca: pessoas que bebem café são mais propensas a fumar do que aquelas que não bebem café. Sa be-se que o tabagismo é uma causa de doença cardíaca. Assim, é possível que a relação entre o consumo de café e a doença cardíaca reflita apenas a associação causal conhecida do uso do tabaco e a doença do coração. Nessa situação, o tabagismo confunde o relacionamento aparen te entre o consumo de café e a doença cardíaca, pois o tabagismo está correlacionado com be ber café e é um fator de risco, mesmo para aque les que não bebem café.

Controle dos vieses de confusão O controle dos fatores de confusão pode ser fei to pelo delineamento do estudo ou durante a

Vieses

Exposição (ingestão de café)

Associação por confusão

103

Doença (doença cardíaca)

Verdadeira associação à doença

Duas exposições associadas entre si

Fator de confusão (tabagismo)

FIGURA 15.1 Confusão: relação entre o consumo de café (exposição), a doença cardíaca (desfecho) e uma terceira variável (tabagismo)

análise dos resultados. No desenho do estudo, os métodos comumente usados são: nn Randomização. nn Restrição. nn Emparelhamento. Na etapa de análise, os fatores de confusão podem ser controlados por: nn Estratificação. nn Modelagem estatística.

Randomização Em estudos experimentais, a randomização é o método ideal para garantir que as poten ciais variáveis de confusão sejam distribuídas igualmente entre os grupos que estão sendo comparados. O tamanho da amostra precisa ser suficientemente grande para evitar má dis tribuição aleatória de tais variáveis. A randomi zação evita a associação entre a potencial vari ável de confusão e a exposição que está sendo considerada.

Restrição Uma forma de controlar fatores de confusão é restringir o estudo para as pessoas que têm características especiais. Por exemplo, em um estudo sobre os efeitos do café na doença coro nária, a participação no estudo pode ser restrita aos não fumantes, o que elimina qualquer po tencial efeito de confusão pelo tabagismo.

Emparelhamento O pareamento é utilizado para controlar a con fusão. Nele, selecionam-se os participantes do estudo de modo a garantir que os potenciais fatores de confusão estejam distribuídos uni formemente entre os dois grupos comparados. Por exemplo, em um estudo caso-controle que busque associar exercício à doença coronariana, cada paciente com doença cardíaca pode ser combinado com um controle da mesma faixa etária e sexo para garantir que confusão por idade e sexo não ocorra. O emparelhamento tem sido bastante uti lizado em estudos de caso-controle, mas isso pode ocasionar problemas na seleção dos con troles se os critérios de correspondência forem muito rigorosos ou muito numerosos, o que é chamado de overmatching. Ele pode ser caro e consumir tempo, mas é particularmente útil se existe perigo de não haver sobreposição entre os casos e controles, como em uma situação em que os casos tendem a ser mais velhos do que os controles.

Estratificação e modelagem estatística Em grandes estudos, geralmente, é preferível controlar o confundimento na fase analítica. O confundimento pode, então, ser controlado por estratificação, o qual envolve a medição da força

104

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

de associação em categorias bem definidas e homogêneas (estratos) da variável de confusão. Se a idade é um dos fatores de confusão, a asso ciação pode ser medida em grupos de idade de 10 anos; se o sexo ou a etnia é um fator de con fusão, a associação é medida separadamente em homens e mulheres ou em diferentes gru pos étnicos. Estão disponíveis métodos para resumir a associação geral por meio de uma mé dia ponderada das estimativas calculadas em cada estrato separado. Embora a estratificação seja conceitualmen te simples e relativamente fácil de realizar, é muitas vezes limitada pelo tamanho do estudo e pode não ajudar a controlar muitos fatores de maneira conjunta. Nessa situação, é necessária a modelação estatística multivariada para calcular a força da associação, controlando para diversas variáveis de confusão, simultaneamente. Várias técnicas estatísticas estão disponíveis para essas análises. ^^ VALIDADE

A validade é uma expressão do grau de men suração de um teste. Um estudo é válido se os resultados correspondem à verdade. Assim, não deve haver nenhum erro sistemático, ou seja, deve ter acurácia, e convém o erro aleatório (precisão) ser o menor possível. A Figura 15.2 indica a relação entre a acurácia e a precisão. Normalmente, a acurácia e a preci são andam juntas. Existem dois tipos de validade: interna e ex terna.

Alta precisão Baixa acurácia

FIGURA 15.2 Precisão e acurácia

Baixa precisão Alta acurácia

Validade interna A validade interna está relacionada com o grau de certeza de que os resultados de um estudo estão corretos para o grupo específico de pessoas que estão sendo avaliadas. Ou seja, a validade interna é definida pelos limites do estudo propriamente dito. Para um estudo ser de alguma utilidade, deve ser válido internamente – embora um estudo seja perfeitamente válido internamente, ele talvez não tenha nenhuma relevância, pois os resultados não podem ser comparados com outros estudos. A validade interna pode ser ameaçada por todas as fontes de erro sistemático, mas melhorada por um bom delineamento e atenção aos detalhes.

Validade externa A validade externa, ou generalização, é a ex tensão na qual os resultados de um estudo se aplicam a pessoas que não participaram dele. A validade interna é necessária, mas não garante a validade externa. A validade externa é de particular interesse aos clínicos que precisam decidir se um resultado de uma pesquisa é aplicável a seus pacientes. Determinar se os resultados de um estudo são generalizáveis envolve a seguinte análise sobre: nn As características dos indivíduos incluídos no estudo. nn As características dos pacientes do clínico. nn Diferenças clinicamente significativas entre as pessoas do estudo e outras populações. A validade externa é garantida por desenhos de estudos que examinam hipóteses claramen te definidas em populações bem definidas. Ela é

Alta precisão Alta acurácia

Baixa precisão Baixa acurácia

PARTE

Inferência Estatística

Capítulo 16

População e Amostra, 109

Capítulo 17

Distribuições de Probabilidades, 113

Capítulo 18

Intervalo de Confiança e Valor P, 123

Capítulo 19

Testes Paramétricos, 135

Capítulo 20

Teste Qui-Quadrado, 153

Capítulo 21

Testes Não Paramétricos, 157

CAPÍTULO

17 ^^ DISTRIBUIÇÃO

Distribuições de Probabilidades

NORMAL

As medidas biológicas contínuas seguem, com frequência, um padrão de dispersão em suas distribuições de frequência que pode ser descrito como a distribuição normal de probabilidades. Essa distribuição também é conhecida por distribuição de Gauss, em homenagem ao cientista alemão Johann Carl Friedrich Gauss (17771855), considerado um dos maiores gênios da matemática (Figura 17.1). Atualmente, a lei de Gauss da distribuição normal de erros, com sua curva em formato de sino, é um dos fundamentos da estatística.

FIGURA 17.1 Johann Carl Friedrich Gauss (1777-1855)

A distribuição normal, graficamente, é descrita como uma curva em forma de sino, simétrica em torno da média (µ). A área total da curva vale 1, pois ela corresponde à probabilidade de a variável aleatória (aquela que tem um componente que varia ao acaso) assumir qualquer valor. Em decorrência da simetria da curva, os valores maiores que a média e os valores menores do que a média ocorrem em igual probabilidade. A distribuição normal é descrita por dois parâmetros: a média da população (µ) e o desvio padrão (σ). Vários testes estatísticos pressupõem que os dados sejam provenientes de uma distribuição normal. A altura é uma variável aleatória com distribuição normal. De acordo com a Organização Mundial da Saúde (OMS) (http://www. who.int/childgrowth/en/), a altura média de um jovem de 19 anos é 176,5cm e o desvio padrão é 7,3cm (Figura 17.2). Observa-se que a curva apresenta uma aparência típica, simétrica, cujo formato depende dos parâmetros avaliados. Mudando a média, altera-se a posição da distribuição. Mudando o desvio padrão, altera-se a dispersão da distribuição. Suponha outra população com média de 173cm e com o mesmo desvio padrão de 7,3cm e observe a mudança de posição da distribuição (Figura 17.3). A curva normal apresenta as seguintes características (Figura 17.4): nn A média, a mediana e a moda coincidem. nn Conforme visto, a curva normal é simétrica em torno da média.

114 nn

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

As extremidades da curva, em ambos os lados da média, estendem-se cada vez mais próximas do eixo x (abscissa) sem jamais tocá-lo. Se houver perpendiculares a uma distância de 1 desvio padrão acima e abaixo da média, a área entre essas perpendiculares corresponde a 68% da área total. Se as perpendiculares forem estendidas até ±2 ou 3 desvios padrões, a área entre as perpendiculares será, respectivamente, 95% e 99,7% da área total da curva.

Por exemplo, durante uma consulta de um rapaz de 19 anos de idade, constata-se que a sua altura é 168cm. Como a média é 176,5cm e o desvio padrão 7,3cm, o intervalo que compreende 95% dos jovens dessa idade vai de 161,9 a 191,1cm, ou seja, a média ±2 desvios padrões (arredondamento do valor correto de 1,96). Assim, o jovem da consulta, apesar de ter uma estatura 8,5cm abaixo da média, está dentro da faixa esperada.

0,06

0,05

0,04

0,03

0,02

0,01

0 154,5

158,5

162,5

166,5

170,5

174,5

178,5

182,5

186,5

190,5

196

FIGURA 17.2 Gráfico da distribuição da altura de jovens de 19 anos de idade, sexo masculino µ: média; σ: desvio padrão.

0,06 0,05 0,04 0,03 0,02 0,01 0 149

153

157

161

165

169

173

177

FIGURA 17.3 Distribuição de duas populações com médias diferentes

181

185

189

193

Distribuições de Probabilidades

115

0,06

0,05

0,04 1s

–1s 0,03 68% 0,02

0,01

–2s 95%

0 154,5

158,5

162,5

166,5

170,5

174,5

178,5

182,5

186,5

190,5

196

FIGURA 17.4 Subdivisões da área sob a curva normal (áreas aproximadas)

^^ DISTRIBUIÇÃO

PADRONIZADA

NORMAL

A distribuição normal padronizada, ou distribuição normal reduzida, é um caso especial da distribuição normal. A distribuição normal padronizada tem média igual a zero e desvio padrão igual a 1 e a área sob a curva igual a 1 (100%). Na abscissa, em vez de x (p. ex., valores da altura em centímetros), tem-se a transformação de x em um escore padronizado, denominado escore z. Este é derivado da seguinte fórmula: z

Dessa maneira, o escore z mostra realmente quantos desvios padrões um determinado valor x afasta-se da média. Qualquer distribuição de uma variável normal pode ser transformada, “reduzida”, a uma distribuição de z. Para isso, basta subtrair de cada valor de x a sua média (µ) e dividir esses resultados pelo desvio padrão da média (σ). A Figura 17.5 mostra a curva da distribuição normal padronizada da Figura 17.2. Desse modo, uma altura de 169,2cm é equiva lente a um escore igual a 1 desvio padrão abaixo da média: z

169 , 2 176 , 5 1 7, 3

Uma das vantagens da distribuição z é que a probabilidade de um valor estar em qualquer lugar entre dois pontos é igual à área sob a curva entre esses pontos. Isto determina que a área à direita de, aproximadamente, 2 desvios padrões corresponde a uma probabilidade de 0,025 ou 2,5% do total da curva. Como a curva é simétrica, a probabilidade do escore z ser menor do que –2 é também 0,025. De acordo com a lei da adição de probabilidades, a probabilidade de o escore z estar tanto abaixo quanto acima de 2 desvios padrões é 0,025 + 0,025 = 0,05. Transformando-se o escore z em x, pode-se dizer que a probabilidade de um jovem de 19 anos de idade ter altura fora de 2 desvios padrões da média é 0,05. Ou seja, somente 5% desses jovens têm altura abaixo de 161,9cm ou acima de 191,1cm. Um importante uso da distribuição z deriva do fato de que, ao se conhecer o escore z, pode-se encontrar a probabilidade de os valores estarem acima e abaixo dele. Por exemplo, deseja-se obter a probabilidade de um jovem de 19 anos de idade ter altura entre 180 e 190cm. Em primeiro lugar, transformam-se estes valores em escores z: z1

180 176 , 5 0 , 48 7, 3

190 176 , 5 1, 85 7, 3

116

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica 0,06

0,05

0,04

0,03

0,02

0,01

0 -2

-1

FIGURA 17.5 Distribuição z

A probabilidade de ocorrer um valor entre 0,48 e 1,85 desvios padrões corresponde à área escura (Figura 17.6). Essa probabilidade é encontrada na tabela de distribuição normal padronizada, vista na maioria dos livros de estatística ou no software Excel (Microsoft). Utilizando-se, no Excel, a função DIST.NORMP.N, encontra-se que a probabilidade de um jovem de 19 anos ter altura abaixo de 0,48 desvio padrão é 0,684 e de ter altura abaixo de 1,85 desvio padrão é 0,968. Logo,

a probabilidade de se encontrar um jovem de 19 anos de idade com altura entre 0,48 e 1,85 desvios padrões é igual a: 0,968 – 0,684 = 0,284 ou 28,4% ^^ DISTRIBUIÇÃO

t DE STUDENT

Trabalhando com amostras pequenas, utiliza-se a distribuição t de Student. Student era o pseudônimo de William Sealy Gosset (1876-1937),

0,06

0,05

0,04

0,03

0,02

28,4%

0,01

0 0

0,48

FIGURA 17.6 Probabilidade de ocorrer um valor entre 0,48 e 1,85 desvios padrões

1,85

CAPÍTULO

Testes Paramétricos

^^ INTRODUÇÃO

Alguns testes de hipóteses são adequados apenas para os dados numéricos, uns para dados numéricos e ordinais e outros para dados ordinais e nominais. Às vezes, exigem que os dados tenham uma distribuição normal e são denominados testes paramétricos. Aqueles que não têm esse pressuposto rigoroso de distribuição chamam-se testes de distribuição livre ou testes não paramétricos. Para verificar rapidamente a normalidade dos dados, algumas informações podem ser usadas, como: nn Observar o formato dos dados por meio de um histograma. Se demonstrar uma distribuição parecida com a curva normal, a distribuição provavelmente é simétrica (ver também Capítulo 4, Distribuição dos Dados). nn Comparar a média e a mediana. Se elas forem semelhantes, é provável que os dados tenham distribuição simétrica. nn Comparar o desvio padrão com a média. Se ele for maior que 50% da média, os dados tendem à assimetria (coeficiente de variação = s/ x). nn Observar os valores do coeficiente de assimetria e do coeficiente de curtose. Valores entre –1 e +1 indicam distribuição aproximadamente normal. Qualquer valor acima de +3 ou abaixo de –3 indica que a variável não é simétrica. nn Dividir o coeficiente de assimetria (skewness) e o coeficiente de curtose por seus respectivos erros padrões. Se o resultado for maior do que +1,96 ou menor do que –1,96, é um indicativo de assimetria. Valores entre ±1,96 indicam distribuição normal.

Observar se as amostras são grandes (acima de 60), pois elas não exigem grande preocupação com relação à normalidade dos dados.

t PARA AMOSTRAS INDEPENDENTES

^^ TESTE

O teste t de Student é utilizado para testar se a diferença entre duas médias amostrais independentes é ou não igual a zero, ou seja, se as duas médias são iguais. A hipótese nula (H0) afirma que a diferença entre as duas médias é igual a zero. Ambas as variáveis devem ser numéricas e normalmente distribuídas. Ademais, os dois des vios padrões devem ser semelhantes. Quando o tamanho amostral é grande, esse pressuposto torna-se menos importante. Serão usados, como exemplo, os dados da Ta bela 19.1 que mostra o volume expiratório força do em 1 segundo (VEF1) de 42 escolares portadores de asma não controlada no início de um tratamento com um novo corticosteroides inalatório. A H0 discutida no capítulo anterior, mas fica estabelecida como: nn H0: o VEF1 dos meninos é igual ao VEF1 das meninas no início do tratamento da asma brônquica. H0 : x1 = x2

A hipótese alternativa, com direção bilateral, é igual a: H1 : x1 ≠ x2

136 nn

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

H1: o VEF1 dos meninos é diferente do VEF1 das meninas no início do tratamento da asma brônquica.

Apesar de haver uma diferença de 0,054L entre entre os VEF1 dos escores, sabe-se que, tanto no grupo 1 (meninos) quanto no grupo 2 (meninas), há uma variabilidade dos valores em torno da média de cada um dos grupos. O que se precisa verificar é se a variabilidade entre as duas médias amostrais ao redor da grande média de todos os pesos é maior do que a variabilidade dos pesos dentro dos grupos ao

redor de suas próprias médias. Se há tanta variação dentro dos grupos, como entre os grupos, então, provavelmente, eles provêm da mesma população. Em outras palavras, precisa-se analisar se a diferença observada entre os grupos é decorrente, ou não, apenas do acaso. O valor t do teste é calculado pela diferença dos valores das médias dos dois grupos dividida pelo erro padrão da diferença. A distribuição t foi discutida no Capítulo 17, Distribuições de Probabilidades. t=

TABELA 19.1 VEF1 (L) de escolares com asma não controlada Identificação

Grupo 1 – Meninos

1,29

0,93

0,95

1,04

0,65

1,35

1,03

1,25

0,99

0,61

1,36

0,66

1,21

1,06

1,17

0,91

1,21

1,49

1,10

1,02

1,23

0,95

0,91

1,32

0,65

0,82

1,11

0,98

0,80

1,29

1,28

0,89

0,82

0,97

0,77

1,79

0,99

0,98

0,91

0,99

1,02

1,05

1,020

1,074

0,194

0,294

Identificação

Grupo 2 – Meninas

| x1 = x2 | EPd

Em que x1 = média do grupo x2 e = média do grupo 2 e EPd é o erro padrão da diferença obtido pela fórmula: EPd sc

1 1 n1 n2

O desvio padrão combinado sc é calculado por: (n 1) s12 (n2 1) s22 sc 1 (n1 n2 2)

Para se calcular o valor t, precisamos encontrar o numerador, que é igual a: | x1 x2 | | 1, 020 1, 074 | 0 , 054

O desvio padrão combinado sc é igual a: sc =

(24 1) 0 ,194 2 (18 1) 0 , 294 2 24 18 2 0 , 0584 0 , 2416

Dessa maneira, o erro padrão da diferença, EPd, é igual a: 1 1 24 18 0 , 07533

EPd = 0,2416

Testes Paramétricos

Logo, o valor de t é igual a: = t

0 , 054 = 0 , 72 0 , 07533

Utilizando a função do Excel DIST.T.BC (retorna a distribuição t de Student bicaudal), obtém-se o valor P que é igual a 0,4757. Apesar de os cálculos para se chegar ao valor serem simples, é mais fácil usar um software, como IBM SPSS Statistics ou R project for Statistical Computing (Tabela 19.2), que rapidamente fornece os resultados. Chegou-se a esse resultado supondo que exista igualdade das variâncias (homogeneidade das variâncias) e, de fato, se for realizado um teste F para verificar a igualdade das variâncias, verificar-se-á que é possível assumir essa igualdade (P = 0,065). Os resultados do teste t têm evidências que impedem rejeitar a H0 ou, em outras palavras, o teste t revela que a diferença entre as médias não é suficientemente grande para ser atribuível a uma diferença real (Tabela 19.3). Assim, pode-se dizer que não existe diferença, no início do tratamento da asma, com um novo corticosteroide inalatório, no valor do VEF1 entre meninos e meninas. A estimativa da diferença média é fornecida pelo intervalo de confiança de 95% (-0,098 a 0,207L), no qual se verifica que o valor zero não está contido, confirmando a significância estatística. O tamanho do efeito (d de Cohen) seria uma medida interessante de ser calculada, caso houvesse uma diferença estatisticamente significativa (Capítulo 7, Medidas de Associação). TABELA 19.2 Resultado do computador: teste t para duas amostras independentes Two Sample t-test data: vef1 by sexo t = 0.72, df = 40, p-value = 0.4757 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.09813194 0.20674305 sample estimates: mean in group Fem mean in group Masc 1.074 1.020

137

TABELA 19.3 Resultados do tratamento com corticosteroide inalatório em um grupo de 15 escolares asmáticos antes e após 120 dias

Indivíduos

VFE1 inicial (L) xi

1,30

VFE1 final (L) xf 1,53

Diferença d = xf – xi

– (d – d )2

0,23

0,022

1,47

1,63

0,16

0,047

2,06

2,35

0,29

0,008

1,95

2,70

0,75

0,139

1,47

2,01

0,53

0,027

1,13

1,53

0,40

0,001

1,48

1,66

0,18

0,039

0,94

1,59

0,65

0,075

1,05

1,50

0,45

0,005

0,87

1,61

0,74

0,132

0,75

1,17

0,42

0,002

1,26

1,30

0,05

0,113

1,21

1,41

0,20

0,031

0,78

1,00

0,22

0,025

1,99

2,37

0,37

0,000

Soma

5,64

0,664

Diferença média = d =

∑ d 5, 64 n

= 0,377litros

VEF1: volume expiratório forçado em 1 segundo.

t PARA AMOSTRAS EMPARELHADAS

^^ TESTE

Na situação em que as amostras dos dois grupos estão correlacionadas, não é possível usar o teste t de Student, uma vez que ele presume que os dois grupos são independentes. Essa situação surge quando se coletam duas medidas dos mesmos indivíduos em momentos diferentes. Por exemplo, considere um grupo de 15 crianças escolares asmáticas que receberam tratamento com corticosteroide inalatório por determinado período. Mediu-se o VEF1 no início e após 120 dias de tratamento. Os dados são mostrados na Tabela 19.3. A hipótese estatística a ser testada é: H0 : d = 0

138

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Consequentemente: H1 : d ≠ 0 O valor de t é dado por: t=

d EPd

O erro padrão da diferença (EPd) é calculado por: EPd =

5c n

O desvio padrão combinado é dado por: sc

(d d)2 n 1

0 , 664 0 , 218 15 1 0 , 218 EPd 0 , 056 15 sc

Assim, = t

d 0 , 377 = = 6 , 697 EPd 0 , 056

Voltando a usar a função do Excel DIST.T.BC (retorna a distribuição t de Student bicaudal), obtém-se o valor P que é igual a 0,00001, que pode ser escrito simplesmente P <0,0001. Fazendo os cálculos com o R project for Statistical Computing temse as informações apresentadas na Tabela 19.4. TABELA 19.4 Resultado do computador: teste t para duas amostras independentes Paired t-test data: basal and final t = -6.6969, df = 14, p-value = 0.00001016 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.4973000 -0.2560333 sample estimates: mean of the differences -0.3766667

Os resultados do teste t emparelhado mostram que há evidências para rejeitar a H0 ao nível de significância de 95% e pode-se afirmar que houve diferença significativa entre o VEF1 inicial e o VEF1 do fim do tratamento. O tamanho do efeito é igual a 1,729, o que caracteriza um grande efeito, conforme demonstrado pela fórmula: TEP(d )

| x1 x 2 | | 1, 314 1, 691| 1, 729 0 , 218 sc

^^ ANÁLISE

DE VARIÂNCIA

O problema de vários testes de significância Foi mostrado anteriormente que, quando se quer comparar as médias de dois grupos, usa-se o teste t. Quando há três ou mais grupos, o teste t não é apropriado. Se vários testes t são usados para comparar várias médias, a probabilidade de erroneamente detectar pelo menos uma diferença significativa entre o conjunto de comparações é maior que o nível de significância, α, selecionada para cada teste. Suponha que se pretenda testar o efeito de três diferentes tratamentos para diabetes. Os pacientes do grupo 1 recebem uma medicação, por exemplo, uma sulfonilureia; os do grupo 2 recebem outra medicação (p. ex., uma biguanida) e os pacientes do grupo 3, um placebo. O objetivo é saber se as substâncias utilizadas são melhores para reduzir os níveis de glicemia do que o pla cebo e se elas têm efeitos diferentes entre si. Têm-se três comparações para serem feitas: 1. Grupo 1 versus grupo 3 (para verificar se a sulfonilureia é melhor que o placebo). 2. Grupo 2 versus grupo 3 (para verificar se a biguanida é melhor que o placebo). 3. Grupo 1 versus grupo 2 (para observar se a sulfonilureia é diferente da biguanida). O nível de significância, α, escolhido foi 0,05, ou seja, aceita-se, no máximo, uma probabili dade de 5% de cometer um erro tipo I (rejeitar H0 quando ela é verdadeira). Logo, a probabilidade de não rejeitar H0 quando ela é verdadeira é igual a 1 – 0,05 (= 0,95).

PARTE

Leitura Crítica

Capítulo 22

Medicina Baseada em Evidências, 169

Capítulo 23

Artigo Científico, 175

Capítulo 24

Avaliação da Qualidade da Evidência, 181

Capítulo 25

Análise de um Estudo Terapêutico, 185

Capítulo 26

Análise de um Estudo Diagnóstico, 191

Capítulo 27

Análise de um Estudo Prognóstico, 195

Capítulo 28

Análise de um Estudo Etiológico, 199

CAPÍTULO

Medicina Baseada em Evidências

^^ O

QUE É MEDICINA BASEADA EM EVIDÊNCIAS?

Os profissionais da saúde, principalmente médicos, sempre consideraram suas decisões baseadas em evidências e origens filosóficas remontam a Paris do século XIX. Entretanto, o conceito de “evidência” era uma combinação de estratégias bem sucedidas em pacientes prévios, conselhos de outros profissionais mais experientes ou uma impressão geral baseada em artigos aleatórios, congressos e propagandas. O que modificou portanto é o conceito de evidência, da melhor evidência, que significa dizer informações provenientes de uma pesquisa clinicamente relevante, muitas vezes provenientes das ciências básicas da medicina, especialmente da pesquisa clínica centrada no paciente. Ou seja, pesquisas sobre a exatidão e precisão dos testes diagnósticos, incluindo exame clínico, poder dos marcadores prognósticos e a eficácia e segurança das estratégias preventivas, terapêuticas e de reabilitação. Credita-se o termo medicina baseada em evidências (MBE) a um grupo liderado por Gordon Guyatt na Universidade McMaster, Hamilton, Canadá em 1992. A partir daí passou a ser um tema cotidiano na vida dos profissionais da saúde. Em 1996, Sacket et al., em um short report, define a MBE como “o uso consciente, explícito e criterioso das melhores evidências atuais na tomada de decisões sobre o cuidado de pacientes individuais. A prática da medicina baseada em evidências significa integrar a experiência clínica individual com a melhor

evidência clínica externa disponível de pesquisa sistemática. Por especialização clínica individual, queremos dizer a proficiência e o julgamento que os médicos individuais adquirem por meio da experiência clínica e da prática clínica. O aumento da experiência se reflete de muitas maneiras, porém especialmente em diagnósticos mais eficazes e eficientes e na identificação mais cuidadosa e no uso compassivo das condições, direitos e preferências individuais dos pacientes na tomada de decisões clínicas sobre seus cuidados”. Entretanto, deve-se ter cuidado porque a MBE não é uma “receita de bolo” e requer uma abordagem estratificada, suportada conhecimentos em Epidemiologia e Bioestatística para a avaliação adequada da evidência para evitar que se fique escravo dos manuais e diretrizes no atendimento ao paciente (Figura 22.1).

Medicina baseada em evidências

Identifica

Avalia

Sintetiza

Informações científicas de alta qualidade

Evidências científicas

FIGURA 22.1 Medicina baseada em evidências (MBE)

170

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Em última análise, a MBE visa à aplicação da melhor evidência científica no cuidado do paciente, como mostrado na representação clássica da Figura 22.2.

nn nn nn

^^ ETAPAS

DA MEDICINA BASEADA EM EVIDÊNCIAS

A MBE segue etapas bem definidas, a saber como: nn Formular uma pergunta que precisa ser respondida. nn Rastrear as melhores evidências. nn Avaliar criticamente as evidências quanto a: ll Validade. ll Impacto (magnitude do benefício). ll Aplicabilidade. nn Integrar a evidência com a experiência clínica e valores do paciente. nn Avaliar nossa eficácia e nossa eficiência.

Formulação da pergunta clínica Antes de formular a pergunta clínica, o fundamental é a necessidade de se admitir que não se saiba algo, que se tenha uma dúvida. Em MBE, a formulação da questão ou pergunta clínica é fundamental. Ela deve ser focada. Em geral, na prática da Medicina, as dúvidas estarão relacionadas sobre os seguintes tipos de perguntas: nn Intervenção: “O que devo fazer sobre essa condição ou esse problema?”.

Preocupações do paciente

MBE

Melhor evidência

Etiologia e fatores de risco: “O que causa o problema?”. Diagnóstico: “Esta pessoa tem a condição clínica ou o problema?”. Prognóstico: “Quem irá desenvolver a condição clínica ou o problema?”. Frequência e taxa: “Quão comum é o pro blema?”.

Estratégia PICO Recomenda-se do formato PICO (ou PICOTT) para desenvolver questões clínicas específicas e passíveis de serem respondidas. Os quatro elementos básico deste formato são mostrados na Tabela 22.1. Os termos identificados a partir desta estratégia serão a base da estratégia de busca da evidência. Quanto mais específica for a pergunta, mais precisos serão os resultados da pesquisa (ver Capítulo 13, Revisão Sistemática).

Paciente, população ou problema Descrever com clareza o grupo populacional ao qual pertence o paciente. Por exemplo, “Crianças com 8 anos de idade com amigdalite estreptocócica”.

Intervenção ou exposição Mostra a estratégia de manejo, a exposição ou o teste sobre os quais se quer ter informações quanto ao problema clínico. Se o problema clínico está relacionado com um tratamento, pode ser uma medicação. Em caso de diagnóstico, pode ser um exame laboratorial ou um programa de triagem. Em uma questão clínica relacionada com a etiologia ou um risco, pode ser uma exposição ou agente ambiental. Um exemplo: TABELA 22.1 Estratégia PICO

Experiência clínica

FIGURA 22.2 Medicina baseada em evidências (MBE)

Princípio PICO P

População

Intervenção

Comparação

Outcome (desfecho)

Medicina Baseada em Evidências

“Uso de amoxicilina em dose única diária para tratamento de amigdalite estreptocócica”.

Comparação ou intervenção (se apropriado) Apresenta uma estratégia alternativa para a comparação que se pretende estudar. O que poderia acontecer se não houvesse a intervenção? Por exemplo: “A amoxicilina em dose única diária é tão eficaz quanto a penicilina benzatina ou a penicilina V?”.

Outcome (desfecho) O que se espera que aconteça com a intervenção, com a exposição, com o uso de um determinado teste diagnóstico? Há necessidade de se verificar qual o desfecho realmente é importante para o paciente. Por exemplo: “O uso da amoxicilina em dose única diária é tão eficaz quanto a penicilina benzatina no tratamento da amigdalite estreptocócica em crianças?”.

Elaborando a pergunta clínica Juntando os exemplos de cada componente do princípio PICO, tem-se a pergunta clínica que será a estratégia de busca da melhor evidência: Em crianças com amigdalite estreptocócica, a amoxicilina em dose única diária comparada com a penicilina benzatina tem a mesma eficácia terapêutica?

Significado dos tipos de questão e tipo de desenho nn nn

Tipo de questão clínica: diagnóstico, etiologia/dano, terapêutica, prognóstico, prevenção. Tipo de desenho de estudo para responder à pergunta: qual seria o melhor delineamento de estudo (revisão sistemática, RCT, estudo de coorte, controle de caso etc.).

A Tabela 22.2 mostra os tipos de estudo geralmente recomendados para responder determinado tipo de pergunta clínica.

Busca da melhor evidência Após a elaboração da pergunta clínica, convém selecionar os termos que serão incluídos

171

TABELA 22.2 Estratégia PICO Tipo de pergunta

Tipo de delineamento

Diagnóstico

Ensaios controlados

Terapêutica

Ensaio clínico controlado randomizado duplo-cego, revisões sitemáticas/metanálises

Prognóstico

Estudos de coorte, caso-controle, série de casos

Dano/etiologia

Estudos de coorte, caso-controle, série de casos

Prevenção

Ensaio clínico randomizado controlado, estudos de coorte

Melhoria da qualidade

Ensaio clínico randomizado controlado

na busca. Usando a pergunta elaborada anteriormente, há os termos listados na Tabela 22.3. Isto ajudará a estabelecer uma busca dirigida a cada elemento antes de combiná-los na busca definitiva. Ter sempre em mente o tipo de estudo que melhor responde à pergunta clínica e aos níveis de evidências científicas. Para resposta mais rápida para a pergunta clínica, antes de buscar em bancos de dados bibliográficos, convém verificar se a resposta à pergunta clínica não está acessível em fontes secundárias, como ACP Journal, ClinicalKey, Bandolier, UpToDate e TRIP Medical Database, ou em revisões sistemáticas encontradas na biblioteca Cochrane ou ACCESSSS (Smart Search – Best Evidence for Health Care). É possível confiar nas fontes secundárias? Recomenda-se uma estratégia simples para veri ficar se é possível confiar caso se responda “sim” aos seguintes itens: nn Não há conflitos de interesse. nn Ela explica claramente a questão clínica. nn Há uma metodologia explícita e baseada em evidências subjacente à procura e à verificação da informação. nn A fonte é regularmente revisada e atualizada. Quando não for possível obter a resposta em bancos secundários, parte-se para a busca em fontes primárias disponíveis na internet.

172

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

TABELA 22.3 Termos-chave de pergunta clínica População nn Crianças

amigdalite

nn Estreptocócica

Intervenção nn Amoxicilina

Comparação

dose única

nn Penicilina

Desfecho

benzatina

nn Eficácia

terapêutica

diária

Estratégia de busca para o PubMed Identifica os termos que serão incluídos na pesquisa (thesaurus searching e textword searching), combinando-os, usando operadores booleanos (or, and, not, near) e colocando-os no buscador escolhido. No PubMed, utilizando o exemplo da Tabela 22.3, há os seguintes termos de busca e a tradução para o inglês dessas palavras (Tabela 22.4) O PubMed é um sistema de pesquisa bibliográfica desenvolvido pelo National Center for Biotechnology Information (NCBI), ligado à National Library of Medicine (NLM), dos EUA. O acesso ao PubMed é livre e se constitui em um poderoso sistema de busca e recuperação. O MedLine é o principal componente do PubMed e a principal base de dados da NLM. A maioria dos registros provém de fontes em língua inglesa e todos os resumos estão em inglês. O PubMed, da mesma maneira que outros recursos de busca, como o Google, tem apenas uma caixa de busca (Figura 22.3). Digite os termos de busca criados na estratégia PICO. Depois disso, clica-se no botão Search. Ele retorna os resultados da busca. Nesse caso, acrescentaram-se filtros (idade: 0 a 18 anos; humanos, língua inglesa e ensaios clínicos). Independentemente da habilidade do pesquisador, as citações recuperadas, inevitavelmente, incluirão algumas

que não estão relacionadas com a pergunta que gerou a busca. Junto com as citações encontradas com a pergunta, retorna artigos relacionados com o encontrado. Nem sempre esses artigos relacionam-se com a pergunta inicial. Utilizando-se os filtros mencionados e os seguintes termos Streptococcal pharyngitis AND Amoxicillin AND benzathine penicillin, a busca retornou apenas um artigo: nn Rimoin AW, Hoff NA, Fischer Walker CL et al. Treatment of streptococcal pharyngitis with once-daily amoxicillin versus intramuscular benzathine penicillin G in low-resource settings: a randomized controlled trial. Clin Pediatr (Phila). 2011 Jun; 50(6):535-42. Em Similars articles, encontram-se outros artigos relacionados, que podem ser úteis. Outra maneira de pesquisar no PubMed é por meio do botão Advanced, localizado abaixo da caixa de busca da página principal do PubMed (ver Figura 22.3). O próximo passo é avaliar a qualidade dessa evidência científica, analisando sua validade, sua magnitude e sua aplicabilidade ao nosso paciente, conforme seus valores (ver Capítulos 24, Avaliação da Qualidade da Evidência; 25, Análise de um Estudo Terapêutico; 26, Análise de um Estudo Diagnóstico; 27, Análise de um Estudo Prognóstico; e 28, Análise de um Estudo Etiológico).

TABELA 22.4 PICO e determinação dos termos de busca PICO

Elemento

Termos de busca para o PubMed

População

Crianças Amigdalite estreptocócica

Limit by age to 0 a 18 year Streptococcal pharyngitis

Intervenção

Amoxicilina dose única diária

Amoxicillin once-daily

Comparação

Penicilina benzatina

Benzathine penicillin

Outcome (desfecho)

Eficácia terapêutica

Treatment outcome Limit to humans, English, clinical trial

CAPÍTULO

Análise de um Estudo Diagnóstico

^^ INTRODUÇÃO

Na prática clínica diária, os médicos têm necessidade de interpretar testes diagnósticos. A proliferação contínua de tecnologia médica coloca diante deles uma grande quantidade de novos testes, dificultando bastante sua escolha. Entretanto, a detecção precoce da doença é um contínuo desafio. Permanentemente, o médico convive com resultados falso-positivos ou falsonegativos pelo fato de que em poucas ocasiões o teste utilizado é o padrão-ouro. Em um procedimento diagnóstico, o teste escolhido deve ser válido, de baixo risco e aceitável pelos pacientes. Até certo ponto, essa avaliação é uma questão de opinião. Por exemplo, no que diz respeito ao câncer do cólon, o teste de sangue oculto nas fezes não tem tanta precisão, mas é de baixo risco e relativamente bem-aceito pelos pacientes. Por sua vez, a colonoscopia é precisa, mas não é de baixo risco nem amplamente aceita. Seus riscos são infecções, perfurações, hemorragia; geralmente, há a necessidade de sedação; e são relatados problemas cardiovasculares e aqueles relacionados com a limpeza do cólon. Diante dessa dificuldade, fica evidente que os estudos diagnósticos devem ser avaliados criticamente. ^^ VALIDADE

DOS RESULTADOS

Perguntas primárias ou eliminatórias O estudo diagnóstico foi orientado por uma pergunta claramente definida? A pergunta da pesquisa foi colocada em termos da população estudada? (Ver também Capítulos

10, Delineamentos de Pesquisa; 13, Revisão Sistemática e 22, Medicina Baseada em Evidências.)

A presença ou ausência da doença foi confirmada com teste validado de referência? É importante saber se houve ou não uma com paração independente e cega do teste diag nóstico com um padrão de referência. O padrão de referência ou padrão-ouro é utilizado para definir a presença ou a ausência de doença. Sem a comparação do teste diagnóstico com o padrão-ouro, não é possível verificar o benefício do teste diagnóstico. A coleta de dados do estudo e a análise devem ser cuidadosamente planejadas e execu tadas para garantir que, de maneira inconsciente (ou consciente), os vieses sejam reduzidos. Em outras palavras, aqueles que realizam testes e aqueles que interpretam os resultados devem ser independentes um do outro. Os dois grupos de pesquisadores devem ser cegos para os resultados do teste diagnóstico e para o padrão-ouro.

Os pacientes do estudo representam o espectro completo daqueles com este problema clínico? Os médicos clinicam em várias áreas geográficas e em diversas especialidades. Em consequência, seus pacientes têm características distintas. Para um estudo ser aplicável a um paciente de um determinado médico, os sujeitos do estudo e

192

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

esse paciente precisam ter características basais semelhantes. Quando se avalia um artigo sobre diagnóstico, a questão a considerar é se o teste foi realizado no tipo característico de paciente em que ele seria realizado na vida real.

O padrão-ouro e o teste em avaliação foram aplicados a todos os pacientes? O leitor deve ter certeza de que os pesquisadores aplicaram o padrão-ouro, bem como o teste em avaliação, de forma independente em todos os indivíduos participantes do estudo diagnóstico.

Perguntas secundárias Os resultados do teste a ser avaliado influenciaram a decisão de realizar o padrão-ouro? As propriedades de um teste de diagnóstico serão distorcidas se seus resultados influenciam a decisão de quais pacientes serão submetidos ao padrão de referência. Tal situação é denominada viés de verificação e se aplica, por exemplo, quando os pacientes com suspeita de doença coronariana e testes ergométricos positivos são mais propensos a sofrer cineangiocoronariografia (padrão de referência) do que aqueles com testes ergométricos negativos.

As pessoas que aplicaram e interpretaram o teste e o padrãoouro eram cegas com relação aos resultados? Isto é importante para evitar que um resultado positivo para um padrão-ouro influencie a interpretação do teste em avaliação e vice-versa.

Os métodos para a realização do teste foram descritos com suficientes detalhes a fim de possibilitar a replicação? Se os autores concluíram que o teste diagnóstico pode ser usado, eles devem dizer como usá-lo. Essa descrição deve abranger todos os

aspectos importantes na preparação do paciente (dieta, quais medicamentos devem ser evitados, precauções após o teste), o desempenho do teste (técnica, possibilidade de dor) e da análise e a interpretação dos resultados. Na replicação dos testes, os pesquisadores devem medir a concordância dos resultados, aplicando testes estatísticos de concordância, como o kappa (ver Capítulo 14, Testes Diagnósticos). Uma vez o leitor estando confiante de que os resultados do artigo constituem uma estimativa imparcial das propriedades do teste, ele pode determinar exatamente quais e quão úteis são as propriedades do teste. ^^ QUAIS

SÃO OS RESULTADOS?

A rigor, um teste deve produzir uma alta taxa de verdadeiros-positivos e de verdadeiros-negativos e uma baixa taxa de falso-positivos e de falso-negativos. Essas características do teste são determinadas pela sensibilidade e pela especificidade do teste (ver também Capítulo 14, Testes Diagnósticos). A sensibilidade é a capacidade de o teste detectar pessoas com doença e a especificidade é a capacidade do teste em identificar pessoas sem a doença. Tais medidas podem ser combinadas em uma medida global denominada razão de probabilidades (LR, likelihood ratio). A LR indica a probabilidade de um dado resultado de um teste em indivíduo com a doença comparada com a probabilidade do mesmo resultado em indivíduo sem a doença. É a medida mais útil na interpretação de resultados do teste para pacientes individuais. Quando a LR é igual a 1, não existe impacto do teste na probabilidade de doença. Quanto maior a LR, maior a probabilidade da doença, diante de um resultado positivo do teste (Figura 26.1). Os possíveis desfechos de um teste que devem aparecer em um estudo diagnóstico estão ilustrados na Tabela 26.1. ^^ APLICABILIDADE

DOS RESULTADOS

A decisão para usar ou não o teste diagnóstico com base na avaliação dos resultados dependerá das questões a seguir.

Análise de um Estudo Diagnóstico

193

Impacto na probabilidade de doença

LR=0,01 menos provável

LR=0,1 menos provável

LR=0,2 menos provável

LR=0,3 menos provável

LR=3 mais provável

LR=10 mais provável

LR=5 mais provável

LR=100 mais provável

0 Impacto

Impacto

LR=1 Sem impacto na probabilidade de doença

FIGURA 26.1 Razão de probabilidades (LR)

TABELA 26.1 Características para avaliar um teste diagnóstico Doença

Presente Teste Diagnóstico

Positivo

Ausente

Total

a+b

Negativo

c+d

Total

a+c

b+d

a+b+c+d

Sensibilidade

a/(a + c)

Especificidade

d/(b + d)

Valor preditivo positivo

a/(a + b)

Valor preditivo negativo

d/(c + d)

Probabilidade pré-teste

(a + c)/(a + b + c + d)

Razão de probabilidade para um teste positivo (LR+)

Sens/(1 – espec)

Razão de probabilidade para um teste negativo (LR–)

(1 – sens)/espec

Acurácia do teste

(a + d)/(a + b + c + d)

A reprodutibilidade do resultado do teste e sua interpretação serão satisfatórias no meu local de trabalho? O valor de qualquer teste depende de sua capacidade de produzir o mesmo resultado quando reaplicado a pacientes estáveis. A baixa reprodutibilidade pode ser resultado de problemas com o teste em si. Uma segunda causa para os diferentes resultados do teste em pacientes

estáveis surge sempre que um teste requer interpretação. A rigor, um artigo sobre um teste diagnóstico deve informar aos leitores quão reprodutíveis os resultados dos testes são. Se a reprodutibilidade de um teste, no cenário do estudo, for pobre e for comum a discordância entre os observadores, mas mesmo assim o teste ainda discriminar bem quem tem ou não a doença, ele pode ser útil. Nessas circunstâncias,

194

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

é provável que o teste possa ser facilmente aplicado a seu ambiente clínico. Se a reprodutibilidade de um teste for muito alta e a variabilidade entre observadores, muito baixa, ou o teste for simples e inquestionável ou aqueles que o interpretam forem altamente qualificados, o teste tende a ser útil. Entretanto, se a sua interpretação for realizada por profissional menos qualificado em seu próprio ambiente clínico, pode não obter resultados tão bons.

doença de interesse. Assim, um teste pode ter utilidade diferente, dependendo da prevalência da doença. Por exemplo, se a prevalência aumenta, eleva-se o valor preditivo positivo (ver Nomograma de Fagan, Figura 14.4, no Capítulo 14, Testes Diagnósticos).

Os resultados do estudo são aplicáveis ao meu paciente?

Aqui, é importante verificar se os benefícios adicionais do teste para os pacientes são maiores que os riscos associados a ele.

Caso o clínico trabalhe em um contexto similar ao do estudo e o paciente em questão satisfaça todos os critérios de inclusão do estudo, é possível confiar na aplicabilidade dos resultados. Ao contrário, haverá necessidade de se fazer um julgamento criterioso.

Os resultados do teste mudarão a estratégia de manejo de pacientes? Convém ter em mente que a utilidade de um teste diagnóstico é fortemente influenciável pela proporção de pacientes com suspeita da

Os pacientes ficarão em melhor situação com o resultado do teste?

^^ LEITURA COMPLEMENTAR Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005; 365(9469):1500-05. Grimes DA, Schulz KF. Uses and abuses of screening tests. Lancet. 2002; 359(9309):881-4. Heneghan C, Badenoch D. Evidence-based medicine toolkit. 2. ed. Malden, MA: Blackwell Publishing Inc; 2006. Appraising diagnosis articles. p. 34-41. Spix C, Blettner M. Screening. Dtsch Arztebl Int. 2012; 109(21): 385-90. Straus SE, Glaszious P, Richardson WS et al. Evidence-based medicine: how to practice and teach EBM. London: Elsevier; 2019. Diagnosis and screening. p. 185-218.

PARTE

VII

Exercícios Resolvidos

Capítulo 29

Exercícios, 205

Capítulo 30

Respostas dos Exercícios, 225

CAPÍTULO

Exercícios

1. Em determinado hospital, foram encontrados os seguintes resultados provenientes da análise de 25 pacientes, dos quais 54% são homens (Tabela 29.1). Com base nos dados apresentados na Tabela 29.1: A. Classifique as variáveis da tabela e diga qual seria a melhor forma de apresentação. B. Um dos médicos do hospital quer saber se a duração da hospitalização foi afetada pelo uso de antibióticos. Procure responder a ele, usando os dados da tabela e uma representação gráfica. 2. Uma minoria populacional compreende 10% da população. Se forem sorteados aleatoriamente 12 indivíduos da população, qual a probabilidade de a amostra não conter ninguém da minoria? 3. Em um estudo que comparou a dosagem sérica de colesterol em obesos (n = 25) e não obesos (n = 25), encontraram-se os resultados da Tabela 29.2. A. Pela descrição das informações, comente os dois conjuntos de dados com relação à sua simetria. B. Qual o melhor modo de representar esses dados para facilitar a visualização? 4. O tempo médio de internação de pacientes com pneumonia em determinado hospital é de quatro dias, com desvio padrão de 1,5 dia. Qual é a probabilidade de que o tempo médio de internação de uma amostra seja inferior a 2,5 dias e superior a 5,5 dias?

5. Os dados da Tabela 29.3 representam as idades (em anos) de 40 pacientes admitidos em determinado hospital. A. Calcule a média, a mediana, o desvio padrão e o intervalo interquartil (IIQ). B. Como você descreveria a forma da distribuição desses dados? 6. Dois pediatras querem investigar um novo teste de aplicação rápida que identifica infecções do trato urinário (ITU), cuja prevalência local é de 5%. O Doutor A utiliza um teste, existente há vários anos, que tem sensibilidade de 80% e especificidade de 85%, e o Doutor B faz uso de um novo teste que é 90% sensível e 95% específico. Para comparar a validade, aplicam o teste independentemente em 200 crianças com sintomas urinários e febre. Com base nessas informações, responda: A. Qual dos dois pediatras tem maior acurácia para diagnosticar uma criança com ITU? Calcule fazendo arredondamentos para tornar os números inteiros. B. Se uma criança, atendida pelo Doutor B, com sintomas urinários e febre, tiver resultado negativo do teste rápido, qual a probabilidade de que esteja com ITU? C. Se o teste fosse usado em outro local em que a prevalência fosse, por exemplo, de 15%, mantendo-se as mesmas características dos testes, haveria modificação no valor preditivo positivo (VPP) dos pediatras? Justifique sua resposta.

8,1

8,0

4,1

0,835

0,464

3,0

18,0

5,0

11,0

Média

Mediana

Desvio padrão

Assimetria

Erro padrão da assimetria

Mínimo

Máximo

Percentil 25

Percentil 75

Permanência geral (dias)

14,0

7,0

18,0

3,0

0,794

0,489

4,9

8,0

9,9

Permanência com antibióticos (dias)

TABELA 29.1 Análise de 25 hospitalizações (dados hipotéticos)

10,3

4,8

17,0

3,0

0,536

0,938

3,7

6,5

7,4

Permanência sem antibióticos (dias)

11,0

5,0

14,0

3,0

0,464

0,510

3,2

7,00

7,84

Leucócitos (1.000 células/mm3)

37,1

36,7

37,5

36,0

0,464

–0,212

0,4

36,8

Temperatura (oC)

57,5

23,5

82,0

4,0

0,464

0,186

20,1

41,0

41,2

Idade (anos)

60,0

22,0

0,794

0,889

22,3

42,7

Idade com antibióticos

56,8

24,3

4,0

0,536

–0,091

19,8

42,0

40,7

Idade sem antibióticos

206 Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Exercícios

TABELA 29.2 Dosagem sérica de colesterol em obesos e não obesos s

Mediana (P50)

P25

P75

Realizou-se um estudo sobre a capacidade de os clínicos diagnosticarem infecção estreptocócica em 149 pacientes que se apresentaram na Emergência de um hospital com dor de garganta. As impressões clínicas dos médicos foram comparadas aos resultados de culturas orofaríngeas para estreptococos do grupo A. Dos 37 pacientes que apresentaram cultura orofaríngea positiva, em 27 os médicos diagnosticaram faringite estreptocócica. Entre 112 pacientes com cultura negativa, os médicos diagnosticaram que 35 tinham a doença. Fonte: adaptado de Fletcher & Hamann, 1976.2

Obesos

216,2

20,0

214,3

202,1

231,9

Eutróficos

172,0

24,0

168,9

154,6

190,3

TABELA 29.3 Idade (em anos) de 40 pacientes no hospital 32

8. Leia o resumo a seguir e responda às perguntas:

7. Leia o estudo a seguir e responda às per guntas: nn Justificativa:

cefaleia afeta a maioria das crianças e representa a terceira maior causa de absenteísmo à escola relacionado a doenças. Embora o desfecho a curto prazo para a maioria das crianças pareça favorável, poucos estudos relataram desfechos em longo prazo. nn Objetivo: avaliar o prognóstico em longo prazo de cefaleia infantil 20 anos após o diagnóstico inicial em um grupo de crianças do Canadá Atlântico que tiveram cefaleia em 1983. nn Métodos: 95 pacientes com cefaleia que se consultaram com um dos autores em 1983 foram previamente estudados em 1993. A situação clínica dos 77 pacientes contatados em 1993 foi revista em 2003, por meio de um protocolo de entrevista padronizado. nn Resultados: 60 (78%) de 77 pacientes responderam à entrevista (60 dos 95 do grupo original). Na revisão de 2003, 16 (27%) estavam livres de cefaleia, 20 (33%) tinham cefaleia do tipo tensional, 10 (17%) tinham enxaqueca e 14 (23%) tinham enxaqueca e cefaleia do tipo tensional. Ter mais de um tipo de enxaqueca foi mais prevalente do que no diagnóstico ou seguimento inicial (P <0,001) e o tipo de cefaleia variou ao longo do tempo. nn Conclusões: 20 anos após o diagnóstico de cefaleia pediátrica, a maioria dos pacientes continua a ter cefaleia, embora a classificação da cefaleia costume mudar ao longo do tempo.

A. Qual o tipo de delineamento utilizado no estudo? B. Se um médico examinar um paciente e diagnosticar amigdalite estreptocócica, qual a probabilidade de estar certo, com base nesse estudo? 9. Observe as curvas de indivíduos normais e de diabéticos da Figura 29.1. A. O que ocorrerá com relação ao diagnóstico de diabetes se o ponto de corte for mudado de 1 para 4? 10. Paciente do sexo feminino, de 50 anos de idade, comparece a uma consulta médica com queixas de dor intermitente no lado esquerdo do tórax mediante esforço, há vários meses. A paciente tem histórico de doença Pontos de corte 1

Normais

Porcentagem (%)

Colesterol (mg/dL)

207

Diabéticos

Fonte: adaptado de Brna et al., 2005.1

A. Qual o enfoque desse estudo? B. Qual o tipo de delineamento utilizado pelos autores?

0 Glicemia

FIGURA 29.1 Curvas de indivíduos normais e de diabéticos

208

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

cardíaca na família e nenhum outro fator de risco conhecido para doença cardíaca, a não ser uma hiperlipidemia moderada. A pressão arterial e a frequência cardíaca estão normais. O exame cardíaco não apresenta nada de excepcional. Considera-se que a dor possa representar uma angina pectoris e toma-se a decisão de iniciar uma investigação. A estimativa da probabilidade de a dor ser indício de angina é de 10% e um eletrocardiograma não revela anormalidades específicas. Decide-se, então, solicitar um teste ergométrico, que tem sensibilidade de 70% e especificidade de 75%. O teste resulta negativo. A. Qual a probabilidade de a paciente ter angina pectoris antes e depois de se submeter ao teste ergométrico? 11. Um paciente idoso foi submetido a um procedimento de redução aberta e fixação interna para uma fratura de quadril, sofrida durante uma queda. Após 12h de pós-operatório, ele apresentou subitamente dispneia, taquipneia e taquicardia. A saturação de oxigênio caiu de repente para 80% e o eletrocardiograma revelou um padrão de esforço cardíaco no lado direito. É quase certo que o paciente sofreu uma embolia pulmonar e estima-se em 90% a probabilidade de ocorrência dessa condição. Realiza-se, então, uma cintilografia de perfusão, que tem sensibilidade de 83% e especificidade de 88%. O exame resultou positivo. A. Qual é a probabilidade de embolia pulmonar agora? 12. Na pergunta anterior, se o exame de cintilografia tivesse sido negativo, dadas as características da operação descritas, qual seria a probabilidade posterior de embolia pulmonar? 13. Suponha que pesquisadores realizem um estudo epidemiológico com pacientes de uma clínica especializada no tratamento de doenças sexualmente transmissíveis. Selecionaram 200 pacientes com gonorreia e 105 pacientes com uretrite não gonocócica. No grupo com gonorreia, 160 pacientes tiveram uretrite prévia e, no grupo de uretrite não gonocócica, 50 tiveram previamente

episódios de uretrite. Com base nessas informações: A. Construa uma tabela 2 × 2 com os resultados. B. Qual a medida de associação a ser usada? C. Calcule a medida de associações e o intervalo de confiança de 95% (IC95%). D. A uretrite prévia pode estar associada à uretrite gonocócica? E. Que tipo de estudo é esse? 14. Em um estudo com mulheres de 50 a 69 anos de idade, 10.000 fumantes e 40.000 não fumantes foram acompanhadas duran te cinco anos. Cinquenta das mulheres fumantes e 10 das não fumantes desenvolveram câncer de pulmão nesses cinco anos. Com base nas informações apresentadas, responda: A. Qual o delineamento desse estudo? B. Qual o tipo de medida a ser adotada para mensurar a magnitude do efeito? C. Calcule essa medida com o intervalo de confiança de 95% (IC95%). D. Interprete os resultados. E. Suponha que, na população, 20% das mulheres entre 50 e 69 anos sejam fumantes. Qual a proporção de câncer de pulmão que pode ser atribuída ao hábito de fumar? 15. Há suspeita de associação entre câncer de pulmão e consumo pesado de bebida alcoólica (definido como consumo de duas doses ou mais por dia). Assim, é realizado um estudo prospectivo com 4.000 indivíduos. O status de alcoolismo é determinado no início do estudo e os indivíduos são seguidos durante 10 anos. A Tabela 29.4 mostra os resultados do estudo: TABELA 29.4 Associação entre câncer de pulmão e alcoolismo Consumo pesado de bebida alcoólica (≥2 doses/dia)

Câncer de pulmão em 10 anos Sim

Não

Sim

1.667

Não

2.273

CAPÍTULO

Respostas dos Exercícios

1. Resposta com base nas informações dos Capítulos 2, 3, 4 e 5 A. A Tabela 30.1 mostra a classificação das variáveis e as melhores formas de representá-las: B. Aparentemente, o uso de antibiótico não interferiu na permanência no hospital, pois a representação gráfica por meio de box plot (Figura 30.1) mostra que são praticamente coincidentes. Os dados estão na Tabela 29.1 (ver Capítulo 29, Exercícios). TABELA 30.1 Classificação das variáveis Melhor forma de apresentação

Variável

Classificação

Permanência geral (dias)

Variável numérica contínua

nn Mediana

Idade (anos)

Variável numérica contínua

nn Média

e desvio padrão nn Mediana e IIQ nn Gráfico de barra de erro nn Box plot

Variável nominal dicotômica

nn Apenas

Leucócitos (×1.000 células/mm3)

Variável numérica discreta

nn Média

Uso de antibiótico (sim/não)

Variável nominal dicotômica

nn Apenas

IIQ: intervalo interquartil.

e IIQ

nn Box plot

Gênero (masculino/ feminino)

Permanência hospitalar (dias)

escrever o percentual

e desvio padrão nn Mediana e IIQ nn Gráfico de barra de erro nn Box plot escrever o percentual

Sim

Não Recebeu antibiótico?

FIGURA 30.1 Box plot

2. Resposta com base nas informações do Capítulo 17 k 0

n 12 0 ,10 n! p(k ) k (1 )n k k !(n k )! 12 ! 0 ,1 100 (1 0 ,10 )12 0 p(k ) 0 !(12 0 )! 479.001.600 1 (0 , 90 )12 0 , 28 ou 28% p(k ) 479.001.600

226

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

3. Resposta com base nas informações dos Capítulos 2 a 5 A. Observando-se os dados, conclui-se que provavelmente existe uma razoável simetria, uma vez que as médias (x) e as medianas são muito parecidas e o coeficiente de variação (CV) dos obesos é igual a s/média = 20/216,2 = 0,09 ou 9%, e o dos eutróficos, 24/172 = 0,14 ou 14%. Ou seja, os CV são pequenos. É preocupante quando o CV é >50%. B. Para visualizar essa diferença, podem ser utilizados a própria tabela apresentada, o box plot e o gráfico de barra de erro (Figura 30.2). A diferença pode ser observada nos gráficos e confirmada por um teste t para amostras independentes que retornam um valor P <0,001. 4. Resposta com base nas informações dos Capítulos 4 e 17

250

Como z = (x – )/s, então z = (2,5 – 4)/1,5 = –1 e z = (5,5 – 4)/1,5 = 1. Pela curva de distribuição normal, a probabilidade de se encontrar um valor entre –1 e +1 desvios padrões é igual a aproximadamente 68% (Figura 30.3). Portanto, temos 100% – 68% = 32%, ou seja, 16% menos que 2,5 dias e 16% acima de 5,5 dias. 5. Resposta com base nas informações do Capítulo 5, Resumo dos Dados Numéricos x 1.288 A. x i 32, 20 anos 40 n 8.752, 4 ( x1 x )2 1.498 anos 40 1 n 1

A. Para o cálculo da mediana (Md), é neces sário colocar todos os valores em ordem crescente. Depois, verifica-se qual valor está na ½(n + 1) posição, ou seja, ½(40 + 1) = 20,5a posição. Como n = 40 é um nú mero par, tomam-se o 20o e o 21o valores (29 e 30 anos) e extrai-se a média dos dois:

Colesterol (mg/dL)

200

150 100

IIQ P75 P25 42, 75 21, 25 21, 50 anos

P25 Eutróficos

Grupo

25 100

(n 1) 0 , 25 ( 40 1)

0 , 25 a posição

Obesos

A 10a posição é igual a 21 anos; a 11a posição é 22 anos. Entre elas, há uma

300

Colesterol (média +/- 2DP)

(28 29 ) 28 , 50 anos 2

200

100

68%

Eutróficos

Grupo

Obesos

FIGURA 30.2 (A e B) Box plot e gráfico de barra de erro

-2

-1

FIGURA 30.3 Curva normal padronizada

Respostas dos Exercícios

diferença de 1 ano. Logo, a 0,25a (¼) po sição é igual a 0,25 ano. Então:

Seguindo o mesmo raciocínio para o P75, temos: 75 100

(n 1) 0 , 75 ( 40 1)

A 30a posição é igual a 42 anos; a 31a posição é 43 anos. Entre elas, há uma diferença de um ano. Logo, a 0,75a (¾) posição é igual a 0,75 ano. Então: P75 42 0 , 75 42, 75 anos IIQ P75 P25 42, 75 21, 25 21, 50 anos ou u IIQ 21, 25 a 42,75 anos

B. Como a média é maior que a mediana, o intervalo interquartil (IIQ) tem uma amplitude grande e o coeficiente de variação (CV = 14,98/32,20 = 0,465 ou 46,5%) é também grande (quase 50%), tem-se assimetria positiva. 6. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A. Construindo a Tabela 30.2, tem-se: Concluindo: a tabela do doutor B tem uma acurácia maior que a do doutor A. B. Observando a Tabela 30.3 do doutor B: pD+|T– = probabilidade de doença, uma vez que o teste é negativo (falso-negativo) c 1 5, 5 10 3 ou 0 , 55% (c d) (1 181)

TABELA 30.2 Acurácia do doutor A Sensibilidade = 80%; especificidade de 85%

Sim

Não

Positivo

Negativo

181

Total

190

Concluindo: a criança tem 0,55% de probabilidade de apresentar ITU, mesmo com o teste rápido negativo. C. O valor preditivo positivo (VPP) dos pediatras com a prevalência de 5%, utilizando as tabelas 2 × 2, Tabelas 30.4 e 30.5, é:  Doutor A: VPP = 8/(8 + 28) = 0,22 ou 22%.  Doutor B: VPP = 9/(9 + 9) = 0,50 ou 50%. Supondo que a prevalência aumente para 15%, temos:  Doutor A: VPP = 24/(24 + 25) = 0,49 ou 49%.  Doutor B: VPP = 27/(27 + 8) = 0,77 ou 77%.

TABELA 30.4 Validade do doutor A com prevalência de infecção urinária de 15% Sensibilidade = 80%; especificidade de 85%

Sim

Não

Infecção urinária

Teste do doutor A

Sim

Não

Positivo

Negativo

145

Total

170

TABELA 30.5 Validade do doutor B com uma prevalência de infecção urinária de 15% Sensibilidade = 90%; especificidade de 95%

Infecção urinária

Teste do doutor A

Infecção urinária

Teste do doutor B

Acurácia = (9 +181)/200 = 0,95 ou 95%

30 , 75 a posição

pD | T

TABELA 30.3 Acurácia do doutor B Sensibilidade = 90%; especificidade de 95%

P25 = 21 + 0,25 = 21,25 anos

P75

Infecção urinária

Teste do doutor B

Sim

Não

Positivo

Negativo

162

Positivo

Total

190

Negativo

162

Total

170

Acurácia = (8 + 162)/200 = 0,85 ou 85%

227

228

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Ambos os pediatras melhoram o VPP. Isso mostra que o VPP aumenta conforme o aumento da prevalência. Se o resultado do teste for positivo, ambos os pediatras têm maior probabilidade de atender uma criança com infecção do trato urinário (ITU). 7. Resposta com base nas informações do Capítulo 11, Estudos Observacionais A. Prognóstico. B. Estudo de coorte. 8. Resposta com base nas informações dos Capítulos 11, Estudos Observacionais e 14, Testes Diagnósticos A. Estudo observacional transversal ou de prevalência B. Primeiramente, transformaremos os dados do resumo na Tabela 30.6. Agora, calcula-se o valor preditivo positivo: VPP =

27 = 0 , 44 ou 44% 62

Probabilidade (p) pré-teste (prevalência) = 10%

TABELA 30.6 Validade diagnóstica dos clínicos diante de uma amigdalite estreptocócica Amigdalite estreptocócica Sim

Não

espec (1 prev ) [(1 sens) prev ] [espec (1 prev )] 0 , 75 (1 0 ,10 ) VPN 0 , 96 [(1 0 , 70 ) 0 ,10] [0 , 75 (1 0 ,10 )] (1 VPN) 1 0 , 96 0 , 04 ou 4% VPN

Outra maneira de calcular:

Se o teste for positivo, o médico está diante de 44% de probabilidade de que o paciente tenha amigdalite estreptocócica. 9. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A. Conforme o ponto de corte se desloca de 1 para 4, diminui a taxa de falso-positivos (aumenta a especificidade), mas eleva a taxa de falso-negativos (baixa a sensibilidade). Em consequência, aumenta o valor preditivo positivo (VPP), ou seja, se alguém tem teste positivo (acima do ponto de corte 4), receberá o diagnóstico de diabéti co. Nesse ponto de corte, muitos diabéticos deixarão de receber o diagnóstico.

Impressão diagnóstica

10. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos A probabilidade de a paciente ter angina pectoris antes do teste ergométrico é a prevalência da doença na população com as características dessa paciente, que é de aproximadamente 10%. Após realizar o teste e sendo este negativo, a probabilidade é igual a (1 – VPN). O valor preditivo negativo (VPN) pode ser calculado por meio da seguinte equação, sabendo-se a sensibilidade (0,70), a especificidade (0,75) e a prevalência (0,10):

Total

Positivo

Negativo

Total

112

149

oddspré

p pré 1 p pré

0 ,10 0 ,11 (1 0 ,10 )

oddspós LR( ) oddspré (1 sens) (1 0 , 70 ) 0 , 40 0 , 75 esp LR( ) oddspré 0,, 40 0 ,11 0 , 044

LR( ) oddspós p pós

odds pós 1

oddspós

0 , 044 0 , 04 (1 0 , 044 )

ou 4%

11. Resposta com base nas informações do Capítulo 14, Testes Diagnósticos Conhecendo-se a sensibilidade (0,83), a especificidade (0,88) e a prevalência (0,90), calcula-se o valor preditivo positivo (VPP) por meio da seguinte equação: sens prev (sens prev ) [(1 espec ) (1 prev )] 0 , 83 0 , 90 VPP (0 , 83 0 , 90 ) [(1 0 , 88 ) (1 0 , 90 )] 0 , 09 ou 98% VPP

Índice

A Acurácia de um teste diagnóstico, 99 Alocação, 75 - completa, 75 - estratificada, 75 Amostra(s), 109 - aleatória ou probabilística, 109 - de conveniência, 110 - representativa, 196 - semiprobabilística, 110 - tipos de, 109 Amplitude, 28 Análise - da magnitude do efeito, 76, 187 - de sensibilidade, 196 - de sobrevida, 53 - de um estudo - - diagnóstico, 191 - - etiológico, 199 - - prognóstico, 195 - - terapêutico, 185 - de variância, 138 - dos estudos - - caso-controle, 69 - - de coorte, 72 - - transversais, 67 - por intenção de tratar, 186 - quantitativa de uma revisão sistemática, 84 ANOVA de fator único, 139 Aplicabilidade dos resultados, 187, 192 Aplicação de critérios de inclusão e exclusão, 83 Apresentação da metanálise, 86 Artigo científico, 175

Autores, 175 Avaliação, 76 - crítica - - de um artigo original, 179 - - dos artigos, 83 - - geral de um artigo científico, 178 - da magnitude do efeito do tratamento, 187 - da qualidade da evidência, 181

B Busca - da melhor evidência, 171 - na literatura, 82

C Cálculo - - da ANOVA, 139 - do intercepto (b0) e da inclinação da reta (b1), 148 - do intervalo de confiança, 125 - do tamanho amostral para - - a diferença entre duas proporções, 111 - - testar a diferença entre duas médias, 111 Casos incidentes ou prevalentes, 68 Coeficiente - de correlação de Spearman, 163 - de determinação, 147 - de kappa, 99 Combinação de valores P, 84 Comparação, 171 - da sobrevida em dois ou mais grupos, 56 Conclusões, 177 Condução, 76

250

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Contagem de votos, 84 Controle(s) - dos vieses de confusão, 102 - emparelhados, 68 Coorte - concorrente ou longitudinal, 70 - não concorrente, 71 - tipos de, 70 Correção para a continuidade de Yates, 154 Correlação, 143 - linear, 144 Cuidados na interpretação de dados de estudos transversais, 66 Curva - de frequência percentual cumulativa, 17 - de Kaplan-Meier, 55 - ROC, 96

D Dados, 3 - censurados, 53 - cumulativos, 17 - definindo, 1 - descrevendo, 7 Definição da questão de pesquisa, 82 Delineamento(s) - de pesquisa, 61, 63 - elementos básicos de um, 64 - fatoriais, 78 - tipos de, 64 Desenho de estudo para responder à pergunta, 171 Desfechos, 64, 188 Detecção de viés de publicação, 86 Diagnóstico, 170 Discussão, 177 Distribuição(ões) - amostral das médias, 123 - binomial, 118 - de probabilidades, 113, 128 - dos dados, 21 - normal, 22, 113 - - padronizada, 115 - outras formas de, 22 - t de Student, 116

E Efeito(s) - adverso, 201 - Hawthorne, 73 - temporal, 66 Elaborando a pergunta clínica, 171 Emparelhamento, 103 Endemia, 38 Enfoque, 64 Ensaio(s) clínico(s), 73 - características do, 73 - com delineamento cruzado (crossover design), 77 - de equivalência e não inferioridade, 77 - elementos básicos de um, 74 - exemplo de, 73 - tipos de, 77 Epidemia, 38 Erros de decisão, 131 Escala de Jadad, 188 Escolha dos controles, 68 Especificidade, 90 Esquema geral de avaliação de um artigo científico, 178 Estatística, 110 - I2, 85 Estimativa da precisão do tamanho do efeito, 187 Estratégia - de busca para o PubMed, 172 - pico, 170 Estratificação, 103 Estrutura de um artigo científico, 175 Estudos - caso-controle, 67 - - de base populacional, 68 - de coorte, 69 - - misto, 71 - - prospectivo, 70 - - retrospectivo ou histórico, 71 - - vantagens e desvantagens dos, 72 - ecológicos, 65 - observacionais, 65 - transversais, 66 - - que parecem longitudinais, 66 - - repetidos, 66 Etiologia, 170

Índice

Exposição, 64, 170 Extração de dados relevantes, 83

F Fase(s) - clínica, 79 - de experimentação, 79 - I, 79 - II, 79 - III, 79 - IV, 79 - não clínica, 79 Fator(es) - bibliométrico, 175 - de impacto, 175 - de risco, 170 - que interferem na amplitude do intervalo de confiança, 127 Flutuação na gravidade da doença, 73 Fontes de heterogeneidade, 86 Força da recomendação, 181, 182 Formulação da pergunta clínica, 170 Frequência relativa, 9

G Gráfico(s), 13 - de barras, 13 - de setores ou pizza, 13 - para dados - - numéricos - - - contínuos, 15 - - - discretos, 13 - - ordinais e nominais, 13 Grupo-controle, 74 Grupos - abertos, 11 - similares, 186

H Hazard ratio, 58 Heterogeneidade, 84 Hipótese nula, 130 Histograma, 15

I Identificação, 175

Imprecisão, 182 Imunidade coletiva, 38 Incidência, 36 - cumulativa, 37 Inconsistência, 182 Inferência estatística, 107, 127 Informações indiretas, 182 Instituição, 175 Intenção de tratar, 76 Interpretação - da ANOVA, 142 - do intervalo de confiança, 126 Intervalo - de confiança, 123 - - versus valor P, 132 - interquartil, 28 Intervenção, 170, 171

L Limitações dos estudos caso-controle, 68

M Média, 26 Mediana, 25 - do tempo de sobrevida, 56 Medicina baseada em evidências, 169 - etapas da, 170 Medida(s) - básicas em epidemiologia, 33 - de associação, 41 - de dispersão, 28 - - apropriada, 30 - de frequência, 35 - de impacto, 47 - de localização mais apropriada, 27 - de tendência central, 25 Melhora previsível, 73 Metanálise, 84 Método de Kaplan-Meier, 53 Metodologia, 177 Moda, 25 Modelagem estatística, 103 Modelo de riscos proporcionais, 58 Motivos que alteram a qualidade da evidência, 182 Múltiplos testes, 97

251

252

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica

Natureza dos dados, 3 Número - necessário para causar dano, 50 - necessário para tratar, 49 - reprodutivo básico, 38

Qualidade da evidência, 181 Questão - clínica, 171 - de pesquisa, 63

Randomização, 73, 103 - alocação desigual, 76 - dos grupos, 185 Razão(ões), 35 - de chances, 42 - de prevalência, 44 - de probabilidades, 92 - - para um teste negativo, 93 - - para um teste positivo, 93 Redução - absoluta do risco, 47 - relativa do risco, 48 Referências, 177 Regra de decisão e o valor P, 130 Regressão, 143 - de Cox, 58 - linear simples, 147 Relação entre prevalência e incidência, 38 Relato de caso, 65 Reprodutibilidade do resultado do teste, 193 Restrição, 103 Resultados, 177, 187 Resumo, 176 - dos dados numéricos, 25 Revisão(ões) - sistemática, 81 - tradicionais (narrativas) e sistemáticas, 81 Risco(s) - atribuível, 47 - - populacional, 50 - - proporcional, 48 - de vieses, 182 - relativo, 41

Odds ratio, 42 - e risco relativo, 43 Outcome (desfecho), 171

P Paciente, 170 Padrão-ouro, 192 Parâmetros, 110 Pergunta(s) - claramente definida, 185 - ética, 64 - factível, 63 - interessante, 63 - nova, 64 - primárias ou eliminatórias, 185, 191, 195 - relevante, 64 - secundárias, 186, 192, 196 Periódico, 175 Ponderando o efeito das estimativas, 84 Pontuação de Jadad, 188 População, 109, 170 Potencial benefício ao paciente individual, 201 Precisão das estimativas, 197 Pressupostos - da ANOVA de fator único, 139 - para a realização da correlação, 147 Prevalência, 35 - pontual, 35 - por período, 35 Problema, 170 - de vários testes de significância, 138 Processo do teste de hipótese, 130 Prognóstico, 170 Proporções, 35 Propriedades do desvio padrão, 30 Protocolo de uma revisão sistemática com metanálise, 82 PubMed, 172

S Seguimento, 76 - dos pacientes, 196 Seleção - dos casos, 67 - dos sujeitos, 74

Índice

Sensibilidade, 90 Série de casos, 65 Significado dos tipos de questão e tipo de desenho, 171 Sistema de pontuação de qualidade de Oxford, 188 Soma dos quadrados - do fator, 141 - residual, 141 - total, 140

- t para amostras - - emparelhadas, 137 - - independentes, 135 Título, 175

Tabela(s), 9 - cruzadas, 12 - de frequência para variáveis - - nominais, 9 - - numéricas, 10 - - ordinais, 10 Tamanho - amostral, 110 - - para os controles, 68 - de efeito padronizado, 44 Taxas, 35 Temporalidade, 64 Teste(s) - com variáveis contínuas, 95 - de heterogeneidade, 85 - de hipótese, 127 - de Kruskal-Wallis, 161 - de log-rank, 56, 58 - de Mann-Whitney, 157 - de significância para a regressão, 149 - de Wilcoxon, 159 - diagnóstico, 89 - do sinal (sign test), 84 - em avaliação, 192 - exato de Fisher, 154 - não paramétricos, 157 - paramétricos, 135 - post-hoc, 142 - qui-quadrado, 153 - sequenciais, 97 - simultâneos, 98

Validade, 104 - externa, 104 - interna, 104 Valor - F, 141 - P, 123 - preditivo, 91 Variância e desvio padrão, 29 Variáveis, 3 - como identificar o tipo de, 6 - componentes, 64 - contínuas, 10 - discretas, 11 - nominais, 3 - numéricas - - contínuas, 5 - - discretas, 5 - ordinais, 4 - tipos de, 3 Viés(es), 101 - de aferição, 102 - de análise, 71 - de atrito, 83 - de confusão, 102 - de desempenho, 83 - de informação, 71 - de não resposta e perdas de acompanhamento, 71 - de publicação, 182 - - seletiva, 83 - de seleção, 83, 101 - em estudos de coorte, 71 - na avaliação dos desfechos, 71

U Uso - de software, 84 - e restrições do χ2, 154 Utilidade da razão de probabilidades, 94

253

SOBRE O AUTOR

Áreas de interesse Epidemiologia Bioestatística

9 786588 340363

Oliveira Filho - Epidemiologia.indd 1

01/06/22 14:40

Epidemiologia e Bioestatística – Fundamentos para a Leitura Crítica – 2ª edição