00-Bioestatistica.indd 6
17/05/2021 13:48:07
Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
00-Bioestatistica.indd 1
17/05/2021 13:48:06
00-Bioestatistica.indd 2
17/05/2021 13:48:06
Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
Autores
Regina Maria Vilela Professora do Programa de Pós-Graduação em Alimentação e Nutrição e do Departamento de Nutrição da Universidade Federal do Paraná (DNUT/UFPR), Curitiba, Brasil. Doutora em Nutrição Humana pela Escola de Nutrição Humana, Faculdade de Ciências Agrárias e Ambientais, Universidade McGill, Montreal, Canadá. Mestre em Ciências (Bioquímica) pela UFPR. Especialista em Nutrição Clínica pela DNUT/UFPR.
Bruno M. P. M. Oliveira Professor do Programa de Pós-Graduação em Nutrição Clínica e da Faculdade de Ciências da Nutrição e Alimentação da Universidade do Porto (FCNAUP/UP); do Laboratório de Inteligência Artificial e Apoio à Decisão (LIAAD) e do Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC), Porto, Portugal. Doutor em Matemática Aplicada pela Faculdade de Ciências da UP. Mestre em Matemática Aplicada pela Faculdade de Ciências e Licenciatura em Física e Matemática Aplicada (Astronomia) pela UP. Título de Agregado em Nutrição Clínica e Ciências Básicas pela FCNAUP/UP.
00-Bioestatistica.indd 3
17/05/2021 13:48:06
Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Copyright © 2021 Editora Rubio Ltda. ISBN 978-85-8411-141-1 Todos os direitos reservados. É expressamente proibida a reprodução desta obra, no todo ou em parte, sem autorização por escrito da Editora. Produção Editorial Jaqueline Santos | JS Serviços Editoriais Capa Bruno Sales Imagem de capa ©iStock.com/photovideostock Diagramação Edel
CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ V755b Vilela, Regina Maria Bioestatística em ciências da nutrição: do desenho científico aos modelos comentados com uso do SPSS® / Regina Maria Vilela, Bruno M. P. M. Oliveira. – 1. ed. – Rio de Janeiro: Rubio, 2021. 264 p.; 21 cm. Inclui bibliografia e índice ISBN 978-85-8411-141-1 1. Bioestatística. 2. Nutrição - Métodos estatísticos. 3. Ciências médicas – Pesquisa – Metodologia. I. Oliveira, Bruno M. P. M. II. Título. 21-70888
CDD: 570.15195 CDU: 57.087.1
Camila Donis Hartmann – Bibliotecária – CRB-7/6472
Editora Rubio Ltda. Av. Franklin Roosevelt, 194 s/l. 204 – Castelo 20021-120 – Rio de Janeiro – RJ Telefone: 55(21) 2262-3779 E-mail: rubio@rubio.com.br www.rubio.com.br Impresso no Brasil Printed in Brazil
00-Bioestatistica.indd 4
17/05/2021 13:48:06
Dedicatória
Dedico esta obra aos que me conduziram, direta ou indiretamente, à profissão que exerço e aos desafios que ela apresenta. À minha avó Aziz Cândido de Oliveira, que me ensinou a ler antes que eu chegasse à escola. À Professora Doutora Maria Emília Daudt von der Heyde, pelo exemplo, amor e apoio incondicional. Às Professoras Lindiwe Sibeko (UMASS-USA) e Jiunni-Liu (Jeannie), que me inspiraram a estudar bioestatística enquanto eram minhas colegas de doutoramento na Universidade McGill. Aos meus pais, Newton Vilela e Zilda Barros Vilela, e aos meus irmãos, Denise Maria Vilela, Newton Vilela Júnior e Cristina Maria Vilela, pelo que sou. Aos meus ascendentes, que vieram de Portugal e cuja história motivou o meu regresso à sua terra como forma de gratidão e vestida da esperança de que este documento possa estabelecer um laço entre estudantes brasileiros e portugueses, com foco na ciência da Nutrição e na busca de uma vida melhor para todos. Aos estudantes de Nutrição e de outras áreas relacionadas que, entusiasmados em aprender, são parte fun damental da minha existência como professora, dão sentido à minha dedicação ao trabalho e florescem em mim a esperança de que, com o auxílio desta obra, possam disseminar a ciência da Nutrição com o cuidado e a seriedade necessários. Regina Maria Vilela
Dedico esta obra à minha esposa, Carla, aos meus filhos, Pedro e Sofia, e aos meus pais, Julieta e Alfredo. Aos meus antigos, atuais e futuros alunos. Bruno M. P. M. Oliveira
00-Bioestatistica.indd 5
17/05/2021 13:48:07
00-Bioestatistica.indd 6
17/05/2021 13:48:07
Agradecimentos
Ao Professor Doutor Bruno M. P. M. Oliveira (Facul dade de Ciências da Nutrição e Alimentação da Universidade do Porto [FCNAUP]), pela orientação do pós-doutoramento, cujo objeto de estudo foi a elaboração desta obra. À Universidade do Porto (UP), pela cooperação internacional que possibilitou meu acesso ao pós-doutoramento na FCNAUP e cujo acolhimento de toda a equipe fora fundamental. À Universidade Federal do Paraná (UFPR), Depar tamento de Nutrição (DNUT), pela oportunidade do afastamento do país e de minhas atividades para a realização desta obra. Ao Programa de Pós-Graduação em Alimentação e Nutrição (DNUT), pela oportunidade de ministrar as disciplinas de Metodologia da Pesquisa e Bioestatística que subsidiaram muitos dos modelos explorados como exemplos da aplicação da estatística na área de Nutrição. Aos professores Cláudia Seely Rocco (UFPR), Maria Eliana M. Schieferdecker (UFPR), Giane Bientinez Sprada (UFPR), Cláudio Marcelo Tkac (PUCPR), Angé lica Apa recida Maurício (UFPR), Bárbara Dal Molin Netto (UFPR), Cíbele Pereira Kopruszynski (UFPR), Deise Regina Baptista (UFPR) e Renata Labronici Bertin (UFPR) pelo apoio profissional e emocional durante a escrita. Às bibliotecárias do Setor de Ciências da Saúde da UFPR, Lidiane do Prado Reis e Silva e Natasha Pacheco de Mello Oliveira, pelo auxílio na organização e formatação das referências bibliográficas. Aos que contribuíram para que a minha jornada em Portugal fosse um aprendizado técnico e humano: Professora Doutora Cecília Noronha de Miranda Carvalho, Doutora Viviane de Cássia Kanufre, Sílvia Lopes, Pedro Lencastre Tamagnini e aos novos amigos que me acolheram em uma nova cultura.
00-Bioestatistica.indd 7
À Editora Rubio, pela viabilização da obra. À Jaqueline Santos e equipe, pela cuidadosa produção editorial e revisão dos textos. Regina Maria Vilela
À Professora Doutora Regina Maria Vilela, por todo o empenho que demonstrou no desenvolvimento desta obra. O seu esforço foi essencial para que este livro chegasse a bom porto. À Professora Doutora Cecília Morais e a todos os colegas da FCNAUP e da UP, que foram fundamentais no processo de mobilidade da Professora Doutora Regina Maria Vilela. Aos Professores Doutores Flora Correia e Rui Poínhos, pelas muitas discussões amigáveis, que são intelectualmente desafiantes, e com as quais ainda hoje aprendo muito, não só na área da Nutrição Clínica. Aos Professores Doutores Maria Daniel Vaz de Almeida, Cláudia Afonso e Bárbara Pereira (FCNAUP) e Alberto Pinto (FCUP), por alargarem os meus horizontes na área de Nutrição e de Matemática, respectivamente. À Mestre Marta Azevedo, por todo o apoio prestado, em particular, na área bibliotecária. A todos os colegas e amigos da FCNAUP e da UP, e a todos os alunos com quem tenho colaborado e aprendido durante esse processo. À FCNAUP e à UP, assim como ao Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC), pelas oportunidades que tenho tido de ensinar e investigar. Bruno M. P. M. Oliveira
17/05/2021 13:48:07
00-Bioestatistica.indd 8
17/05/2021 13:48:07
Apresentação
Embora o termo bioestatística refira-se à estatística voltada a eventos biológicos, o termo estatística será utilizado ao longo deste livro. Estão contidas nesta obra informações para guiar o acadêmico que inicia sua carreira de mestre e pesquisador em instituições de ensino superior. Assim, na introdução, o texto dará destaque para a contextualização do cenário que o acadêmico irá encontrar quando escolher a linha de pesquisa e o professor orientador. Além disso, será dada importância à compreensão do papel do estudante e do orientador na condução da pesquisa de forma eficaz. A bioestatística serve de suporte para responder às perguntas científicas elaboradas na construção do projeto de pesquisa que, por sua vez, dependem das variáveis nelas contidas e do desenho científico escolhido pelos pesquisadores. Assim, conceitos e exemplos comentados na área de Nutrição acerca destes aspectos serão explorados no primeiro capítulo. Nos capítulos seguintes, serão comentados conceitos e exemplos de análises estatísticas para os desenhos científicos mais comumente utilizados na área de Nutrição. Estarão incluídos nesses exemplos comentados: a organização de planilhas o passo a passo das etapas para a realização de análises estatísticas com o uso do Programa IBM® SPSS®, versão 25. Neste contexto, a interpretação dos resultados das análises também será apresentada. A maior parte dos exemplos utilizados nesta obra trata de assuntos da área de Nutrição Clínica experimental; porém, exemplos com modelos de outras áreas de Nutrição também serão apresentados. Todos os exemplos comentados têm como base a experiência dos autores na orientação de trabalhos científicos nos programas de pós-graduação de suas instituições
00-Bioestatistica.indd 9
de ensino. Além disso, os dados utilizados para as análises estatísticas são fictícios, em atenção ao preceito ético de não divulgar qualquer informação sobre os participantes das pesquisas com seres humanos. Considerando que a maior parte dos modelos citados foi feita a partir de desenhos clínicos, a base de dados consultada foi o Pubmed, e os artigos (em sua ampla maioria de livre acesso) contêm informações básicas sobre o tema consultado. Buscou-se selecionar os artigos mais recentes, mas não foi estabelecido limite de tempo, visto que muitos textos são clássicos. A ideia é que os acadêmicos tenham acesso a artigos com linguagem usual da área de saúde para melhor compreensão a respeito da bioestatística em seu contexto de trabalho. A seleção dos artigos levou em consideração aqueles de fácil leitura para iniciantes e que também apresentavam senso crítico em relação às análises estatísticas apresentadas. Artigos de estudos na área de Nutrição e outros exemplos foram selecionados para ilustrar a aplicação das análises. No entanto, não houve por parte dos autores uma análise pormenorizada do mérito das publicações ou de possíveis falhas metodológicas relacionadas ao desenho científico, aos processos de randomização, ao tamanho da amostra, entre outros. Como os termos utilizados tanto na área de estatística quanto na área de Nutrição podem variar um pouco entre o português brasileiro e o português europeu, buscou-se, na medida do possível, a utilização de termos comuns entre ambos. Quanto aos termos utilizados na área de estatística, utilizou-se o Glossário Inglês-Português de Estatística, publicado pela Sociedade Portuguesa de Estatística e a Associação Brasileira de Estatística em 2019 (http:// glossario.spestatistica.pt/). Os Autores
17/05/2021 13:48:07
00-Bioestatistica.indd 10
17/05/2021 13:48:07
Prefácio
Esta obra é fruto da parceria entre a Faculdade de Ciências da Nutrição e Alimentação da Universidade do Porto (FCNAUP), Portugal, e do Departamento de Nutrição da Universidade Federal do Paraná (DNUT/ UFPR), Brasil. Tem como objetivo orientar estudantes, que estão iniciando sua experiência como pesquisadores acerca dos princípios básicos da estatística que é aplicada frequentemente na área de Nutrição. Pretende-se com este livro estabelecer o raciocínio lógico acerca dos principais métodos estatísticos utilizados na área de Nutrição, podendo ser uma base para a exploração de modelos mais complexos.
00-Bioestatistica.indd 11
Adicionalmente, pretende-se colocar os modelos estatísticos no contexto de pesquisas em Nutrição de forma a facilitar a comunicação entre o estudante e o estatístico. No entanto, não faz parte do escopo deste trabalho esgotar as possibilidades de desenhos científicos, tão pouco as possibilidades de aplicação de todos os métodos estatísticos disponíveis na literatura. Aconselha-se, assim, que o estatístico seja consultado para a elaboração do projeto de pesquisa, bem como do artigo científico a ser publicado. Os Autores
17/05/2021 13:48:07
00-Bioestatistica.indd 12
17/05/2021 13:48:07
Lista de Siglas e Abreviaturas
ADA
American Diabetes Association
FHS
Framingham Heart Study
AF
ângulo de fase
FM
fibromialgia
AGREE
Appraisal of Guidelines for Research and Evaluation
FOS
fruto-oligossacarídeos
FT
fused toes
AI
ingestão adequada (adequate intake)
FTO
fat mass obesity associated gene
AMB
área muscular do braço
GL
graus de liberdade
AMDR
distribuição aceitável de macronutriente (acceptable macronutrient distribution ranges)
GLM
modelo linear geral (general linear model)
ARRIVE
Animal Research: Reporting of In Vivo Experiments
GRADE
The Grading of Recommendations Assessment, Development and Evaluation
GSSG/GSH
glutationa oxidada/glutationa reduzida
BIA
impedância bioelétrica
H0
hipótese nula
CARE
Case Report Guidelines
H1
hipótese alternativa
CDC
Center for Disease Control
HbA1c
hemoglobina glicada
CHEERS
Consolidated Health Economic Evaluation Reporting Standards
HMB
β-hidroxi-β-metilbutirato
CONSORT
Consolidated Standards of Reporting Trials
HMG-CoA
3-hidroxi-metil-glutaril-CoA redutase
COREQ
Consolidated Criteria for Reporting Qualitative Research
IAM
infarto agudo do miocárdio
IC
intervalo de confiança
The Consensus-based Standards for the Selection of Health Measurement Instruments
ICC
índice de correlação intraclasse
IL-8
interleucina 8
DECH
doença do enxerto contra o hospedeiro
IMC
índice de massa corporal
DO
densidade óptica
IMRAD
dp
desvio-padrão
Introduction, Material and Methods, Results, and Discussion
DRI
ingestão dietética de referência (dietary reference intakes)
IOTF
International Obesity Task Force
IRC
insuficiência renal crônica massa livre de gordura antes do tratamento (tempo zero)
COSMIN
DXA
densitometria por dupla emissão de raios X
MLGord0
EAR
necessidade média estimada (estimated average requirement)
MTT
teste de viabilidade celular
EBIA
Escala Brasileira de Insegurança Alimentar
NHS
Nurses’ Health Study
EC_M_ADUT
ecografia do músculo adutor
NO
nutrição oral
EER
necessidade estimada de energia (estimated energy requirement)
NPT
nutrição parenteral total
OMS
Organização Mundial da Saúde
EIA
Escala de Insegurança Alimentar
OR
razão de chances (odds ratio)
ELISA
teste imunoenzimático
P
percentil
FC
fibrose cística/quística
PCA
principal componente analysis
FDA
Food and Drug Administration
PLS
partial least squares
00-Bioestatistica.indd 13
17/05/2021 13:48:07
PRISMA
Preferred Reporting Items for Systematic Reviews and Meta-Analyses for Systematic Reviews and Meta-Analysis
SQUIRE
Standards for Quality Improvement Reporting Excellence
SRQR
Standards for Reporting Qualitative Research
PRISMA-P
Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols
STARD
Standards for Reporting of Diagnostic Accuracy
STROBE
Strengthening the Reporting of Observational Studies in Epidemiology
PTN
proteínas
RDA
ingestão diária recomendada (recommended dietary allowance)
TCTH
transplante de células-tronco hematopoéticas
TMO
transplante de medula óssea
RIGHT
Reporting Items for Practice Guidelines in Healthcare
TNF
fator de necrose tumoral
RR
razão de risco/risco relativo
TRIPOD
Sig.
significância
Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis
SPIRIT
Standard Protocols Items: Recommendations for Interventional Trials
UTI
unidade de terapia intensiva
WP
proteínas de soro de leite (whey protein)
00-Bioestatistica.indd 14
17/05/2021 13:48:07
Sumário
1
Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos, 1
2
Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação, 35
3
Organização de Dados na Planilha do IBM® SPSS®, 55
4
Identificação das Características de uma Amostra (Estatística Descritiva), 71
5
Medidas de Associação com Variável Dependente Nominal, 87
6
Medidas de Associação com Variável Dependente Quantitativa, 109
7
Estudos Experimentais com Comparação de Duas Amostras, 133
8
Estudos Experimentais com Comparação entre Três ou Mais Grupos Independentes, 149
9
Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas, 167
10
Estudos Diagnósticos e Prognósticos, 195
11
Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos, 219
Índice, 239
00-Bioestatistica.indd 15
17/05/2021 13:48:07
00-Bioestatistica.indd 16
17/05/2021 13:48:07
1 Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos Escolha da Área de Pesquisa | Relação Orientador-Estudante Quando o principiante em pesquisa decide ingressar em um programa de pós-graduação com a expectativa de publicar um trabalho que possa servir de base para a evolução da ciência, é necessário que o estudante esteja atento às suas expectativas quanto à área de estudo escolhida, à aderência de tal área ao programa de pós-graduação pretendido e ao professor orientador. Cada programa de pós-graduação tem ênfase em uma determinada área/linha de pesquisa e é preciso que o candidato compreenda que não encontrará um programa com excelência em todas as áreas da Nutrição. Assim, mesmo que se tenha o desejo de estudar em uma determinada instituição de ensino, deve-se verificar se esta tem em seus programas de pós-graduação linhas de pesquisa relacionadas com sua área de interesse, bem como professores orientadores disponíveis naquele momento para acompanhar o trabalho escolhido pelo estudante. Além disso, é fundamental a compreensão do papel do professor orientador no processo de admissão no programa, na definição do projeto de pesquisa e na orientação periódica do trabalho a ser desenvolvido. Acima de tudo, é importante compreender que o professor tem suas peculiaridades quanto à organização de suas tarefas e que as instituições de ensino diferem em relação ao vínculo de trabalho com os docentes. Assim, a disponibilidade do professor para orientação de pesquisa, em geral, é compartilhada com diversas atividades administrativas, tais como participação e condução de reuniões, envolvimento com comitês de especialistas, elaboração de relatórios, produção de projetos político-pedagógicos, participação de atividades ligadas às relações internacionais de
01-Bioestatistica.indd 1
ensino e pesquisa, busca de fomento para pesquisa, entre outras, que vão além da atividade de docência em sala de aula ou da orientação de estudantes tanto na pós-graduação quanto na graduação. A escolha de investir na formação em pesquisa e de ingressar em qualquer que seja o programa de pós-graduação deve levar em consideração todos os aspetos anteriormente citados, bem como o entendimento de que o professor orientador deve nortear o trabalho a ser desenvolvido e dar suporte ao estudante para que este se torne um pesquisador independente. Assim, a definição do cronograma de atividades e das estratégias de orientação e de condução do trabalho por parte do estudante deve ser esclarecida em um primeiro encontro com o professor, a fim de clarificar duas questões centrais para o bom andamento das atividades: Disponibilidade e sistema de orientação, a fim de evitar que as expectativas do estudante não sejam baseadas na idealização de um professor que terá dedicação exclusiva ao seu trabalho. Compreensão de que o estudante deve apresentar postura proativa em relação à construção do conhecimento. Ao iniciar um trabalho científico, parte-se do princípio de que o pesquisador tem conhecimento prévio do assunto a ser estudado e, assim, percebe os problemas que existem na área de estudo de seu interesse e que o instigam a buscar respostas às perguntas sobre os problemas em questão. Na academia, o conhecimento prévio está relacionado com a linha de pesquisa do professor pesquisador que, provavelmente, já terá uma série de publicações no assunto ligadas à linha de pesquisa com a qual trabalha. Nesse sentido, o estudante que inicia sua experiência em pesquisa deve buscar a orientação de um professor que trabalhe com assunto de seu interesse.
13/05/2021 18:27:56
2 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
É também desejável que as características de personalidade de ambos sejam compatíveis, em particular nos aspetos relacionados com o trabalho. Ao estabelecer uma relação de aprendizado com o professor orientador, mesmo que este tenha conhecimento prévio mais ou menos aprofundado sobre o assunto em questão, o estudante que inicia suas atividades de pesquisa deverá se apropriar do assunto a ser estudado e da metodologia da pesquisa. Assim, é fundamental realizar uma cuidadosa revisão da literatura para atualizar-se sobre o tema, para que haja compreensão dos problemas que geram as perguntas científicas.
Revisão dos Elementos Básicos de Construção do Projeto de Pesquisa A primeira etapa da realização de qualquer pesquisa é a organização de um projeto que contenha todo o detalhamento do que será realizado pelo pesquisador, desde a fundamentação teórica em que se baseou para dar início ao projeto, passando pelas instituições e respectivos investigadores envolvidos, meios necessários e tarefas a realizar, até o cronograma que estima o tempo necessário para a realização de todas as etapas a serem cumpridas. Este processo deve ser pautado em princípios éticos que, muitas vezes, são desafiadores para o pesquisador, especialmente em países em desenvolvimento onde há escassez de recursos.1 É cada vez mais enfatizado que o projeto de pes quisa deve garantir publicações com rigor científico e transparência. Assim, o uso de modelos adequados é fundamental.2 A formatação do projeto varia um pouco conforme as normas adotadas para a escrita; alguns elementos, no entanto, são indispensáveis. Como referência para o projeto, tomemos como exemplo um modelo comumente utilizado para organizar artigos científicos: Introduction, Material and Methods, Results, and Discussion (IMRAD). Mais detalhes sobre o sistema IMRAD podem ser encontrados em Ramashandran e Vimala (2014).3 Trata-se de uma diretriz para o artigo científico que será resultado do projeto de pesquisa. Este pode ser mais longo e até fazer parte de um estudo maior, recomendando-se discutir, a princípio, quais os autores de cada publicação e a respectiva ordem. Cada publicação pode conter mais informações que o exemplo a seguir; no entanto, deve contemplar os elementos que constituirão
01-Bioestatistica.indd 2
o artigo, que facilitam a compreensão do estudo e a sua reprodutibilidade por outros investigadores. O termo IMRAD traz linhas gerais que devem constar no artigo científico, mas algumas etapas devem ser complementadas conforme a Tabela 1.1, que resume as principais características a serem destacadas em um estudo científico. O modelo diz respeito às informações básicas exigidas pela maioria das revistas indexadas e com um fator de impacto de boa reputação. Quando se tratar do projeto de pesquisa, haverá alguns elementos que não constam na Tabela 1.1: A revisão de literatura que detalha o assunto central do projeto e o cronograma. Os itens Resultados, Discussão, Conclusão e Agra decimentos, uma vez que se trata ainda do projeto em que o levantamento e a exploração de dados ainda não ocorreram. No entanto, o projeto/projecto poderá ter uma seção em que se descrevem genericamente os resultados esperados. Para uma revisão sobre os principais elementos do projeto de pesquisa, consulte Barletta (2008),4 Weber e Cobaugh (2008),5 Rhodes (2012),6 Al-Jundi e Sakka (2016),7 Sudheesh et al. (2016)8 Toda pesquisa científica tem um desenho que caracteriza a forma como a pesquisa será conduzida. O desenho científico, ou delineamento científico, pode ser definido como o tipo de estudo a ser aplicado para responder à(s) pergunta(s) científica(s) que justifica(m) a realização de uma dada pesquisa. Assim, os desenhos variam de acordo com a natureza da pesquisa que é definida pelas incertezas que o pesquisador tem sobre algum fenômeno e que procura explorar, seja observando o que acontece na natureza ou interferindo sobre ela. Neste capítulo, as bases para a identificação do desenho científico quando da elaboração do projeto de pesquisa serão exploradas como uma maneira de direcionar a escolha das análises estatísticas mais apropriadas para cada caso. O objetivo não é explorar os desenhos científicos em profundidade, mas sim identificá-los como uma forma de direcionar as análises estatísticas. Assim, pretende-se dar suporte ao iniciante em pesquisa para que este possa organizar, de forma sistemática, o seu projeto de pesquisa, incluindo as principais análises estatísticas a serem realizadas nas situações mais comuns na área de Nutrição,
13/05/2021 18:27:56
Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos 3
TABELA 1.1
Modelo IMRAD – principais elementos de um artigo científico
Elementos
Função
Título
Qual é o assunto do artigo? Que pergunta o artigo pretende responder? Sugere-se que o título contenha as principais palavras-chave do artigo
Autores
Nomes e afiliação dos autores
Palavras-chave
Terminologia que melhor descreve o trabalho
Resumo
Curta e objetiva narrativa do artigo
Introdução
Por que este artigo? O problema, o que é sabido e controverso sobre o assunto escolhido (estado da arte) e os objetivos do estudo
Materiais e métodos
Como o estudo foi feito? Desenho científico a ser adotado com identificação dos participantes (características, cálculo do tamanho da amostra, critérios de seleção/randomização). Indicação do local de realização do trabalho e aprovação de Comitê de Ética em pesquisa correspondente ao objeto de estudo (humanos, animais). Descrição de materiais utilizados, tais como equipamentos e reagentes. Descrição de métodos de investigação (questionários, análises experimentais). Análise estatística
Resultados
Quais foram os achados do trabalho? Apresentação e descrição dos resultados, auxiliados por tabelas e gráficos e pela análise estatística empregada
Discussão
Qual o significado dos achados no contexto da pesquisa? Como os resultados podem ser comparados aos de outros trabalhos e em quais aspectos divergem. Quais as limitações do trabalho e os encaminhamentos futuros?
Conclusão
Quais as conclusões referentes aos objetivos que foram propostos ou quais as respostas às perguntas científicas que definiram os objetivos do trabalho? Possíveis implicações dos achados
Agradecimentos
Quem ajudou os autores no trabalho e como? Qual foi a fonte de financiamento do trabalho?
Referências
Relação dos artigos, livros e outro material publicado citados no trabalho
Apêndices
Material suplementar (questionários utilizados, parecer de Comitê de Ética, entre outros)
Fonte: adaptada de Ramashandran e Vimala, 2014.3
especialmente em estudos com humanos. Para uma leitura abrangente sobre diversos desenhos científicos na área de saúde e Nutrição, consulte as publicações de Barrie e Michael (1997) 9 e Hulley et al. (2013).10 Como o componente central do projeto é o desenho científico, deve ser estabelecido de modo criterioso, o que depende de algumas informações preliminares, tais como: a pergunta científica, os objetivos do trabalho, as variáveis envolvidas, os indivíduos a serem investigados e o tipo de informação que se pretende obter desses indivíduos para responder à(s) pergunta(s) científica(s) formulada(s). Tendo como foco o desenho do estudo e as análises estatísticas, mais detalhes serão apresentados aqui sobre os elementos necessários para definir os materiais e métodos, a saber: a pergunta científica, variáveis (preditoras, confundidoras e de desfecho), o desenho científico e, por fim, os aspectos da análise estatística tanto na definição da amostra e seleção de indivíduos quanto na análise das variáveis. A questão “Como o estudo foi feito”, destacada no modelo IMRAD, diz respeito a tais aspectos.
01-Bioestatistica.indd 3
Para a escolha do desenho científico, muitas questões devem ser observadas cuidadosamente, e estas serão aqui apresentadas para dar direcionamento à escolha do desenho científico e, em seguida, à escolha das análises estatísticas relacionadas. Serão destacados os tipos de pesquisa e desenhos utilizados em pesquisa clínica; no entanto, também será apresentada uma breve explanação sobre outros estudos em que se utilizem ou não análises estatísticas. Em um contexto amplo, é possível colocar as pesquisas na área de Nutrição assim distribuídas (Tabela 1.2). Ao observar o modelo da Tabela 1.2, o estudante deve compreender que, apesar de o tema central ser a ciência da Nutrição, a cooperação entre profissionais de diversas áreas se faz necessária para uma compreensão mais profunda dos fenômenos a serem estudados. No caso das análises estatísticas, é fundamental que o pesquisador ajuste seus pensamentos à linguagem da matemática e às informações necessárias sobre o projeto para que seja capaz de interagir de forma mais adequada com o estatístico.11
13/05/2021 18:27:56
4 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
TABELA 1.2
Exemplo de pesquisas comumente realizadas na área de Nutrição humana
Pesquisa básica (experimental)
Estudos in vitro de dosagem e caracterização de componentes alimentares (análise de alimentos) Estudos in vitro e ex vivo com cultivo de células e de tecidos (descrição de mecanismos moleculares ligados à nutrição) Estudos in vivo com animais (experimentos com intervenção utilizando-se de dietas e suplementos)
Pesquisa epidemiológica
Estudos para identificação de incidência e prevalência de condições relacionadas ao estado nutricional ou práticas alimentares encontradas na população Estudos para observação e análise de fenômenos que expliquem condições clínicas ou que indiquem riscos associados ao estado nutricional ou práticas alimentares da população Estudos para identificação de fatores de risco associados à alimentação que comprometam a condição de saúde
Pesquisa clínica
Estudos voltados a observar associações entre práticas alimentares e condutas clínicas sobre a condição de saúde ou estado nutricional de indivíduos enfermos ou da condição de saúde sobre o estado nutricional e riscos relacionados Estudos experimentais com intervenção (experimento) para avaliar efeito de práticas alimentares ou uso de suplementos, medicamentos e outros tratamentos sobre indivíduos internados, institucionalizados ou em atendimento ambulatorial (doentes ou saudáveis)
Pesquisa qualitativa
Estudos em que há registro e interpretação de visões, perspectivas, conhecimento e sentimentos quanto ao estado nutricional, alimentação e segurança alimentar e nutricional dos diversos atores envolvidos no universo da alimentação e nutrição
Fonte: elaborada pelos autores.
Para a pesquisa clínica, que pode abranger aspectos ligados a outros modelos de pesquisa na área de Nutrição, os principais elementos que fundamentam a escolha das análises estatísticas estão apresentados na anatomia da pesquisa descrita na Tabela 1.3. Na sequência, serão apresentados com mais detalhes os elementos citados na Tabela 1.3.
Pergunta Científica como Primeiro Passo para a Organização do Projeto de Pesquisa Como mencionado, o professor orientador tem conhecimento amplo sobre a linha de pesquisa com a qual trabalha. No entanto, o novo projeto de pesquisa elaborado em conjunto com o estudante, via de regra, traz elementos ainda não explorados e cuja revisão de literatura deve servir de base para a sua construção. Assim, é necessário que o estudante realize uma ampla revisão da literatura para se apropriar do assunto em questão. Isso não quer dizer que somente a observação do que está na literatura pode levar a perguntas científicas relevantes. Além disso, é necessário observar uma rotina de trabalho em que
01-Bioestatistica.indd 4
se pode questionar um procedimento; o comportamento de grupos ou indivíduos em um determinado contexto; ou, ainda, fenômenos presentes na natureza que ainda não tenham sido explorados. A pergunta científica é a incerteza de que o pesquisador quer resolver, e cabe especialmente em trabalhos em que se estudam hipóteses. Identificar a(s) pergunta(s) científica(s) que irá(ão) compor o projeto de pesquisa não é tarefa fácil e tem sido alvo de várias publicações em que se descrevem a importância do tema e as estratégias para elaboração de perguntas científicas adequadas.12-17 Podem ser citados alguns exemplos de problemas e perguntas relacionadas, a saber: Na área clínica. Um problema comum na prática clínica está relacionado com o uso de antibióticos, uma vez que provoca modificação da microbiota intestinal que pode levar à diarreia e causar redução da ingestão alimentar e absorção de nutrientes com consequente perda de peso, especialmente em idosos. Como resultado, há aumento na mortalidade nessas condições. Tendo conhecimento dos efeitos fisiológicos do uso de probióticos na prática clínica, um pesquisador pode propor a seguinte pergunta científica: o uso de lactobacilos e bifidobactérias previne diarreia associada ao uso de antibióticos em pacientes idosos institucionalizados?
13/05/2021 18:27:56
Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos 21 Pergunta científica. O baixo peso ao nascer está relacionado com o aumento na incidência de diabetes em adultos? Os indivíduos são separados de acordo com o fator de risco (baixo peso ao nascer) identificados em arquivos do passado
A pesquisa começa aqui
Número de casos de diabetes em adultos que tiveram baixo peso ao nascer é registrado
Fator de risco +
Número de casos de diabetes em adultos que não tiveram baixo peso ao nascer é registrado
Fator de risco –
Fator de risco +
Fator de risco –
FIGURA 1.8 Modelo de estudo de incidência (estudo retrospectivo). A identificação das variáveis de risco e desfecho neste modelo é análoga ao descrito na Figura 1.7; no entanto, o desfecho já ocorreu e, por isso, o pesquisador vai buscar as informações em registros feitos no passado Fonte: adaptada de Barker e Clark, 1997.52
Estudos caso-controle de incidência Os estudos de caso-controle consistem em estudar uma doença já existente em uma determinada população e escolher indivíduos saudáveis dessa mesma população para observar se o fator de risco proposto pelo pesquisador está mais presente no grupo que tem a doença em relação ao grupo saudável. São derivados dos estudos de incidência (longitudinais). Pode-se elaborar um desenho científico do tipo ca so-controle de incidência e de prevalência. O primeiro poderia ser elaborado a partir de um estudo longitudinal de incidência. Por exemplo: no estudo longitudinal com as mulheres chinesas (Figura 1.7), todos os casos de câncer de mama ao final do estudo seriam selecionados, sendo eles pertencentes ao grupo que bebe mais álcool ou ao grupo que bebe menos álcool. Assim, o grupo sofreria uma nova divisão, agora não baseada no consumo de álcool, mas nos casos da doença. Um grupo controle seria formado com as mulheres chinesas que não tiveram a doença, e outros
01-Bioestatistica.indd 21
fatores de risco poderiam ser verificados, como, por exemplo, a obesidade. Daí o nome caso-controle de incidência. Importante destacar que essa característica (obesidade) deveria ter sido registrada no início do seguimento e mantida ao longo do tempo até o desfecho. Assim, seria possível relacionar a incidência de câncer de mama com a obesidade nessa população.
Estudos de prevalência (transversais) No caso dos estudos transversais de prevalência, a intenção do pesquisador também é estabelecer uma relação entre fatores de risco e desfechos; no entanto, neste modelo, o desfecho já está presente no momento da coleta de dados. Cada indivíduo é avaliado apenas em um instante do tempo, ou seja, não há seguimento e somente é possível coletar dados de prevalência de desfechos. Por esse motivo, os estudos de prevalência não são caracterizados como longitudinais, mas transversais. A seguir, é mostrado um exemplo. Suponhamos que o interesse do pesquisador fosse estabelecer uma relação entre o consumo de bebidas
13/05/2021 18:27:59
22 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
adoçadas e a obesidade em escolares de uma determinada cidade na faixa etária de 11 anos. A população de estudo seria separada, de acordo com o fator de risco, em consumidores diários de bebidas adoçadas (consumidores frequentes) e consumidores semanais de bebidas adoçadas (consumidores esporádicos). Nesse caso, as variáveis seriam coletadas perguntando-se aos pais sobre a frequência de consumo destas bebidas. O desfecho seria a presença ou não de obesidade. A relação entre o consumo de bebidas açucaradas e prevalência de obesidade seria então determinada. Os custos deste tipo de estudo são inferiores aos longitudinais; no entanto, neste caso, como o pesquisador escolhe a posição das variáveis, existe o risco de inversão dos fatores, ou seja, o consumo de bebidas açucaradas é fator de risco para obesidade ou a obesidade leva ao consumo maior de bebidas açucaradas? É uma situação em que pode ocorrer a causalidade inversa. Também poderia acontecer de a maioria das crianças com obesidade já ser acompanhada por profissionais de saúde e, no momento do estudo, o seu consumo de bebidas açucaradas até fosse inferior ao das crianças sem obesidade, constituindo como variável confundidora a alteração (recente) dos hábitos de consumo de bebidas açucaradas. Para ilustrar este estudo transversal de prevalência, pode-se observar a Figura 1.9.
Estudos de caso-controle de
prevalência
Nos estudos de caso-controle de prevalência, selecionam-se dois grupos de indivíduos: um que apresenta certa característica (casos de uma doença rara, por exemplo) e outro que, conhecidamente, não tem essa característica (controles saudáveis). Observe que, no exemplo anterior (Figura 1.9), primeiro eram selecionados os indivíduos e depois estes eram divididos de acordo com a presença ou não de determinada característica. Em um estudo de caso-controle de prevalência, poderíamos, por exemplo, selecionar um grupo de crianças com obesidade e um grupo de crianças sem obesidade e comparar o consumo de bebidas açucaradas entre eles. São derivados dos estudos de prevalência (transversais). Estudos
observacionais na prática clínica | Características básicas
Embora os modelos observacionais sejam comuns em estudos epidemiológicos, estudos clínicos podem também assumir características de estudos observacionais descritivos e observacionais analíticos do tipo longitudinais e transversais. Uma diferença a ser considerada é que, nos estudos epidemiológicos, o número de indivíduos estudados e o período de seguimento, no
Pergunta científica. O uso de bebidas açucaradas está associado à prevalência de obesidade na infância? As crianças são divididas em dois grupos de acordo com o consumo de bebidas açucaradas Consumidores frequentes
Consumidores esporádicos
Número de crianças obesas neste grupo (prevalência) é registrado
Número de crianças obesas neste grupo (prevalência) é registrado
A expectativa do pesquisador é que a prevalência de obesidade seja maior entre as crianças que consomem bebidas açucaradas mais frequentemente FIGURA 1.9 Modelo de estudo de prevalência (transversal) tendo como fator de risco o consumo de bebidas açucaradas
e desfecho de obesidade entre escolares. Não há seguimento das crianças ao longo do tempo, pois as medidas são tomadas de forma transversal Fonte: elaborada pelos autores.
01-Bioestatistica.indd 22
13/05/2021 18:27:59
2 Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação Organização das Variáveis na Planilha de Dados para Posterior Análise Estatística Conforme descrito no Capítulo 1, um trabalho de investigação deve começar com a pergunta científica. Nessa etapa, identifica-se a população a ser estudada, as variáveis de interesse e o tipo de desenho científico mais adequado para responder ao postulado pelo pesquisador. A fase que antecede os cálculos estatísticos é a escolha das variáveis a serem estudadas. Em seguida, e após a definição do desenho científico, a primeira etapa que envolve a matemática é o cálculo do tamanho da amostra,1-4 seguida dos processos de randomização para escolha de uma amostra representativa da população de interesse e, quando for o caso, para divisão desta em grupos homogêneos.5 Resumidamente, a sequência de eventos está apresentada mais adiante na Figura 2.1. As etapas iniciais envolvidas na escolha do tratamento estatístico a partir da pergunta científica são: A. Definição da(s) pergunta(s) científica(s), com a identificação de população/amostra-alvo. B. Identificação das variáveis presentes na pergunta científica e definição de suas características. C. Definição do tipo de desenho científico a ser atribuído para responder à(s) pergunta(s). D. Identificação das variáveis a serem controladas (confundidoras). E. Cálculo do tamanho da amostra. F. Definição dos processos de randomização. Importante destacar que a interação do estudante com o orientador da pesquisa é fundamental nessa fase do projeto, não somente para a definição de população, tamanho da amostra e processos de randomização, mas também para a adequada identificação das variáveis a serem exploradas.
02-Bioestatistica.indd 35
A clareza na definição das variáveis a serem exploradas e a forma como serão expressas é uma etapa de extrema importância e está implícita nos itens B e D. Trata-se de uma etapa crítica do trabalho, pois as variáveis devem ser expressas de modo a permitir que os objetivos da pesquisa sejam atendidos. Para tanto, devem traduzir adequadamente as características do objeto de estudo. Assim, a organização das variáveis de interesse em uma planilha é uma tarefa bastante complexa, pois não se trata da simples digitação de todas as informações recolhidas ou registradas em documentos sobre os participantes de uma pesquisa, por exemplo. Nesta etapa, é necessária uma análise crítica sobre a melhor forma de representar as informações dos participantes. Por exemplo, uma variável bastante comum em estudos de Nutrição é o peso, mas nem sempre expressá-lo como medida original é a escolha do pesquisador. Dependendo do objetivo do trabalho, poderá ser expresso como % de perda de peso, ganho de peso em x dias, categorizado em variável binária como perda de peso ≥5% ou <5% em 30 dias, classificado de acordo com escores Z ou em percentis, entre outras possibilidades. Além disso, ao categorizar indivíduos em grupos de acordo com determinada variável, é fundamental a busca de padrões adequados de referência6 e critérios validados de classificação, por exemplo, graus de desnutrição de acordo com a Organização Mundial da Saúde (OMS) (ver Capítulo 1, Figuras 1.2 e 1.3). A decisão de categorizar as variáveis deve levar em conta o significado clínico desta decisão, sem deixar de considerar também suas limitações, como, por exemplo, a diminuição do poder do estatístico e o risco de viés.7 Nesta fase, é possível citar também a necessidade de separar os indivíduos de acordo com sexo, intervalos de idade, faixa salarial, composição de agregado familiar, tipo de tratamento, entre outros aspectos.
18/05/2021 17:00:57
36 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
Tanto nos casos em que há uma classificação ou separação de indivíduos de acordo com critérios preestabelecidos, como o índice de massa corporal (IMC), por exemplo, quanto nos casos em que este critério não está claramente definido, como na separação de indivíduos de uma amostra de acordo com a doença diagnosticada no internamento ou conforme o uso de medicamentos, por exemplo, especialmente quando a amostra é pequena, é importante verificar que um número muito grande de categorias deixará a amostra “diluída” entre as múltiplas possibilidades, dificultando as análises estatísticas.8,9 Neste caso, é importante revisar os dados e agrupar duas ou mais categorias em uma, de modo a diminuir o número total de categorias, aumentando, assim, o número de casos em cada uma delas. Por exemplo, para verificar a relação entre sexo e diagnóstico de enfermidades como motivo de afastamento do trabalho em um hospital de grande porte em uma amostra de mais de cinco mil funcionários, a divisão das categorias de enfermidades em mais de 30 possibilidades pode mostrar baixa frequência de casos em algumas categorias. Para ilustrar a situação de número excessivo de categorias, imaginemos que apenas um indivíduo teve uma determinada enfermidade. Suponhamos que tal enfermidade seja um tumor intestinal raro e, ainda, que outros 18 indivíduos tiveram também tumores intestinais menos comuns, embora com diferentes características histológicas. Neste caso, parece razoável que essas duas categorias fossem agrupadas em uma única sob o título de tumores intestinais raros, aumentando, portanto, o número de casos nessa categoria. Outros exemplos seriam o agrupamento de variáveis em um grupo de afastamentos por motivo psicológico, por lesões musculares, entre outras. Obvia mente, quando a prevalência de doenças é maior, não existe a necessidade de agrupamento como no caso das doenças endócrinas e metabólicas. Alguns exemplos de organização das variáveis podem ser observados mais adiante neste capítulo sob o subtítulo: a definição da forma de apresentação das variáveis. Ao longo deste capítulo, serão abordados os seguintes assuntos: Definição e forma de apresentação das variáveis do estudo científico. Cálculo do tamanho da amostra. Processos de randomização e pareamento.
02-Bioestatistica.indd 36
Características demográficas dos grupos a serem estudados. Exemplos relacionados com a ciência da Nutrição serão apresentados para cada etapa, especialmente estudos com humanos, mas não obrigatoriamente.
Definição da Forma de Apresentação das Variáveis Como já mencionado, quando o pesquisador estabelece a(s) pergunta(s) científicas de seu trabalho, pode optar por apresentar as variáveis de diferentes formas que não são necessariamente as originalmente coletadas da população de interesse. A seguir, são mostrados alguns exemplos. Suponhamos que um pesquisador queira investigar se há influência dos tipos de carboidratos ingeridos por mulheres sobre a incidência de diabetes; observemos como os elementos principais da pergunta podem ser destacados para direcionar as escolhas quanto ao desenho científico e ao tratamento estatístico dos dados considerando, por exemplo, a pergunta de investigação: O consumo inadequado de açúcares livres pode levar a um aumento do risco de incidência de diabetes tipo 2 em mulheres da cidade x? Um dos pré-requisitos fundamentais quando da elaboração da pergunta científica é a clareza das informações nela contidas. Neste exemplo, está evidente que as variáveis de interesse são: os açúcares livres ingeridos como variável independente e, como variável dependente, a incidência de diabetes. Os participantes da pesquisa, como mencionado, serão mulheres. Quando se trata de incidência de diabetes, a pergunta indica desfecho, ou seja, algo que será medido ao longo de um período e não em um dado momento do tempo. Assim, pode-se entender que é um estudo observacional longitudinal de inci dência (ver Figura 1.6). A variável relativa ao consumo de açúcares livres é originalmente quantitativa contínua e é computada no banco de dados como total somando-se a quantidade, em gramas, de monossacarídeos e dissacarídeos presentes em bebidas comerciais, no preparo de alimentos pelas mulheres, além dos açúcares naturalmente presentes no mel, por exemplo. No entanto, como a pergunta científica pressupõe um estudo de incidência, o pesquisador pode optar
18/05/2021 17:00:57
Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação 47
A média de células natural killer foi 65,5 65,5
O valor da média da população estaria próximo à média encontrada no estudo, em um intervalo de 95%, e podem, então, ser qualquer valor neste intervalo Os valores extremos e, portanto, apresentando um número pequeno da população somam 0,05 e correspondem ao valor de erro alfa cujo nível de significância é estabelecido como p <0,05
0,95
0,025 –2 Desvios-padrão P2,5 Escore Z= –1,96
Média +2 Desvios-padrão P50 P97,5 Escore Z = 0 Escore Z = +1,96
FIGURA 2.7 Representação gráfica do intervalo de confiança P: percentil. Fonte: elaborada pelos autores.
Para o caso do valor de alfa assumido ser 5%, o IC a 95% irá corresponder a valores de Z entre –1,96 e +1,96. O escore Z = +1,96 é o valor do percentil 97,5 da curva, e Z = –1,96 está associado ao percentil 2,5. Assim, 95% da população encontra-se no intervalo entre cerca de 2 desvios-padrão acima e 2 desvios- padrão abaixo da média. O erro beta diz respeito à aceitação equivocada da hipótese nula (H0), ou seja, concluir que não há diferença entre grupos ou proporções quando elas existem. Neste caso, seria rejeitar, erroneamente, a hipótese do pesquisador. O erro beta, que é escolhido de forma convencional em pesquisas de boa qualidade, tem valores habituais de 10% ou 20% e é utilizado para calcular o poder estatístico da análise (1-beta). Admitir 10% de chance de errar ao assumir que o tratamento não funcionou significa que a chance de detectar uma real diferença entre grupos de médias é de 90%. O poder da análise também deve ser usado no cálculo do tamanho da amostra. Nas fórmulas de cálculo do tamanho da amostra, quando se assume a normalidade da distribuição, é comum usar os escores Z em função dos valores de alfa e beta. Na Figura 2.8, estão apresentados os dados para o cálculo do tamanho da amostra para o exemplo do
02-Bioestatistica.indd 47
efeito da dieta imunomoduladora suplementada com quercetina sobre a competência imune de pacientes criticamente doentes. Neste caso, o foco está na informação dos erros alfa e beta. Importante notar que o tamanho da amostra do estudo preliminar tinha 10 indivíduos para cada grupo, e tamanho do efeito de 0,5, de acordo com as informações adicionadas pelo pesquisador. Este tamanho não será suficiente para o estudo final. O tamanho da amostra calculada para um poder de 80% foi de 42, ou seja, cada grupo deverá ser composto de 14 indivíduos. Considerando que alguns pacientes podem deixar a amostra, neste caso, por óbito, alta, intolerância ao suplemento ou outra intercorrência que o impeça de seguir, uma margem deve ser adicionada ao valor inicialmente calculado. Tal margem também pode ser estimada com base na característica da população e do desenho científico. Por exemplo, idosos com alguma enfermidade e que, para participar de uma pesquisa, tenham que se locomover a algum local distante de suas residências em dias de inverno podem desistir com mais facilidade do que adolescentes saudáveis que sejam avaliados em suas escolas. Da mesma maneira, quando se trata de um estudo transversal com uma única avaliação, a desistência tende a ser menor do que no caso de estudo
18/05/2021 17:01:00
48 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
1
2 3 4 *
FIGURA 2.8 Valores de erro alfa e beta para o cálculo do tamanho da amostra em um estudo de comparação de médias entre três grupos. Neste exemplo, foi utilizada atividade de células natural killer em % com base no valor líquido (% antes da intervenção menos a % após a intervenção), uma vez que os valores iniciais da atividade dessas células eram diferentes entre os grupos por serem pacientes pouco estáveis. Observe que o valor total do tamanho da amostra = 42 está circulado com *. 1. O teste escolhido pelo pesquisador foi a ANOVA: análise de variância (fixed effects, omnibus one way). 2. A análise solicitada foi o tamanho da amostra – dado o valor de alfa, poder e tamanho do efeito. 3. O tamanho do efeito escolhido (effect size) foi 0,5. 4. O erros-alfa (0,05) e beta (0,8) devem ser aqui informados Fonte: imagem do programa GPower® editado pelos autores.
longitudinais com vários momentos de avaliação ao longo de semanas ou meses. Essa margem pode ainda ser proposta com base em outros estudos publicados ou na experiência do pesquisador ou, ainda, em estatísticas/registros do próprio serviço da unidade de terapia intensiva (UTI). Assim, imaginando-se que esta margem fosse calculada em 25%, o número total de indivíduos seria de 52,5. Dividindo-se por três, seriam 17,5. Obviamente, não é possível estudar um número não inteiro de indivíduos, devendo ser selecionados 18 indivíduos por grupo. Caso o valor do poder da amostra fosse aumentado para 90%, o tamanho da amostra aumentaria. Se a variação dos dados, ou seja, o desvio padrão, fosse muito alta, o tamanho da amostra também aumentaria consideravelmente. Caso a diferença entre as médias fosse maior, ou seja, se a expectativa de que o suplemento tivesse um efeito que fizesse a atividade das células aumentar muito em relação às outras, o tamanho da amostra diminuiria, porque a diferença seria mais fácil de detectar.
02-Bioestatistica.indd 48
Enfim, um trabalho mais rigoroso (poder elevado) exige um maior número de indivíduos. Uma intervenção com um efeito muito brando (resultado com diferenças pequenas) precisaria de uma amostra grande para mostrar valia, ou seja, talvez o impacto sobre os doentes não fosse clinicamente significativo, e o pesquisador deveria pensar se é válido o investimento e se seria ético experimentar. Uma variável que tenha a característica, por natureza, de ser muito diferente (heterogênea) entre os indivíduos, por exemplo, exigiria um maior tamanho da amostra; no entanto, se o efeito fosse muito bom, amenizaria as exigências quanto ao tamanho da amostra. Uma observação importante a ser feita aqui é que algumas das fórmulas para o cálculo do tamanho da amostra pressupõem número igual de participantes em cada grupo para manter o máximo poder da análise. No entanto, em muitos casos, isso não é possível por motivos diversos. Nos estudos experimentais, pode ocorrer que, por uma questão de custos ou por dificuldade de selecionar controles, ou mesmo
18/05/2021 17:01:00
3 Organização de Dados na Planilha do IBM® SPSS® Introdução No universo da Nutrição, os procedimentos estatísti cos permitem determinar o tamanho de uma amostra representativa da população, organizar dados para descrever as suas características nutricionais e, não menos importante, testar as hipóteses ou as inferên cias estabelecidas pelo pesquisador no momento da elaboração de seu estudo científico. Além disso, os testes também são utilizados para validar instrumen tos de avaliação do estado nutricional e de educação nutricional, estabelecer equações destinadas à deter minação do gasto energético e outras relacionadas com o metabolismo e a composição corporal. Além disso, a estatística é utilizada em trabalhos para iden tificação, isolamento e caracterização de compostos nutricionais e bioativos em alimentos. Importante ressaltar que a escolha das análises esta tísticas a serem utilizadas para exploração de dados, independentemente da natureza do trabalho científi co em questão, deve ocorrer somente após elabora ção cuidadosa do projeto de pesquisa. Para a elabo ração cuidadosa do projeto, o pesquisador deve ter clareza sobre o assunto a ser tratado, as perguntas científicas e os objetivos da pesquisa, além da defi nição da natureza das variáveis a serem exploradas. Adicionalmente, deve definir o tipo de desenho cien tífico a ser empregado. Infelizmente, por não explorar adequadamente a literatura acerca do seu objeto de estudo, pode acontecer de o acadêmico vir a reproduzir hipóteses já exaustivamente exploradas, que sejam irrelevantes para a sociedade, desconectadas dos objetivos do trabalho, em particular no caso em que a pergunta científica não tenha sido claramente estabelecida, ou até que eventualmente levantem algumas questões éticas. Assim, ressalta-se a importância do tempo des tinado à elaboração criteriosa do projeto de pesquisa
03-Bioestatistica.indd 55
e a interação com o professor orientador, conforme destacado no Capítulo 1. Para a organização dos capítulos que se seguem, será adotado um sistema em que serão abordados os conceitos básicos dos testes estatísticos, a sua aplica ção e a execução de análises com resultados comen tados utilizando-se o programa IBM® SPSS® versão 25 (SPSS). Muitos exercícios tiveram como base projetos de graduandos, residentes e mestrandos em Nutrição; no entanto, não reproduzem os projetos, especial mente em relação aos dados, pois estes foram mo dificados por questões éticas. Para alguns exemplos, foram simulados projetos e dados fictícios. Este documento não pretende discutir todas as possibilidades de aplicação da estatística e em todas as áreas da Nutrição; assim, as Tabelas 3.1 a 3.3 apresen tam os assuntos que serão abordados, conforme o tipo de estudo e as características das variáveis envolvidas. Para explorar aspectos básicos sobre as análises indicadas nessas tabelas, pode-se recorrer a algumas publicações que trazem considerações sobre a esco lha de testes estatísticos.1-7 Umas das dificuldades em estabelecer as análises estatísticas é o fato de não haver uma única maneira de analisar dados, cabendo ao pesquisador o senso crítico para explorar as variáveis da melhor forma pos sível. Assim, os modelos que serão aqui apresentados seguirão uma lógica para apresentação didática dos principais testes estatísticos utilizados em Nutrição, mas que não necessariamente são a única alternativa para explorar os dados que serão apresentados. Antes de apresentarmos as análises estatísticas propriamente ditas, algumas tarefas para organização de planilhas serão exploradas com base no guia publi cado pela IBM Corporation.8 Para os tutoriais com os exemplos de uso do SPSS, serão apresentadas cópias das planilhas de banco de dados simulados para esta publicação e resultados das
18/05/2021 17:46:55
56 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
TABELA 3.1
Análises univariadas
Variável em estudo
Quantitativa normal: uma
Quantitativa não normal: uma
Qualitativa ordinal: uma
Qualitativa nominal: uma Categorias: diversas
Categorias: duas
Estatística descritiva
Média e desvio-padrão; mínimo e máximo
Mediana e P25, P75; mínimo e máximo
Frequência relativa (%)
Frequência relativa (%)
Frequência relativa (%)
Associação com: uma quantitativa normal
Associação de Pearson
Associação de Spearman
–
Curva ROC
Associação com: uma quantitativa não normal
Associação de Spearman
Associação de Spearman
–
Curva ROC
Comparação entre grupos independentes: dois grupos
Teste t para amostras independentes
Teste de Mann-Whitney
Teste do qui-quadrado
Comparação entre grupos independentes: três ou mais grupos
ANOVA
Teste de Kruskal-Wallis
Teste do qui-quadrado
Comparação entre medidas pareadas de um grupo: duas medições repetidas
Teste t pareado
Teste de Wilcoxon
Teste de McNemar ou κ de Cohen
Teste de Friedman
Teste de McNemar ou κ de Cohen
Objetivo
Comparação entre medidas ANOVA para medidas pareadas de um grupo: três ou repetidas mais medições repetidas Fonte: elaborada pelos autores.
TABELA 3.2
Análises multivariadas Variável em estudo
Variável dependente
Variáveis independentes
Abordagem estatística
Associação entre diversas quantitativas e uma média
Quantitativa normal: uma
Quantitativas normais
Regressão linear
Associação entre diversas variáveis e a chance de um evento
Qualitativa nominal dicotômica: uma
Diversas: qualquer tipo
Regressão logística
Associação entre diversas variáveis e uma média
Quantitativa normal: uma
Várias quantitativas normais e/ou qualitativas nominais
ANOVA univariada
Associação entre diversas variáveis e várias médias de medidas repetidas
Várias avaliações pareadas da mesma medida quantitativa normal
Várias quantitativas normais e/ou qualitativas nominais
ANOVA para medidas repetidas
Associação entre diversas variáveis e várias médias de medidas diferentes
Várias medições de medidas diferentes quantitativas normais
Várias quantitativas normais e/ou qualitativas nominais
ANOVA multivariada
Objetivo
Fonte: elaborada pelos autores.
TABELA 3.3
Estudos temporais Variável em estudo
Variável independente
Variável dependente
Abordagem estatística
Associação entre uma condição e o tempo até o evento
Qualitativa ordinal ou nominal: uma
Quantitativa
Kaplan-Meier
Associação entre diversas condições e o tempo até o evento
Qualitativas ou quantitativas: diversas
Quantitativa
Análise de regressão de Cox (proporção de risco de Cox)
Objetivo
Fonte: elaborada pelos autores.
03-Bioestatistica.indd 56
18/05/2021 17:46:56
Organização de Dados na Planilha do IBM® SPSS® 67
3 3 1
2
1
2 4 4
5 5
A A
B B
FIGURA 3.18 (A e B) Seleção de variáveis. Neste exemplo foi criado um filtro em que valores de número de horas em
que vê TV (horastv) fosse igual ou inferior a 11. Observe que o número 11, na linha 16, não foi selecionado e não será computado nas análises que seguirem esta etapa
Fonte: planilha do SPSS® editada pelos autores.
No caso de intervalo de dados Neste mesmo banco de dados, caso o desejo seja ava liar somente aqueles com idade entre 13 e 15 anos, procede-se da mesma maneira. No entanto, um inter valo referente aos dados da coluna idade será criado (Figura 3.19).
e, sim, por indivíduo, ou seja, todas as informações sobre um determinado caso serão selecionadas e, por consequência, nenhuma variável dos casos não selecionados fará parte da análise estatística realizada com base nesse tipo de seleção. Supondo-se, neste exemplo, que o pesquisador deseja incluir somente os dados presentes até a linha
No caso da seleção por faixa de casos
178, ou seja, meninas até o caso 178, esta poderia
Pode-se também utilizar a ferramenta para selecionar
balhando com dados retrospectivos obtidos de um
somente um determinado número de casos. Destaca-
banco de dados de um determinado hospital. Poderia
se aqui que a seleção não é realizada por variáveis
ocorrer, por exemplo, que os dados computados a
03-Bioestatistica.indd 67
ser uma situação em que o pesquisador estivesse tra
18/05/2021 17:47:02
68 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
4 4 3 3
1 1
2 2
A A 5 5 7 7 6 6
8 8 B B
FIGURA 3.19 (A e B) Seleção de casos de acordo com um intervalo de valores. 1. No quadro grupo de funções, seleciona-
-se Procurar. 2. Em funções e variáveis especiais, seleciona-se Range. 3. Transfere-se Range para a caixa que está sendo editada com o auxílio da seta. 4. O sinal ? surge na caixa de seleção com três opções (A). 5. Seleciona-se a variável para definir o intervalo (idade em anos). 6. Transfere-se a variável utilizando-se a seta. 7. Digitam-se os valores escolhidos para o intervalo (13 e 15). 8. Seleciona-se Continuar (B)
Fonte: planilha do SPSS® editada pelos autores.
partir do indivíduo 178 apresentassem muitas infor
Em todos os exemplos aqui citados para seleção de
mações faltantes ou incompletas que compromete
casos, pode-se salvar a planilha com os filtros ativos
riam as análises caso fossem considerados. Assim,
em arquivos separados. Basta digitar na opção “saí
neste caso, é apropriado encerrar as análises no
da” o nome do novo arquivo (Figura 3.21).
caso 178.
Os exemplos aqui apresentados encerram alguns
O caminho seria: selecionar “com base na hora
dos mais comuns relacionados com a edição de dados
ou faixa de caso” seguido da inclusão dos números 1
em planilhas do SPSS. Nos capítulos a seguir, serão
e 178 na caixa “selecionar casos: amplitude” (Figura
apresentados procedimentos estatísticos mais especí
3.20).
ficos para descrição ou análise de dados.
03-Bioestatistica.indd 68
18/05/2021 17:47:03
4 Identificação das Características de uma Amostra (Estatística Descritiva) Introdução Estatística descritiva é assim chamada por ser utilizada na descrição de fenômenos que, na área de Nutrição, dizem respeito às variáveis que conferem identidade a uma dada amostra ou população sob o ponto de vista de saúde. Pode-se descrever um grupo de indivíduos com dados qualitativos, por exemplo, identificando a frequência absoluta (número total de casos) ou relativa (percentual) de casos com e sem uma deficiência vitamínica, obesos e não obesos, que tiveram como desfecho óbito ou sobrevivência em função da desnutrição, entre outros. Bastante comum também é a descrição desses grupos por meio de medidas de tendência central e dispersão. Tais medidas remetem à ideia de conjunto, ou seja, o quanto os indivíduos que pertencem a um determinado grupo apresentam características similares ou divergentes e são representadas, basicamente, pela média, desvio-padrão, mediana e variância, como é o caso dos dados quantitativos como consumo de nutrientes em grama (g), medidas antropométricas em centímetro (cm), milímetro (mm) ou quilograma (kg), níveis circulantes de nutrientes em micrograma (µg) ou miligrama (mg), hormônios, lipoproteínas, entre outros. Essas medidas de tendência central e dispersão são discutidas ao longo desta obra; no entanto, surgem à medida que fazem parte das análises estatísticas mais comuns na área de Nutrição. Assim, para aqueles que estão iniciando sua experiência na área de pesquisa em Nutrição, é aconselhável acessar livros-textos básicos de bioestatística ou artigos de revisão que tratam do assunto, tais como Hazra e Gogtay (2016),1 Mishra et al. (2019).2 Pode-se encontrar também sugestões de como reportar essas medidas em artigos científicos.3,4
04-Bioestatistica.indd 71
Para observar um exemplo de estatística descritiva utilizando frequências relativas de dados de consumo alimentar, consultar Slater e Mudryj (2018);5 para dados clínicos, incluindo estado nutricional, consultar Olivares et al. (2019).6 No caso do exemplo de estatística descritiva envolvendo medidas de tendência central, com dados antropométricos e metabólicos, entre outros, consultar o trabalho de González-Quiroz et al. (2017).7 A identificação das características das variáveis é uma etapa inicial importante de uma pesquisa, pois é possível explorar os dados de modo a compreender a amostra a ser estudada e, assim, direcionar a melhor abordagem estatística e interpretação dos resultados. No caso de dados quantitativos, são sugeridas as seguintes tarefas antes de iniciar as análises propriamente ditas: A. Caracterização do comportamento dos dados quanto à sua distribuição (testes de normalidade). B. Identificação de dados com comportamento divergente em relação ao conjunto de dados (valores extremos e discrepantes). C. Recodificação de valores de acordo com a sua frequência no conjunto de dados (distribuição de frequências). Uma das preocupações iniciais do pesquisador é a observação da forma de distribuição das variáveis, quando quantitativas, pertencentes ao conjunto de dados a ser analisado. Tal preocupação é pertinente, considerando que o tipo de distribuição dos dados direciona a escolha dos testes estatísticos a serem aplicados nas etapas subsequentes, especialmente quando se tratam de amostras pequenas (até 30 ou 40 indivíduos). Este é o caso, em especial, de estudos clínicos quando se pretende comparar grupos de indivíduos. Cabe ressaltar, no entanto, que os valores extremos ou discrepantes citados (item B) podem ser
18/05/2021 17:54:36
72 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
resultantes de erros em várias etapas do estudos cien-
para o consumo de nutrientes indicado nas DRI tive-
tíficos, desde a seleção dos participantes e o uso ina-
ram como base o consumo alimentar da população
dequado de instrumentos,8 mas também podem ser
saudável de países desenvolvidos e complementados
característica de uma população que apresenta ver-
com estudos clínicos.10 Contudo, nem todos os nu-
dadeira heterogeneidade de um fenômeno clínico.
9
trientes apresentam um consumo homogêneo na po-
Assim, o fato de uma população apresentar alguma
pulação. Assim, diferentes recomendações são ado-
variável de interesse do pesquisador com distribuição
tadas com base no comportamento de cada variável/
não homogênea em torno da média aritmética dos
nutriente (Tabela 4.1).
dados não significa, obrigatoriamente, que haja al-
A distribuição normal (por vezes, chamada de pa-
gum erro metodológico na seleção de indivíduos ou
ramétrica) é caracterizada por uma simetria na dis-
na coleta de dados.
tribuição dos dados e curtose nula.11 Tal distribuição
Observe o exemplo das dietary reference intakes
é caracterizada por um gráfico em formato de sino
(DRI), a saber: estimated average requirement (EAR),
que pode ser observado na Figura 4.1, em que estão
recommended dietary allowance (RDA), adequate in-
apresentados os dados de consumo de vitamina C por
take (AI), upper limit (UL) e acceptable macronutrient
mulheres adultas saudáveis. Por ser uma distribuição
distribution ranges (AMDR). Os dados de referência
simétrica, a média é igual à mediana. Observa-se que
TABELA 4.1
Dietary reference intakes (DRI) e seu uso para a avaliação da ingestão energética e de nutrientes para estudos científicos
Referência
Para avaliação de grupos
Estimated average requirement (EAR): média de ingestão diária estimada para atender ao requerimento de metade dos indivíduos saudáveis em um determinado estágio da vida e sexo Mediana de ingestão
Utilizado para avaliar a prevalência de inadequação de ingestão de um grupo considerando-se como referência a população saudável da EAR
Recommended dietary alowance (RDA): média de ingestão diária suficiente para atender quase a totalidade de indivíduos (97% a 98%) saudáveis em um determinado estágio da vida e sexo RDA = EAR + 2SD
Não deveria ser utilizada para avaliação de grupos (só na avaliação de indivíduos)
Adequate intake (AI): média de ingestão diária recomendada baseada em aproximações ou estimativas de observações ou experimentos de um grupo (ou grupos) de indivíduos saudáveis – usada quando a RDA não pode ser determinada
Utilizada para avaliar a prevalência de inadequação de ingestão quando a EAR não está disponível. Deve ser observada com mais cuidado que a EAR quando não tiver sido estabelecido como a média de ingestão da população saudável
Tolerable upper intake level (UL): média de ingestão diária mais elevada e que provavelmente colocaria em risco de efeitos adversos à saúde todos os indivíduos saudáveis de um determinado estágio da vida e sexo
Utilizado para identificar a proporção da população que se encontra em risco ou fora de risco de ingestão excessiva
Estimated energy requirement (EER): requerimento energético estimado para manter o balanço energético de uma população saudável conforme idade, sexo, peso, estatura, nível de atividade física e estágio da vida (gestação, lactação)
Utilizado para identificar a proporção da população que se encontra acima, no intervalo ou abaixo desta amplitude determinada
Acceptable macronutrient distribution ranges (AMDR): faixa de ingestão de uma fonte de energia (carboidratos, proteínas e lipídios) que está associada a um risco reduzido de doença crônica, ainda garantindo quantidades adequadas de nutrientes essenciais. Expressado como percentual do total de energia ingerida. Os valores de referência variam entre limite superior e inferior
Utilizada para identificar a proporção da população que se encontra acima, no intervalo ou abaixo da amplitude determinada. Ingestão que estiver identificada abaixo ou acima da faixa estabelecida aumenta o potencial para um risco elevado de doenças crônicas, bem como o consumo inadequado de nutrientes essenciais
Prevalência de inadequação é referida como a porcentagem de um grupo com ingestão abaixo dos requerimentos. Fonte: adaptada de IOF, 2006.10
04-Bioestatistica.indd 72
18/05/2021 17:54:36
Identificação das Características de uma Amostra (Estatística Descritiva) 81
60,00 55,00
Máximo (Q3 + 1,5*IQR)
o19 o22
Valores discrepantes
MLGord0
50,00
3o quartil (P75)
45,00
Intervalo interquartil (Q3 – Q1)
40,00
Mediana (2o quartil, P50) 1o quartil (P25)
o10
35,00
Mínimo (Q1 – 1,5*IQR)
30,00 Exercício
Dieta
Exercício e dieta Grupo
FIGURA 4.6 Massa livre de gordura no tempo zero (MLGord0) para três grupos de tratamento: exercício; exercício e
dieta; dieta. O desenho indica a distribuição dos valores (em marrom) em torno da mediana (traçado preto), bem como o desvio-padrão e a indicação dos valores discrepantes indicados por círculos (o) com indicação da linha da planilha que localiza o caso em que estes valores se encontram. Nenhum valor extremo está presente nesta análise. Caso ocorresse, um sinal de * estaria indicando este valor. Q1: 1o quartil; Q3: 3º quartil; IQR: intervalo interquartil; P25: percentil 25; P50: percentil 50; P75: percentil 75 Fonte: resultado do SPSS® editado pelos autores.
amostra exerce uma função na quantidade de dados assinalados no diagrama de caixa e bigodes. Assim, não é aconselhável retirar os dados quando estes são apontados como discrepantes, sob o risco de manipulação tendenciosa de resultados. Mesmo no caso da identificação de valores extremos, não há indicação de retirada dos dados da análise, a não ser que seja identificada alguma incoerência em seu registro. Em geral, o teste de Shapiro-Wilk é aplicado para amostras até perto de 50 indivíduos e o teste de Kolmogorov-Smirnov é indicado para avaliar amostras maiores. Assim, no exemplo aqui utilizado, o teste mais indicado seria o primeiro citado que indicou somente a renda no grupo exercício e dieta como tendo uma distribuição não normal. Os critérios que podem ser observados para definição do tipo de distribuição estão resumidos na Tabela 4.6. Os pontos de corte do tamanho amostral apresentados na Tabela 4.6 devem ser entendidos como uma orientação, e os procedimentos apresentados devem ser complementados com uma análise dos gráficos relativos à distribuição. Adicionalmente, quando
04-Bioestatistica.indd 81
TABELA 4.6
Testes para observação da normalidade de uma amostra | Escolha do critério para definição do tipo de distribuição de uma amostra com base no tamanho aproximado da amostra
Critérios
Tamanho da amostra (n)
Teste de Shapiro-Wilk
50
Teste de Kolmogorov-Smirnov
50 a 100
Assimetria e curtose
>100
Fonte: adaptada de Razali e Wah, 2011.
19
pretendemos analisar a normalidade de diversas variáveis, deverá ser utilizado sempre o mesmo procedimento, mesmo quando o tamanho amostral esteja perto de 50 ou 100 indivíduos e haja valores omissos para algumas das variáveis. Distribuição
de frequências e valores por percentis
A apresentação de dados conforme a frequência em que existem em uma dada população é uma maneira
18/05/2021 17:54:39
82 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
também de descrever os achados de um trabalho científico. Esta é uma estratégia bastante utilizada em trabalhos observacionais tanto de incidência quanto de prevalência, pois melhora a visualização dos mesmos, especialmente quando se tem mais de 20 observações. A frequência absoluta consiste, basicamente, no número de vezes em que há ocorrência de um determinado valor correspondente a uma variável quantitativa ou de casos de uma variável qualitativa em um dado conjunto de dados. No caso da frequência relativa, os dados são apresentados em valores percentuais relativos ao número total de ocorrências verificado na fre quência absoluta. Quando a frequência é utilizada para descrever uma amostra, geralmente é apresentada no capítulo inicial de uma dissertação ou tese no momento em que se caracteriza a população estudada. No entanto, pode também ser utilizada em estudos populacionais de incidência e prevalência, como resultado da investigação. Ao pensar em incidência e prevalência, logo se faz uma associação com casos de doenças; no entanto, na área de Nutrição, além da incidência de doenças ligadas à alimentação, como obesidade e anemias carenciais, por exemplo, outras possibilidades têm sido exploradas, como é o caso da frequência no consumo de alimentos. Suponhamos que o pesquisador deseja observar o comportamento alimentar de meninos e meninas entre 5 a 10 anos de idade e entre préadolescentes de 10 a 14 anos de idade integrados a um dado Programa de Alimentação Escolar. Um dos focos consiste em verificar a frequência no consumo de alimentos ultraprocessados fora do ambiente escolar e estabelecer três categorias de consumo: regularmente, irregularmente e raramente. A identificação
TABELA 4.7
da frequência dividida entre meninos e meninas nos dois grupos de faixa etária e por categoria de fre quência pode então ser apresentada, como ilustrado na Tabela 4.7. Para dados que foram coletados com base em uma contagem de ocorrências para cada categoria apresentada, como o exemplo anterior, a apresentação da distribuição de frequências é uma forma razoável de exibir os dados. Já para dados quantitativos contínuos), caso não haja muitos casos coincidentes, como na questão do peso, por exemplo, a apresentação dos dados na forma de frequências não facilita sua observação. Neste caso, a estratégia mais adequada é a apresentação dos dados em percentis em que a ocorrência ocorre com base em pontos de corte. Para ilustrar o exposto, um exemplo relacionado com pacientes internados será utilizado (Figura 4.7), supondo-se que o pesquisador queira explorar os dados de número de dias de permanência na unidade de terapia intensiva (UTI) (variável quantitativa) e ocorrência de óbitos (variável qualitativa dicótoma). Como se pode observar na Figura 4.8, a escolha das variáveis a serem analisadas segue o mesmo padrão das caixas de diálogo do SPSS para qualquer análise. Via de regra, basta transferir as variáveis de interesse, com o auxílio da seta, para o espaço destinado às mesmas. Observe que, por padrão do programa, nesta caixa inicial já está marcado “Exibir tabelas de frequência”. Ao escolher, Estatísticas..., a janela que permite escolher o tipo de frequências fica então disponível. Nesta janela, há três opções para os percentis: 1. Divisão dos valores em quartis: o programa apresentaria o valor para os percentis 25, 50 e 75.
Exemplo de distribuição de frequências relativas (%) e absolutas (n) para consumo de alimentos (variável categorizada) entre meninos e meninas em duas faixas de idade Frequência no consumo de alimentos ultraprocessados fora do ambiente escolar 5 a 9,9 anos de idade
Meninos (n = 518/728) Meninas (n = 648/634)
10 a 14 anos de idade
Regularmente
Irregularmente
Raramente
Regularmente
Irregularmente
Raramente
%
51,7
31,7
16,6
55,4
40,4
4,2
n
268
164
86
403
294
31
%
54,2
33,3
12,7
31,7
21,3
47
n
351
215
82
201
135
298
Fonte: elaborada pelos autores.
04-Bioestatistica.indd 82
18/05/2021 17:54:39
5 Medidas de Associação com Variável Dependente Nominal Medidas de Associação | Teste Exato de Fisher e Teste do Qui-Quadrado para a Independência, e Regressão Logística em Estudos Observacionais Analíticos Coorte (de Incidência) e Transversais (de Prevalência) Como já mencionado anteriormente nos estudos observacionais, o pesquisador pode analisar o comportamento de uma população, seja ao longo do tempo (estudo coorte ou de incidência) ou em um dado momento no tempo (estudo transversal ou de prevalência). Nos dois casos, quando o pesquisador deseja encontrar explicações para eventos cuja incidência ou prevalência é observada na população, o desenho passa a ser analítico. Em geral, a análise feita envolve relações de causa-efeito, ou seja, buscam-se as causas dos eventos observados ou o risco que um determinado comportamento representa como potencial causador do problema observado. Podem-se citar como estudos longitudinais de incidência (coorte), estudos populacionais de grande porte como o Nurses’ Health Study (NHS), com mais de 40 anos de seguimento, e o Framingham Heart Study (FHS), que completou 70 anos em setembro de 2018.1,2 Estudos longitudinais de incidência (coorte) e de prevalência (transversais) são muito comuns na área de Nutrição, especialmente no levantamento de hábitos alimentares que possam evitar a incidência de doenças prevalentes na população mundial na atualidade, tais como obesidade, diabetes, doenças cardiovasculares, câncer, entre outras crônicas não transmissíveis. Nos grandes estudos citados, NHS e FHS, os hábitos alimentares e o uso de suplementos estão entre os fatores de risco ou de proteção estudados. Os estudos de prevalência (transversais) são mais comuns entre a comunidade acadêmica, considerando
05-Bioestatistica.indd 87
que o período de permanência do estudante em formação é relativamente curto, bem como o fato de os estudos transversais apresentarem menor investimento financeiro e de recursos materiais e humanos. Da mesma forma que nos estudos de incidência, nos estudos de prevalência há tentativas de explicar fatos e associar causa e efeito, devendo ser considerada a possibilidade de ocorrer causalidade inversa (ver Capítulo 1). Importante destacar que, nos estudos de prevalência, é muito comum que a abordagem de causa e efeito esteja relacionada a variáveis do tipo desfecho substituto (surrogate), ou seja, o efeito do fator causal é estudado por meio de variáveis que não caracterizam o desfecho em si, mas um desfecho intermediário ou substituto.3 Um exemplo seria estudar os efeitos da dieta sobre a microbiota fecal, na tentativa de estabelecer uma relação de causa-efeito entre dieta e câncer (cancro). Nesse tipo de estudo, é frequente explorar, por exemplo, a presença de ácidos graxos (gordos) de cadeia curta no material fecal, especialmente o butirato, uma vez que este tem sido associado à prevenção de câncer de cólon.4,5 No entanto, o estudo avalia o impacto da dieta sobre a produção desses ácidos graxos e não sobre a incidência de câncer propriamente dita (Figura 5.1). Do ponto de vista da estatística, obviamente, há diversas formas de se abordar as variáveis de estudos observacionais analíticos. Para uma abordagem didática e seguindo-se a apresentação de diversas análises estatísticas em uma sequência lógica de introdução aos modelos mais comuns, aqui serão abordadas as medidas de associação que buscam relação de causa- efeito. Tais medidas são constituídas, basicamente, de correlações ao investigar a relação entre duas variáveis qualitativas ou quantitativas. Quando se pretende estudar a relação simultânea entre diversas variáveis independentes sobre a variável de interesse (desfecho), usam-se regressões.6
18/05/2021 18:06:17
88 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
Fator causal
Desfecho substituto
Butirato fecal
Dieta
Lipoproteínas circulantes
Expressão de mTOR
Desfecho
Câncer de cólon
Infarto do miocárdio
Hipertrofia muscular
FIGURA 5.1 Diagrama demonstrativo de estudos transver-
sais em que se estuda a relação de uma variável causal sobre um provável desfecho, por meio de um desfecho substituto. Tanto o butirato quanto o perfil lipídico e a expressão do mTOR não são, de fato, os desfechos que se pretende relacionar com a dieta, e sim desfechos intermediários que são indicadores dos desfechos de fato Fonte: elaborada pelos autores.
Testes Estatísticos com Medidas de Associação | Modelos Comentados Teste
exato de Fisher e teste do qui-quadrado (Σ2) para a independência
Em geral, na área de Nutrição, busca-se com esses testes avaliar a distribuição de frequências de um determinado desfecho de acordo com grupos de risco. Os testes podem ser utilizados, por exemplo, para avaliar a amamentação como fator de risco (aleitamento materno exclusivo até seis meses de idade: sim ou não) sobre a incidência de doença inflamatória intestinal na vida adulta (diagnóstico da doença: sim ou não). A pergunta de investigação poderia ser formulada da seguinte maneira: a frequência de indivíduos com doença inflamatória intestinal calculada no conjunto de indivíduos que tiveram aleitamento materno exclusivo até 6 meses de idade é diferente da frequência de indivíduos com doença inflamatória intestinal calculada no conjunto de indivíduos que não tiveram aleitamento materno exclusivo até 6 meses de idade? Em estudos longitudinais clínicos, mais curtos em termos de seguimento, pode-se, por exemplo, verificar como fator de risco o déficit de ingestão energética superior a 10.000kcal em 15 dias de internamento na unidade de terapia intensiva (UTI) (acima de
05-Bioestatistica.indd 88
10.000kcal: sim e não) sobre a incidência de mortalidade (sim ou não). No caso de um estudo de prevalência, pode-se observar o impacto da frequência do consumo de frutas entre crianças sobre a prevalência de obesidade de forma transversal, ou seja, naquele momento do estudo, ou, ainda, quanto à distribuição de frequências de obesidade e eutrofia entre meninos e meninas em uma dada escola. Tratando-se de dados qualitativos, o número de participantes do estudo necessita ser relativamente elevado quando comparado a estudos clínicos experimentais em que se utilizam, mais frequentemente, as variáveis quantitativas. Assim, na área de Nutrição, o teste de Fisher e o teste do qui-quadrado têm sido aplicados em grandes estudos populacionais relacionando a incidência de doenças crônicas não transmissíveis a fatores de risco ou de proteção ligados à alimentação (consumo de gorduras saturadas, de carnes vermelhas, de antioxidantes) e em estudos de prevalência em escolares relacionando hábitos alimentares e desfechos relativos ao estado nutricional. Em estudos experimentais, o seu uso é menos frequente; em algumas situações, no entanto, pode ser útil para testar o impacto de uma intervenção sobre um desfecho clínico. O teste de Fisher pode ser calculado para avaliar a independência entre duas variáveis de forma exata para tabelas 2 × 2 e pode-se obter um valor assimptótico para tabelas de qualquer dimensão, podendo estes cálculos serem mais demorados. O teste do qui-quadrado é uma boa aproximação à avaliação da independência quando a amostra é suficientemente grande, devendo a contagem esperada em cada célula (ou seja, em cada combinação de casos) ser superior a 5. Nesse caso, o que ocorre é que, algumas vezes, o tamanho da amostra é muito pequeno ou o número de categorias é demasiadamente grande, resultando em baixa frequência de casos entre as categorias. Em tal situação, poderá ser útil o agrupamento de alguns casos em uma mesma categoria. Para uma revisão sobre o agrupamento de variáveis, pode-se consultar o Capítulo 2. Caso o agrupamento venha a comprometer os objetivos do pesquisador, o teste de Fisher é mais viável. Assim, pode-se adotar como critério para escolha de um dos testes: amostras pequenas com frequência absoluta de desfechos esperados menor do que 5 em mais de 20% das células = exato de Fisher; amostras maiores, caso as contagens atendam ao pressuposto
18/05/2021 18:06:17
6 Medidas de Associação com Variável Dependente Quantitativa Medidas de Associação | Correlação e Regressão Linear em Estudos Observacionais Analíticos Coorte (de Incidência) e Transversais (de Prevalência) No Capítulo 5 foram apresentadas medidas de associação em que as variáveis dependentes eram qualitativas, sendo que as variáveis independentes poderiam ser qualitativas (qui-quadrado) ou quantitativas e qualitativas (regressão logística). Nesses casos, quando se trata de um desenho do tipo coorte em que o tempo de seguimento é longo e é possível aguardar pelo desfecho que caracteriza uma condição clínica colocada como doente ou não doente, melhora ou piora, ou, ainda, morte (sim ou não) ou infarto agudo do miocárdio (IAM) (sim ou não), por exemplo, fica claro que a regressão logística e o qui-quadrado ou teste exato de Fisher serão os métodos estatísticos a escolher. No caso do IAM, por exemplo, pode-se associar o consumo semanal de gorduras saturadas (em % da energia diária consumida) com esse desfecho binário por meio da regressão logística. Entretanto, em um estudo clínico, mesmo que longitudinal, em que não é possível aguardar o tempo suficiente para um desfecho definitivo como IAM (sim ou não), pode-se utilizar um desfecho intermediário quantitativo (para mais exemplos de desfechos intermediários, ver Capítulo 5, Figura 5.1) que, neste caso, poderão ser os níveis séricos de colesterol em mg/dL. Assim, em alguns casos, o pesquisador pode precisar estabelecer associações entre variáveis exclusivamente quantitativas. Nesse contexto em que a associação entre duas medidas quantitativas é proposta, a correlação ou regressão linear simples1 é aplicável (consumo de gordura saturada em % de energia diária consumida versus níveis séricos de colesterol em mg/dL). Ao incluir no modelo mais de uma variável
06-Bioestatistica.indd 109
independente, mantendo-se o caráter exclusivamente quantitativo, a regressão linear múltipla2,3 é aplicável, por exemplo, na avaliação da associação do consumo semanal de gordura saturada e idade (em anos) versus níveis séricos de colesterol. Com base nessas condições, os modelos de correlação e de regressão linear com a interpretação de algumas análises básicas4-6 serão apresentados neste capítulo. Existe também a possibilidade da aplicação de modelos mistos (mixed models); no entanto, não é o foco da presente obra tratar de tais modelos. A base dos dois modelos que serão aqui explorados é verificar se as unidades de uma variável variam na mesma direção que outra ou em direção oposta. Uma correlação positiva significa que valores mais elevados em uma variável estão associados a valores, em média, mais elevados na outra; enquanto em uma correlação negativa valores mais altos de uma variável estão associados a valores, em média, mais baixos da outra. Uma correlação (muito próxima) de zero indica que valores diferentes de uma das variáveis estarão associados, em média, ao mesmo valor da outra variável. Para visualização dessas duas situações, a Figura 6.1 traz o gráfico de correlação entre consumo de gordura saturada (% da energia diária consumida) e níveis de LDL-colesterol (mg/dL), que apresentaram uma correlação positiva, bem como o gráfico de correlação entre consumo de fibras dietéticas (g/dia) e níveis de colesterol, que apresentaram uma correlação negativa.
Testes Estatísticos com Medidas de Associação | Modelos Comentados Correlação
de Pearson (R) e Spearman ()
O modelo mais simples de associação entre variáveis quantitativas ou qualitativas ordinais é o da correlação
18/05/2021 18:14:42
110 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Associação entre ingestão de gorduras saturadas de LDL-colesterol sérico 300 275 250 225 200 175 150 125 100 75 50 25 0 5
15
25
35
Gorduras saturadas ingeridas (% da energia total diária)
Associação entre ingestão de fibras dietéticas e LDL-colesterol sérico
B HDL-colesterol sérico (µg/mL)
HDL-colesterol sérico (µg/mL)
A
180 160 140 120 100 80 60 40 20 0 8
13
18
23
28
33
Fibras dietéticas ingeridas (g/dia)
FIGURA 6.1 (A e B) Representação gráfica de correlação positiva entre ingestão de gorduras saturadas e LDL-colesterol sérico (A) e negativa entre ingestão de fibras dietéticas e LDL-colesterol sérico (B). Observa-se que, no exemplo (A) as medidas crescem na mesma direção e, no exemplo (B) em direções opostas. A análise da correlação não propõe relação de dependência; no entanto, convencionou-se o uso do modelo adotado em regressão linear em que a suposta variável dependente estaria no eixo Y e a independente estaria no eixo X. Os valores são hipotéticos e escolhidos para tornar clara a relação entre as variáveis; contudo, em dados de consumo e de controle metabólico como neste exemplo, as associações tendem a ser menos lineares Fonte: elaborada pelos autores.
que avalia se há uma relação linear entre duas variáveis. Na área de Nutrição, é comumente aplicado nas seguintes situações: Na associação entre duas variáveis em que se busca uma relação de dependência linear entre elas, podendo ser ou não uma etapa prévia à análise de regressão linear. Em estudos de validação, como um dos passos para verificar se um equipamento em teste consegue mostrar que a variável por ele detectada segue o mesmo padrão de um equipamento já validado. Em testes de concordância entre ou intra-avaliadores, como uma etapa que antecede outros cálculos. Observe que, no caso da verificação de dependência entre duas variáveis, a correlação pode ser utilizada como uma etapa inicial de estudos que pretendem estabelecer relação de causa-efeito; no entanto, não é possível chegar a tal conclusão somente com essa medida de associação. Da mesma forma, no caso de validação ou de concordância, a correlação também é utilizada como etapa preliminar e outros testes deverão ser aplicados (ver Capítulo 10). No primeiro caso, é possível observar uma correlação positiva ou negativa no caso de existir dependência entre as variáveis em estudo, enquanto nos estudos de validação ou de concordância a correlação deverá ser positiva e elevada.
06-Bioestatistica.indd 110
Quanto ao comportamento das variáveis quantitativas ou qualitativas ordinais a serem analisadas nos estudos de correlação, quando ambas as variáveis são quantitativas e apresentam distribuição normal, utiliza-se a associação de Pearson (R) e, nos outros casos, a correlação de Spearman (ρ)2.7 Para exemplificar uma situação em que a correlação seria útil, imaginemos uma situação que seria uma alternativa para complementar o exemplo utilizado no Capítulo 5 para o qui-quadrado em que se buscou resposta para a seguinte pergunta científica: a frequência de obesos entre meninos é diferente de obesos entre meninas que estudam em escolas públicas da cidade x? Como o resultado do qui-quadrado indicou que há risco maior de obesidade entre as meninas, o pesquisador poderia explorar esse achado, perguntando, por exemplo: há associação entre o índice de massa corporal (IMC) (kg/m2) das meninas e o consumo semanal de carboidratos simples (g/kg de peso)? Neste caso, dado que são duas variáveis quantitativas, a correlação seria aplicada. Após a verificação do comportamento das variáveis, se ambas apresentassem distribuição normal, a correlação de Pearson seria aplicada. Por exemplo, ao estudar a associação entre o IMC e o bem-estar de cada pessoa com relação à sua imagem corporal (em uma escala ordinal entre 0 e 10), poderia ser observado que as pessoas com pior
18/05/2021 18:14:43
Medidas de Associação com Variável Dependente Quantitativa 125
FIGURA 6.14 Etapas para ordenar casos da coluna das distâncias de Mahalanobis em ordem crescente Fonte: planilha do SPSS®.
TABELA 6.10
Valores da distribuição do qui-quadrado
P GL
0,995
0,975
0,20
0,10
0,05
0,025
0,02
0,01
0,005
0,002
0,001
1
0,0000393
0,000982
1,642
2,706
3,841
5,024
5,412
6,635
7,879
9,550
10,828
2
0,0100
0,0506
3,219
4,605
5,991
7,378
7,824
9,210
10,597
12,429
13,816
3
0,0717
0,216
4,642
6,251
7,815
9,348
9,837
11,345
12,838
14,796
16,266
4
0,207
0,484
5,989
7,779
9,488
11,143
11,668
13,277
14,860
16,924
18,467
5
0,412
0,831
7,289
9,236
11,070
12,833
13,388
15,086
16,750
18,907
20,515
6
0,676
1,237
8,558
10,645
12,592
14,449
15,033
16,812
18,548
20,791
22,458
7
0,989
1,690
9,803
12,017
14,067
16,013
16,622
18,475
20,278
22,601
24,322
8
1,344
2,180
11,030
13,362
15,507
17,535
18,168
20,090
21,955
24,352
26,124
9
1,735
2,700
12,242
14,684
16,919
19,023
19,679
21,666
23,589
26,056
27,877
10
2,156
3,247
13,442
15,987
18,307
20,483
21,161
23,209
25,188
27,722
29,588
11
2,603
3,816
14,631
17,275
19,675
21,920
22,618
24,725
26,757
29,354
31,264
12
3,074
4,404
15,812
18,549
21,026
23,337
24,054
26,217
28,300
30,957
32,909
13
3,565
5,009
16,985
19,812
22,362
24,736
25,472
27,688
29,819
32,535
34,528
14
4,075
5,629
18,151
21,064
23,685
26,119
26,873
29,141
31,319
34,091
36,123
15
4,601
6,262
19,311
22,307
24,996
27,488
28,259
30,578
32,801
35,628
37,697
GL: graus de liberdade. Fonte: disponível em https://www.ime.unicamp.br/~hlachos/TabelaQuiQuadrado.pdf.
pontos de interrogação. Transfere-se então a variável que recebeu o nome de Mahalanobis distance para o espaço e, em seguida, substitui-se o segundo ponto de interrogação pelo número 3, que corresponde aos graus de liberdade (três variáveis independentes). Ao pressionar OK, surge uma nova coluna com os valores de p para cada observação. São considerados valores discrepantes aqueles que tiverem p<0,001. A maior distância de Mahalanobis deste exemplo apresentou
06-Bioestatistica.indd 125
um valor de p = 0,07 e, portanto, não se trata de um valor discrepante. Também é possível observar as distâncias de Cooks30 que deveriam ser, preferencialmente, menores que 1. Alguns poucos valores acima das distâncias de Mahalanobis e Cooks não seriam problemáticos em um banco de dados de uma amostra grande; no entanto, muitos valores acima das distâncias máximas esperadas deveriam ser observados com mais
18/05/2021 18:14:48
126 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
4 1
3
2
A
6
5 7 B
C
FIGURA 6.15 (A a C) Cálculo do valor de p para as distâncias de Mahalanobis considerando a partição do qui-quadrado para três graus de liberdade. Valores inferiores a 0,001 são considerados discrepantes e devem ser excluídos da análise um a um. A cada exclusão, as distâncias devem ser novamente calculadas para identificação de valores discrepantes, pois se trata de uma análise multivariada Fonte: planilha do SPSS® editada pelos autores.
06-Bioestatistica.indd 126
18/05/2021 18:14:49
8 Estudos Experimentais com Comparação entre Três ou Mais Grupos Independentes Comparação de Médias e Ordenações (Rankings) em Estudos Experimentais com Três ou Mais Grupos Independentes Para este tópico, serão abordados modelos relacionados com comparação de dois ou mais grupos experimentais, embora os testes a serem apresentados não sejam exclusivos para esse tipo de desenho científico. Quando houver a necessidade de comparar mais de dois grupos em um estudo experimental, a análise da variância (ANOVA) é preferível em relação ao teste t de Student, por exemplo.1,2 A estatística de F ou razão F é usada na ANOVA. Embora possa também ser usada no teste t, há algumas diferenças importantes entre os dois testes. Primeiro: com ANOVA, pode-se comparar mais de dois grupos com um poder estatístico maior. Segundo: covariáveis podem ser incluídas no modelo, o que permite controlar confundidores e detectar interações quando uma variável modera o efeito de outra variável.3 Há de se compreender a variância intragrupos e entre grupos para perceber a vantagem do uso da ANOVA em relação ao teste t, bem como entender os resultados obtidos ao aplicar este teste. Assim como no caso do teste t, a realização dos testes paramétricos para comparação de mais de dois grupos exige homogeneidade da variância dentro de cada grupo (intragrupos), ou seja, os dados dos indivíduos pertencentes a um mesmo grupo devem estar distribuídos homogeneamente em torno de suas médias. Assim, quanto mais homogêneos os grupos a serem comparados, menor a probabilidade de assumir que há diferença entre eles ao acaso. Compreendendo-se a importância da homogeneidade intragrupos, que pode ser avaliada com testes de normalidade, no caso da ANOVA, pretende-se avaliar se as médias de cada grupo (tratamento) se
08-Bioestatistica.indd 149
encontram próximas à média do total de indivíduos estudados (médias dos valores de todos os indivíduos dos três ou mais grupos). Esta é a variação entre grupos. Um aspecto importante da análise da variância é que se trata de um teste F em que há um ajuste entre a variância intragrupos e entre grupos para identificar se os grupos pertencem ou não a uma mesma população. A razão da variância entre grupos em relação à variância intragrupos é calculada (F). Quanto maior for o valor de F, maior a probabilidade de os grupos estudados não pertencerem à mesma população, ou seja, serem diferentes.1,3 Observe na Figura 8.1: a variância de três grupos pode ser visualizada nas linhas cheias, e a variância total dos grupos, ou seja, a média de todos os valores (grupo 1 + grupo 2 + grupo 3) pode ser visualizada na linha pontilhada. Embora a amplitude do grupo 3 em relação ao grupo 1 seja maior, as médias desses dois grupos encontram-se no intervalo de confiança do gráfico (variância total), indicando que pertencem à mesma população. Já no caso do grupo 2, a média encontra-se afastada do intervalo de confiança da população. Assim, assume-se que há diferença entre os grupos. Para observar mais figuras conceituais em relação à ANOVA, consultar Kim (2004)1 e Kim (2017).4 É fundamental compreender que quanto maior a variação intragrupos, menor a possibilidade de identificar diferenças entre os grupos, visto que a variância entre grupos será dividida pela variância intragrupos. Trata-se de uma forma de evitar que a diferença entre grupos ocorra ao acaso, dadas as variações entre indivíduos pertencentes a um mesmo grupo. Diferentemente do teste t, no caso da ANOVA, há necessidade de realização de testes a posteriori (post hoc) para identificar as diferenças entre grupos par a par. O teste de Bonferroni (mais conservador) e o teste de Tukey são comumente utilizados. No caso
18/05/2021 18:36:15
150 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
2
1
Variância total 3
FIGURA 8.1 Desenho esquemático simplificado do contexto da análise da variância. Comparação de três grupos (linhas cheias) com base na variância total dos grupos que representa toda a população (linha pontilhada). As setas indicam a posição das médias. Os grupos 1 e 3 parecem pertencer à mesma população, visto que as médias se encontram dentro do intervalo de confiança da população. O grupo 2 parece não pertencer à mesma população. Um teste adicional (post hoc) é necessário para identificar as diferenças para o par (entre 1 e 2; 1 e 3; 2 e 3) Fonte: elaborada pelos os autores.
da análise Bonferroni, há um ajuste do erro do tipo I (valor de p) com base no número de comparações a serem realizadas (número de pares a serem comparados). No caso do teste de Tukey, calcula-se a diferença mínima significativa entre as médias (variáveis dependentes) de cada comparação entre grupos para considerá-los diferentes entre si.5 Tomando, em conjunto, o exposto, observam-se três pressupostos básicos para a ANOVA:3 A variável de desfecho (dependente) deveria apresentar distribuição normal, embora o teste F seja robusto a violações desta natureza, ou seja, o erro do tipo I parece não ser gravemente afetado por populações mais desviadas da média. A variância em cada grupo deve ser a mesma (homogeneidade da variância), o que pode ser avaliada pelo teste de Levine. As observações devem ser independentes, ou seja, não podem estar correlacionadas entre elas. Destaca-se que, embora em alguns casos recorra- se ao uso do teste t de Student para comparação de três grupos realizando comparações de médias par a par, por exemplo, média do grupo 1 e média do grupo 2; média do grupo 2 e média do grupo 3; média do grupo 1 e média do grupo 3, esta não é uma alternativa adequada, uma vez que não há percepção da variância neste caso, aumentando-se, assim, o risco de erro tipo I. Dessa forma, corre-se o risco de rejeitar
08-Bioestatistica.indd 150
H0 quando, na verdade, dois ou mais grupos podem pertencer à mesma população (para revisão dos erros do tipo I e II, ver Capítulo 2, item: Erros que o pesquisador assume ao responder à pergunta científica utilizando-se da estatística).
Testes Estatísticos para Comparação de Médias e Ordenações com Três ou Mais Grupos Independentes: Modelos Comentados Análise
da variância (ANOVA, paramétrico)
Ao colocar esta breve explanação dos conceitos envolvendo a variância em um contexto de estudos experimentais, quando os grupos a serem comparados (variável independente) e o desfecho (variável dependente) referem-se a um único fator, utiliza-se a ANOVA unidirecional. Para contextualizar o modelo da ANOVA unidirecional, observe o exemplo a seguir. Sabe-se que a digestibilidade das proteínas do soro de leite de vaca é baixa, dado o alto teor da proteína betalactoglobulina, cuja estrutura globular limita o acesso das enzimas digestivas humanas à sequência de aminoácidos a serem clivados durante a digestão. Suponhamos que um pesquisador proponha dois tipos de tratamentos que afrouxem essa estrutura globular, permitindo, assim, que esta esteja mais disponível para que a digestão ocorra. Neste caso, a pergunta científica seria: o uso de tratamento X1 e X2 para mudar a conformação das proteínas do soro do leite aumenta a eficácia da digestão enzimática realizada por 30min? Neste caso, serão três grupos a comparar: a proteína nativa (controle), a proteína submetida ao tratamento X1 e a proteína submetida ao tratamento X2. Esse tipo de experimento é realizado in vitro, ou seja, a digestão é mimetizada em tubos de ensaio em que se adiciona a proteína em uma dada diluição e juntam-se as enzimas digestivas adquiridas em laboratórios especializados. A avaliação da digestibilidade das proteínas é verificada pela dosagem de proteínas na solução após 30min de tratamento. Este é o caso da digestão por pepsina que visa mimetizar a digestão no estômago. Nesse exemplo, as proteínas
18/05/2021 18:36:15
9 Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas Comparação de Médias e Ordenações (Rankings) em Estudos Experimentais com Dois Grupos ou Mais Pareados Diferentemente da análise da variância (ANOVA) para grupos independentes, quando a comparação é feita entre diferentes grupos ao longo do tempo, a análise se torna mais complexa, pois, além de comparar os grupo entre eles (avaliação entre grupos), espera-se comparar cada grupo separadamente ao longo do tempo (avaliação intragrupos), bem como a interação tempo*grupos, ou seja, comparação dos grupos entre si em cada um dos tempos avaliados.1,2 Como complemento da Figura 8.1, no Capítulo 8, que demonstra a ANOVA, pode-se sugerir o desenho da Figura 9.1, a fim de apresentar de maneira simplificada a ANOVA com medidas repetidas (distribuição normal). A partir das perguntas científicas a seguir, pode-se imaginar dois exemplos: A utilização de tratamentos químicos 1, 2, 3 e 4, a fim de mudar a conformação das proteínas do soro do leite, aumenta a eficácia da digestão enzimática ao longo de 1h30m? Neste caso, o experimento será realizado em duas etapas: primeiro, a solução de proteínas será submetida ao tratamento enzimático com pepsina por 30min, seguida do tratamento com tripsina por adicionais 60min. Durante a digestão, amostras do soro de leite serão coletadas a cada 15min para análise do conteúdo de proteína remanescente em uma bateria de 16 tubos de ensaio (quadruplicatas de cada um dos quatro tratamentos). Assim, será possível construir uma cinética da digestão com sete dosagens de proteína (0, 15, 30, 45, 60, 75 e 90min) fruto da média de quatro repetições para cada medida.
09-Bioestatistica.indd 167
No caso desta pergunta, não há preocupação com confundidores, e sim com as condições do experimento, ou seja, procedência dos reagentes, acurácia dos equipamentos e habilidades técnicas de quem realiza o experimento. O tratamento dietético, aliado ou não a medicamento (tratamentos 1, 2 e 3), melhora níveis de glutamina sanguínea, ao longo de 3 meses, em crianças de 12 a 18 anos de idade com diarreia crônica? Neste caso, os adolescentes seriam selecionados de uma clínica localizada em um hospital escola. Como as variáveis confundidoras são uma preocupação em estudos com humanos, randomização e critérios de exclusão que permitam melhorar a homogeneidade do grupo são importantes. Assim, o quadro clínico dos adolescentes e o estado nutricional deverá ser similar, por exemplo. A dosagem será realizada mensalmente (tempos 1, 2 e 3). Importante destacar que, no exemplo do estudo das proteínas do soro de leite para comparação de três grupos independentes, foi possível sugerir os atalhos para ANOVA unidirecional ou modelo geral linear (GLM; do inglês, general linear model) (Figuras 8.4 e 8.7, Capítulo 8). Já no caso das medidas repetidas (dados pareados), o GLM é a única opção, pois traz as derivações mais complexas da ANOVA.3,4 Nesta publicação, os exercícios demonstrados no SPSS® dizem respeito a alguns modelos de ANOVA; no entanto, é importante a compreensão dos outros modelos que devem ser utilizados em análises mais complexas, especialmente naquelas em que há presença de covariáveis confundidoras, comum em estudos não randomizados realizados em humanos em que se esperam variações entre grupos ou pouca homogeneidade entre grupos a serem comparados. Brevemente, é possível citar: ANCOVA (análise de covariância) em que outras variáveis, além da variável independente principal (também chamada de fator),
18/05/2021 19:05:09
168 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
Tempo 2 Variância total Tempo (grupo 1) 1 Tempo 3
Tempo 2 Variância total Tempo (grupo 2) 1 Tempo 3
Tempo 2 Variância total Tempo (grupo 3) 1 Tempo 3 A. Para cada análise intragrupo, análises a posteriori serão realizadas para identificar as diferenças de cada grupo entre os tempos, a saber: tempo 1 e 2, tempo 1 e 3 e tempo 2 e 3
Grupo 2 Variância total Grupo (tempo 1) 1 Grupo 3
Grupo 2 Variância total Grupo (tempo 2) 1 Grupo 3
Grupo 2 Variância total Grupo (tempo 3) 1 Grupo 3
B. Da mesma forma que na avaliação dos tempos para os diversos grupos, na avaliação dos diversos grupos para cada tempo, análises a posteriori são necessárias para identificar em cada tempo a diferença entre grupos 1 e 2, grupos 2 e 3 e grupos 1 e 3
FIGURA 9.1 Desenho esquemático simplificado do contexto da análise da variância para medidas repetidas. Comparação
de três grupos e três tempos (linhas cheias) com base na variância total dos grupos nos tempos e grupos (linhas pontilhadas). As setas indicam a posição das médias Fonte: elaborada pelos autores.
09-Bioestatistica.indd 168
18/05/2021 19:05:09
Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas 191
Dados
Arquivo dividido
Analisar todos os casos: não criar grupos
Analisar
Teste não paramétrico
Caixas de diálogo legadas
2 amostras independentes
1 4
2
5
3 6 7
FIGURA 9.19 Etapas para solicitação do teste de Mann-Whitney a ser utilizado como teste a posteriori de Fisher para comparação entre grupos. O resultado será a comparação de cada grupo nos diferentes tempos, sem considerar a com paração intragrupos. Grupos refere-se ao nome que foi dado pelo pesquisador à coluna que identifica os grupos de tra tamento (p. ex., 1 = fórmula 1; 2 = fórmula 2; 3 = fórmula 3). É necessário identificar os grupos em três etapas e, sempre que a opção for modificada, deve-se realizar a análise e voltar à etapa da definição dos grupos para substituir os pares. Por exemplo: grupos 1 e 2; 2 e 3 e 1 e 3 Fonte: planilha do SPSS® editada pelos autores.
TABELA 9.12
Resultado do teste de Wilcoxon Teste de classificações assinadas por Wilcoxon
Grupos = Fórmula 1 Estatísticas de testea,b
Risco_mortal_2 Risco_mortal_1
Risco_mortal_3 Risco_mortal_1
Risco_mortal_3 Risco_mortal_2
Z
– ,795c
–1,136c
– ,475c
Significância Sig. (bilateral)
,426
,256
,635
GRUPOS = Fórmula 1 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos a
b
(continua)
09-Bioestatistica.indd 191
18/05/2021 19:05:19
192 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
TABELA 9.12
Resultado do teste de Wilcoxon (continuação)
Grupos = Fórmula 2 Estatísticas de testea,b
Risco_mortal_2 Risco_mortal_1
Risco_mortal_3 Risco_mortal_1
Risco_mortal_3 Risco_mortal_2
Z
– ,562c
–2,975d
–3,225d
Significância Sig. (bilateral)
,574
,003
,001
Risco_mortal_2 Risco_mortal_1
Risco_mortal_3 Risco_mortal_1
Risco_mortal_3 Risco_mortal_2
Z
– ,036c
–3,292c
–3,348c
Significância Sig. (bilateral)
,972
,001
,001
GRUPOS = Fórmula 2 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos d Com base em postos positivos a
b
Grupos = Fórmula 3 Estatísticas de testea,b
GRUPOS = Fórmula 3 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos a
b
Há mudanças no risco de mortalidade, a partir da segunda avaliação (tempo 2) para os grupos submetidos ao tratamento 2 (fórmula enteral 2) e 3 (fórmula enteral 3). Fonte: resultados do SPSS®.
TABELA 9.13
Resultado do Teste de Mann-Whitney Testes de NPar Teste de Mann-Whitney
Grupos 1 e 2 Estatísticas de teste
U de Mann-Whitney
Risco_mortal_1
Risco_mortal_2
Risco_mortal_3
232,000
230,000
140,000
Wilcoxon W
508,000
506,000
393,000
Z
– ,478
– ,523
–2,577
Significância Sig. (bilateral)
,633
,601
,010
Risco_mortal_1
Risco_mortal_2
Risco_mortal_3
Grupos 2 e 3 Estatísticas de teste
U de Mann-Whitney
174,500
199,000
47,000
Wilcoxon W
427,500
452,000
300,000
Z
–1,787
–1,230
–4,692
Significância Sig. (bilateral)
,074
,219
,000 (continua)
09-Bioestatistica.indd 192
18/05/2021 19:05:19
10 Estudos Diagnósticos e Prognósticos
Introdução Os desenhos científicos relacionados com modelos diagnósticos e prognósticos são geralmente discutidos em tópicos separados dos desenhos clássicos epidemiológicos e experimentais, uma vez que, na área de saúde, são mais comumente direcionados à pesquisa clínica. Neste capítulo, serão apresentados alguns exemplos de modelos diagnósticos e prognósticos, com os respectivos métodos estatísticos. Em um primeiro momento, os modelos diagnósticos e prognósticos que serão abordados referem-se a alguns casos em que se pretende identificar características de indivíduos que possam indicar se estes têm, no momento da avaliação, um determinado diagnóstico (p. ex., desnutrição) ou, ainda, se são candidatos a apresentar uma condição favorável ou não no futuro (p. ex., mortalidade por elevada perda de peso após ressecção cirúrgica). Assim, o modelo diagnóstico deve ser capaz de discriminar indivíduos em grupos de acordo com uma condição já existente, e o modelo prognóstico deve ser capaz de dividir indivíduos entre possibilidades ou risco de vir a ter um evento no futuro.1-4
Modelos Diagnósticos em Nutrição Na área de saúde, é muito comum o uso de critérios para classificar indivíduos como saudáveis ou não, ou identificá-los em uma condição mais grave ou menos grave. Para compreender este tipo de modelo, é fundamental salientar que quando um pesquisador busca uma ferramenta para avaliar enfermos, pretende identificar uma que possa indicar indivíduos que necessitem de um suporte mais especializado por já apresentarem algum desfecho desfavorável e que pode ser, por exemplo, diagnóstico de uma doença ou outra
10-Bioestatistica.indd 195
situação que possa dividir um grupo de acordo com duas possibilidades, ou seja, presença ou ausência de uma condição favorável ou desfavorável. Neste caso, as perguntas científicas poderiam ser: O índice de massa corporal (IMC) de indivíduos acometidos por insuficiência renal crônica (IRC), quando calculado após a hemodiálise, é capaz de discriminar indivíduos entre eutróficos e obesos? O nível de transferrina plasmática é capaz de discriminar indivíduos entre desnutridos e eutróficos? A glicemia de jejum é capaz de discriminar indivíduos com e sem diabetes? Após a cirurgia bariátrica, o percentual de perda de excesso de peso (%PP) é capaz de discriminar adolescentes como: tendo ou não resolução de resistência insulínica? O número de refeições na escola é capaz de discriminar crianças carentes entre desnutridas e eutróficas? O número de frutas consumidas semanalmente é capaz de discriminar crianças entre obesas e eutróficas? Tomando-se os exemplos citados, é necessária a definição de uma variável de interesse (IMC, níveis de transferrina, glicemia de jejum, %PP, número de refeições, número de frutas consumidas) e que possa servir para distinguir os indivíduos entre tendo uma condição ou não (obesidade, desnutrição, diabetes, resistência insulínica). O pesquisador busca, então, modelos diagnósticos em que se definirá um ponto de corte nos valores de IMC, níveis de transferrina, glicemia de jejum, %PP, número de refeições na escola e número de frutas consumidas na semana, de modo a separar os indivíduos entre duas possibilidades, ou seja, entre eutróficos e obesos; desnutridos e eutróficos; diabéticos e não diabéticos; e com resistência à insulina e saudáveis, entre outros
18/05/2021 19:14:47
196 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Desnutrição
substituto
como desfecho
No caso da ciência da Nutrição, os modelos diagnósticos são comumente aplicados para discriminar indivíduos com base nos chamados surrogate outcomes, ou seja, desfechos substitutos ou intermediários.5,6 Por exemplo, no caso da identificação do ângulo de fase (AF), medido por bioimpedância elétrica, para detectar desnutrição entre pacientes graves, a desnutrição seria um diagnóstico que teria função preditora de mortalidade. Assim, neste caso, a desnutrição é um desfecho substituto, pois indica risco de mortalidade que seria o desfecho de fato (Figura 10.1). Para elaborar um modelo diagnóstico, tendo a desnutrição como desfecho, o pesquisador poderia seguir as seguintes etapas: Identificar um grupo de pacientes pertencentes a uma população homogênea quanto às suas características individuais, inclusive quanto à uma determinada condição clínica. Classificar esses indivíduos de acordo com o seu estado nutricional, por meio de uma ferramenta validada. Realizar uma nova medida de interesse, por exemplo, o AF, com os indivíduos nas mesmas condições em que foram avaliados quanto ao estado nutricional. Aplicar um método estatístico para verificar se existe a possibilidade de identificar um ponto de corte dos níveis de AF (variável quantitativa) que possa discriminar os indivíduos de acordo com o estado nutricional (variável qualitativa binária). Tomemos outro exemplo hipotético. Um pesquisador pode ter como linha de pesquisa critérios “diagnósticos em nutrição”. Em um de seus trabalhos, estabelece um ponto de corte de transferrina sérica
Ângulo de fase medido por BIA
que caracteriza indivíduos internados em uma clínica cirúrgica como desnutridos ou eutróficos. Em seguida, define outros pontos de corte em que o nível de transferrina é inferior ao primeiro ponto de corte estabelecido e cria um critério para dividir os indivíduos em desnutrido leve ou moderado, ou em moderado e grave (Tabela 10.1). Na primeira linha da tabela, o ponto de corte foi escolhido para discriminar o indivíduo como desnutrido ou não a partir de um valor de transferrina circulante (ponto de corte 225mg/dL), e na segunda e terceira linhas, seria o caso de identificar os indivíduos entre desnutrição e desnutrição moderada e entre desnutrição moderada e desnutrição grave ou não a partir de outros pontos de corte da mesma proteína. Este tipo de classificação é muito comum na área de Nutrição; no entanto, muitas vezes, nutricionistas e outros profissionais de saúde utilizam essas ferramentas sem estarem atentos à origem dos dados e às condições em que os critérios diagnósticos foram estabelecidos. É importante que sempre se refira ao artigo original em que os pontos de corte foram definidos para identificar se a população que pretende avaliar,
TABELA 10.1
Critérios de desnutrição por transferrina sérica após ressecção de íleo terminal
Ponto de corte (mg/dL)
Classificação
<225
Desnutrição
Entre 225 e 160
Desnutrição moderada
<160
Desnutrição grave
Critérios para identificação de desnutrição de acordo com os níveis de transferrina sérica dosada no 14o dia após a ressecção do íleo terminal para tratamento de linfomas em adultos entre 50 e 70 anos de idade. Dados hipotéticos. Valores de referência para indivíduos saudáveis: 200 a 400mg/dL. Fonte: elaborada pelos autores.
Desnutrição (desfecho substituto)
Morte (desfecho final)
Medidos simultaneamente
FIGURA 10.1 A desnutrição leva a alterações metabólicas, caracterizadas por alterações neuroendócrinas e imunes,
que pioram o quadro clínico e aumentam consideravelmente o risco de mortalidade. Por este motivo, é comumente utilizada como desfecho substituto de mortalidade. Neste modelo, trata-se de um diagnóstico com função prognóstica de mortalidade Fonte: elaborada pelos autores.
10-Bioestatistica.indd 196
18/05/2021 19:14:48
11 Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos Introdução Testes de concordância podem ser entendidos como aqueles que são utilizados para identificar se resultados de instrumentos de pesquisa, quantitativos ou qualitativos, quando comparados, podem ser reproduzidos, desde que tenham a mesma unidade de medida.1-3 No caso da ciência da Nutrição, estes testes podem ser úteis para verificar instrumentos utilizados para avaliação do estado nutricional (clínica, bioquímica, antropométrica), composição corporal, cálculos de demanda metabólica, instrumentos para identificar qualidade da dieta (inquéritos, índices), entre outros. Podem também ser utilizados para verificar se os resultados provenientes de um mesmo instrumento, realizado por diferentes avaliadores, coincidem, ou ainda se um mesmo avaliador pode reproduzir os seus próprios resultados utilizando-se do mesmo instrumento em diferentes momentos. O propósito dos testes de concordância é avaliar os erros que podem ocorrer nas medidas mencionadas, seja por problemas/limitações nos instrumentos de avaliação ou relacionados com a habilidade dos avaliadores em aplicar o instrumento. Tais erros são conhecidos como erros sistemáticos,4 e podem levar a equívocos na conclusão do trabalho por não corresponderem à realidade. Também podem ser utilizados para comparar métodos que avaliam um mesmo desfecho para validação de novos instrumentos de pesquisa. Neste último caso, um dos instrumentos é considerado o “padrão-ouro”, ou seja, um instrumento já validado. Em resumo, os testes avaliam a confiabilidade (fiabilidade) de medidas com o intuito de minimizar erros, bem como a confiabilidade de novos métodos. Cabe lembrar que existem duas possibilidades de erro: erro randômico e sistemático.5 Erros randômicos6,7 ocorrem ao acaso e erros sistemáticos ocorrem
11-Bioestatistica.indd 219
por fatores que levam a resultados enviesados. Assim, os testes de concordância serão explorados neste capítulo para minimizar erros sistemáticos e para comparar métodos de acordo com o seguinte: Estudos de acurácia de medidas resultantes de equipamentos, bem como de avaliadores, para evitar erros sistemáticos que levem a trabalhos científicos com informações equivocadas. Estudos de avaliação de métodos de análise com o intuito de comparação entre métodos existentes ou validação de novos métodos. O objetivo deste texto é explorar conceitos básicos sobre concordância e está fora do escopo do trabalho estabelecer protocolos de validação, uma vez que estes envolvem múltiplas etapas e análises estatísticas mais complexas. Para uma revisão sobre concordância, consultar Watson e Petrie.8
Testes de Concordância para Equipamentos e Avaliadores | Dados Quantitativos O pesquisador deve estar muito atento para evitar erros sistemáticos (resultados errados que não correspondem à realidade) em seus estudos, uma vez que, tendo seu trabalho publicado, induzirá os leitores ao erro e poderá levar profissionais que acessam essas informações à tomada de decisões equivocadas tanto na prática clínica em atendimento individual quanto na elaboração de políticas públicas. Com a finalidade de colocar esses testes em um contexto prático, elaboramos um desenho esquemático (Figura 11.1), em que uma proposta de avaliação do estado nutricional de jovens adultas universitárias seria realizada com o uso de dois equipamentos (balanças) e por dois avaliadores e em duas escolas. Pode-se supor que a hipótese do pesquisador fosse
18/05/2021 19:26:25
220 Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®
que as jovens das duas escolas pertencessem à mesma população, ou que não pertencessem à mesma população. Para cada uma das balanças e avaliador, pode-se supor erros sistemáticos partindo da calibragem do equipamento e da habilidade do avaliador. Observe-se na Figura 11.1 que se a balança estiver descalibrada, haverá um erro sistemático (a) que não será resolvido mesmo que o avaliador realize os procedimentos de pesagem adequadamente (d). Da mesma maneira, mesmo que a balança esteja calibrada (b), se o avaliador não realizar a pesagem adequadamente (e), o erro sistemático estará presente. Para que estes erros sejam prevenidos, identificam-se três pontos que devem ser conferidos, conforme assinalado a seguir. Dando continuidade ao exemplo, para o primeiro ponto de checagem, seriam realizados: Testes de precisão e acurácia de equipamentos em que é verificada a capacidade em reproduzir (repetibilidade) a mesma medida quando esta provém de uma mesma fonte (p. ex., indivíduo ou amostra biológica de sangue), ou seja, com precisão, e,
Balança 1
a. erro b. acerto c. acerto
Ponto no 1: calibragem do equipamento (acurácia). Concordância em relação aos demais equipamentos
Balança 2
erro acerto acerto
ainda, revelar em que grau a medida se aproxima de um valor real, ou seja, acurácia.9,10 Em seguida, para o segundo e terceiro ponto de checagem, seriam realizados: Teste de precisão intra (repetibilidade) e entre avaliadores (reprodutibilidade), em que é verificada a precisão da medida de um mesmo avaliador, ao fazer a tomada de medida várias vezes, de um mesmo avaliado e utilizando-se do mesmo instrumento (intra-avaliador), ou a precisão de medidas tomadas em um mesmo instrumento por diferentes indivíduos (entre indivíduos) e sobre um mesmo avaliado.11 Obviamente, estas não são as únicas etapas em que erros sistemáticos podem ocorrer. Até mesmo o registro das informações em bancos de dados pode levar a erros. A seguir, são sugeridos alguns métodos de avaliação tanto de medidas quantitativas quanto de medidas qualitativas.
Avaliador 1
d. erro e. erro f. acerto
Ponto no 2: checagem da reprodutibilidade das medidas pelo avaliador 1 (concordância intra-avaliador) Ponto no 3: checagem da concordância do avaliador 1 em relação aos outros três avaliadores (concordância entre avaliadores)
Avaliador 2
erro erro acerto
Avaliado (universidade 1)
Quando a checagem não ocorre, há maior probabilidade de erro no resultado do estudo, sejam as escolas pertencentes à mesma população ou não
Avaliado (universidade 2)
Observação: as possibilidades de erro são as mesmas para cada um dos quatro equipamentos e avaliadores
FIGURA 11.1 Apresentação esquemática das possibilidades de erros sistemáticos derivados de calibração de equipa-
mentos, técnicas de tomadas de medida por avaliadores e reprodutibilidade intra e entre avaliadores. As palavras erro e acerto dizem respeito aos erros que podem ocorrer e influenciar a etapa seguinte da avaliação. Em cada ponto de checagem da precisão e acurácia de cada medida, existe a possibilidade de erros sistemáticos que resultarão na distorção da realidade. Ao final, erros sistemáticos podem levar a conclusões equivocadas. Resumindo, no caso do teste de hipóteses, pode-se rejeitar a H0 quando os indivíduos pertencerem à mesma população ou aceitar-se H0 quando, na verdade, eles não pertencem à mesma população. A checagem intra-avaliador e entre avaliadores deve ser realizada, preferencialmente, antes que os avaliadores se dirijam às escolas para a coleta de dados Fonte: elaborada pelos autores.
11-Bioestatistica.indd 220
18/05/2021 19:26:25
Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos 221 Avaliação
da repetibilidade e reprodutibilidade entre equipamentos e avaliadores | Coeficientes de variação e índices de confiabilidade/fiabilidade
Os testes de concordância avaliam a precisão de dados coletados tanto em estudos observacionais quanto em estudos experimentais. Basicamente, buscam avaliar se os dados coletados podem ser repetidos e reproduzidos e podem ser utilizados em processos para avaliar se os dados refletem a realidade encontrada na natureza (acurácia). São realizados especialmente para evitar erros sistemáticos.
Coeficiente de variação Para ilustrar as duas primeiras situações descritas, precisão de equipamentos e precisão intra e entre avaliadores, tomemos o exemplo a partir do descrito na Figura 11.1. Suponhamos que se trata de um estudo em que o peso de jovens adultas, vivendo em residências universitárias de uma determinada cidade, seria coletado por quatro avaliadores que teriam uma unidade de cada equipamento (balança) para levar até os locais de coleta. Antes de iniciar a tomada das medidas, seria preciso realizar o teste de precisão e acurácia dos equipamentos; por exemplo, as quatro balanças que seriam levadas até os locais para levantamento de dados. Assim, antes que as balanças fossem entregues aos quatro avaliadores, uma pessoa experiente faria o teste utilizando-se de pesos-padrão
TABELA 11.1
para calibração, encontrados em lojas especializadas. Basicamente, as balanças deveriam ser precisas e reproduzir as mesmas medidas quando tomadas várias vezes, utilizando-se do mesmo peso-padrão (precisão), e tais medidas deveriam refletir exatamente o valor do peso-padrão (acurácia). Essas medidas deveriam ser repetidas por, no mínimo, três vezes. Observe a Tabela 11.1, em que as medidas foram tomadas três vezes de cada uma das quatro balanças, utilizando-se peso-padrão de 10kg. As médias dos pesos registrados por cada balança e os respectivos desvios-padrão e coeficientes de variação foram calculados, e uma conclusão sobre cada equipamento foi descrita com base na característica do equipamento e da medida utilizada.12,13 Na Tabela 11.1, apresentada como exemplo, observa-se que o cenário ideal é o da balança no 2 com precisão e acurácia, e o pior cenário é o da balança no 1 que superestima o peso em 2kg, que representam um valor 20% acima do esperado. Em seguida, a balança no 3 apresenta o segundo pior cenário com uma variação de 4,3% entre as medidas e que superestima o peso em 6%. Já a balança no 4 apresenta um cenário um pouco melhor, com uma variação entre as medidas de 0,57%, superestimando o peso em 0,3%. O valor aceitável para a calibração depende do equipamento e da variável medida. O fabricante do equipamento deve informar a variação aceitável para determinada categoria, bem como a sua sensibilidade. No caso da balança que pesa no máximo 100kg e que tem sensibilidade de 100g, seria aceitável uma
Teste de precisão e acurácia de balanças
Balança
no 1
no 2
no 3
no 4
1
12
10
10,1
10
2
12
10
10,7
10,1
3
12
10
11
10
Média
12
10
10,6
10,03
dp
0
0
0,46
0,058
CV (%)
0
0
4,3
0,57
Conclusão
Precisa, não acurada
Precisa, acurada
Não precisa, não acurada
Não precisa, não acurada
Medida
Medida igual ao peso-padrão = acurácia
Medida reproduzida por três vezes consecutivas = precisão
Quatro balanças foram avaliadas com o uso de um peso-padrão de 10kg. A média das três medidas e os respectivos desvios-padrão (dp) foram calculados. Em seguida, foi definido o coeficiente de variação (CV em %) = (dp/média) × 100. Com base nos resultados, concluiu-se sobre a precisão e a acurácia de cada equipamento. Fonte: elaborada pelos autores.
11-Bioestatistica.indd 221
18/05/2021 19:26:25