Bioestatística em Ciências da Nutrição: Do Desenho Científico aos Modelos Comentados com Uso do SPSS by Editora Rubio

00-Bioestatistica.indd 6

17/05/2021 13:48:07

Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

00-Bioestatistica.indd 1

17/05/2021 13:48:06

00-Bioestatistica.indd 2

17/05/2021 13:48:06

Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

Autores

Regina Maria Vilela Professora do Programa de Pós-Graduação em Alimentação e Nutrição e do Departamento de Nutrição da Universidade Federal do Paraná (DNUT/UFPR), Curitiba, Brasil. Doutora em Nutrição Humana pela Escola de Nutrição Humana, Faculdade de Ciências Agrárias e Ambientais, Universidade McGill, Montreal, Canadá. Mestre em Ciências (Bioquímica) pela UFPR. Especialista em Nutrição Clínica pela DNUT/UFPR.

Bruno M. P. M. Oliveira Professor do Programa de Pós-Graduação em Nutrição Clínica e da Faculdade de Ciências da Nutrição e Alimentação da Universidade do Porto (FCNAUP/UP); do Laboratório de Inteligência Artificial e Apoio à Decisão (LIAAD) e do Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC), Porto, Portugal. Doutor em Matemática Aplicada pela Faculdade de Ciências da UP. Mestre em Matemática Aplicada pela Faculdade de Ciências e Licenciatura em Física e Matemática Aplicada (Astronomia) pela UP. Título de Agregado em Nutrição Clínica e Ciências Básicas pela FCNAUP/UP.

00-Bioestatistica.indd 3

17/05/2021 13:48:06

Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Copyright © 2021 Editora Rubio Ltda. ISBN 978-85-8411-141-1 Todos os direitos reservados. É expressamente proibida a reprodução desta obra, no todo ou em parte, sem autorização por escrito da Editora. Produção Editorial Jaqueline Santos | JS Serviços Editoriais Capa Bruno Sales Imagem de capa ©iStock.com/photovideostock Diagramação Edel

CIP-BRASIL. CATALOGAÇÃO NA PUBLICAÇÃO SINDICATO NACIONAL DOS EDITORES DE LIVROS, RJ V755b Vilela, Regina Maria Bioestatística em ciências da nutrição: do desenho científico aos modelos comentados com uso do SPSS® / Regina Maria Vilela, Bruno M. P. M. Oliveira. – 1. ed. – Rio de Janeiro: Rubio, 2021. 264 p.; 21 cm. Inclui bibliografia e índice ISBN 978-85-8411-141-1 1. Bioestatística. 2. Nutrição - Métodos estatísticos. 3. Ciências médicas – Pesquisa – Metodologia. I. Oliveira, Bruno M. P. M. II. Título. 21-70888

CDD: 570.15195 CDU: 57.087.1

Camila Donis Hartmann – Bibliotecária – CRB-7/6472

Editora Rubio Ltda. Av. Franklin Roosevelt, 194 s/l. 204 – Castelo 20021-120 – Rio de Janeiro – RJ Telefone: 55(21) 2262-3779 E-mail: rubio@rubio.com.br www.rubio.com.br Impresso no Brasil Printed in Brazil

00-Bioestatistica.indd 4

17/05/2021 13:48:06

Dedicatória

Dedico esta obra aos que me conduziram, direta ou indiretamente, à profissão que exerço e aos desafios que ela apresenta. À minha avó Aziz Cândido de Oliveira, que me ensinou a ler antes que eu chegasse à escola. À Professora Doutora Maria Emília Daudt von der Heyde, pelo exemplo, amor e apoio incondicional. Às Professoras Lindiwe Sibeko (UMASS-USA) e Jiunni-Liu (Jeannie), que me inspiraram a estudar bioestatística enquanto eram minhas colegas de doutoramento na Universidade McGill. Aos meus pais, Newton Vilela e Zilda Barros Vilela, e aos meus irmãos, Denise Maria Vilela, Newton Vilela Júnior e Cristina Maria Vilela, pelo que sou. Aos meus ascendentes, que vieram de Portugal e cuja história motivou o meu regresso à sua terra como forma de gratidão e vestida da esperança de que este documento possa estabelecer um laço entre estudantes brasileiros e portugueses, com foco na ciência da Nutrição e na busca de uma vida melhor para todos. Aos estudantes de Nutrição e de outras áreas relacionadas que, entusiasmados em aprender, são parte fun damental da minha existência como professora, dão sentido à minha dedicação ao trabalho e florescem em mim a esperança de que, com o auxílio desta obra, possam disseminar a ciência da Nutrição com o cuidado e a seriedade necessários. Regina Maria Vilela

Dedico esta obra à minha esposa, Carla, aos meus filhos, Pedro e Sofia, e aos meus pais, Julieta e Alfredo. Aos meus antigos, atuais e futuros alunos. Bruno M. P. M. Oliveira

00-Bioestatistica.indd 5

17/05/2021 13:48:07

00-Bioestatistica.indd 6

17/05/2021 13:48:07

Agradecimentos

Ao Professor Doutor Bruno M. P. M. Oliveira (Facul dade de Ciências da Nutrição e Alimentação da Universidade do Porto [FCNAUP]), pela orientação do pós-doutoramento, cujo objeto de estudo foi a elaboração desta obra. À Universidade do Porto (UP), pela cooperação internacional que possibilitou meu acesso ao pós-doutoramento na FCNAUP e cujo acolhimento de toda a equipe fora fundamental. À Universidade Federal do Paraná (UFPR), Depar tamento de Nutrição (DNUT), pela oportunidade do afastamento do país e de minhas atividades para a realização desta obra. Ao Programa de Pós-Graduação em Alimentação e Nutrição (DNUT), pela oportunidade de ministrar as disciplinas de Metodologia da Pesquisa e Bioestatística que subsidiaram muitos dos modelos explorados como exemplos da aplicação da estatística na área de Nutrição. Aos professores Cláudia Seely Rocco (UFPR), Maria Eliana M. Schieferdecker (UFPR), Giane Bientinez Sprada (UFPR), Cláudio Marcelo Tkac (PUCPR), Angé lica Apa recida Maurício (UFPR), Bárbara Dal Molin Netto (UFPR), Cíbele Pereira Kopruszynski (UFPR), Deise Regina Baptista (UFPR) e Renata Labronici Bertin (UFPR) pelo apoio profissional e emocional durante a escrita. Às bibliotecárias do Setor de Ciências da Saúde da UFPR, Lidiane do Prado Reis e Silva e Natasha Pacheco de Mello Oliveira, pelo auxílio na organização e formatação das referências bibliográficas. Aos que contribuíram para que a minha jornada em Portugal fosse um aprendizado técnico e humano: Professora Doutora Cecília Noronha de Miranda Carvalho, Doutora Viviane de Cássia Kanufre, Sílvia Lopes, Pedro Lencastre Tamagnini e aos novos amigos que me acolheram em uma nova cultura.

00-Bioestatistica.indd 7

À Editora Rubio, pela viabilização da obra. À Jaqueline Santos e equipe, pela cuidadosa produção editorial e revisão dos textos. Regina Maria Vilela

À Professora Doutora Regina Maria Vilela, por todo o empenho que demonstrou no desenvolvimento desta obra. O seu esforço foi essencial para que este livro chegasse a bom porto. À Professora Doutora Cecília Morais e a todos os colegas da FCNAUP e da UP, que foram fundamentais no processo de mobilidade da Professora Doutora Regina Maria Vilela. Aos Professores Doutores Flora Correia e Rui Poínhos, pelas muitas discussões amigáveis, que são intelectualmente desafiantes, e com as quais ainda hoje aprendo muito, não só na área da Nutrição Clínica. Aos Professores Doutores Maria Daniel Vaz de Almeida, Cláudia Afonso e Bárbara Pereira (FCNAUP) e Alberto Pinto (FCUP), por alargarem os meus horizontes na área de Nutrição e de Matemática, respectivamente. À Mestre Marta Azevedo, por todo o apoio prestado, em particular, na área bibliotecária. A todos os colegas e amigos da FCNAUP e da UP, e a todos os alunos com quem tenho colaborado e aprendido durante esse processo. À FCNAUP e à UP, assim como ao Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC), pelas oportunidades que tenho tido de ensinar e investigar. Bruno M. P. M. Oliveira

17/05/2021 13:48:07

00-Bioestatistica.indd 8

17/05/2021 13:48:07

Apresentação

Embora o termo bioestatística refira-se à estatística voltada a eventos biológicos, o termo estatística será utilizado ao longo deste livro. Estão contidas nesta obra informações para guiar o acadêmico que inicia sua carreira de mestre e pesquisador em instituições de ensino superior. Assim, na introdução, o texto dará destaque para a contextualização do cenário que o acadêmico irá encontrar quando escolher a linha de pesquisa e o professor orientador. Além disso, será dada importância à compreensão do papel do estudante e do orientador na condução da pesquisa de forma eficaz. A bioestatística serve de suporte para responder às perguntas científicas elaboradas na construção do projeto de pesquisa que, por sua vez, dependem das variáveis nelas contidas e do desenho científico escolhido pelos pesquisadores. Assim, conceitos e exemplos comentados na área de Nutrição acerca destes aspectos serão explorados no primeiro capítulo. Nos capítulos seguintes, serão comentados conceitos e exemplos de análises estatísticas para os desenhos científicos mais comumente utilizados na área de Nutrição. Estarão incluídos nesses exemplos comentados: a organização de planilhas o passo a passo das etapas para a realização de análises estatísticas com o uso do Programa IBM® SPSS®, versão 25. Neste contexto, a interpretação dos resultados das análises também será apresentada. A maior parte dos exemplos utilizados nesta obra trata de assuntos da área de Nutrição Clínica experimental; porém, exemplos com modelos de outras áreas de Nutrição também serão apresentados. Todos os exemplos comentados têm como base a experiência dos autores na orientação de trabalhos científicos nos programas de pós-graduação de suas instituições

00-Bioestatistica.indd 9

de ensino. Além disso, os dados utilizados para as análises estatísticas são fictícios, em atenção ao preceito ético de não divulgar qualquer informação sobre os participantes das pesquisas com seres humanos. Considerando que a maior parte dos modelos citados foi feita a partir de desenhos clínicos, a base de dados consultada foi o Pubmed, e os artigos (em sua ampla maioria de livre acesso) contêm informações básicas sobre o tema consultado. Buscou-se selecionar os artigos mais recentes, mas não foi estabelecido limite de tempo, visto que muitos textos são clássicos. A ideia é que os acadêmicos tenham acesso a artigos com linguagem usual da área de saúde para melhor compreensão a respeito da bioestatística em seu contexto de trabalho. A seleção dos artigos levou em consideração aqueles de fácil leitura para iniciantes e que também apresentavam senso crítico em relação às análises estatísticas apresentadas. Artigos de estudos na área de Nutrição e outros exemplos foram selecionados para ilustrar a aplicação das análises. No entanto, não houve por parte dos autores uma análise pormenorizada do mérito das publicações ou de possíveis falhas metodológicas relacionadas ao desenho científico, aos processos de randomização, ao tamanho da amostra, entre outros. Como os termos utilizados tanto na área de estatística quanto na área de Nutrição podem variar um pouco entre o português brasileiro e o português europeu, buscou-se, na medida do possível, a utilização de termos comuns entre ambos. Quanto aos termos utilizados na área de estatística, utilizou-se o Glossário Inglês-Português de Estatística, publicado pela Sociedade Portuguesa de Estatística e a Associação Brasileira de Estatística em 2019 (http:// glossario.spestatistica.pt/). Os Autores

17/05/2021 13:48:07

00-Bioestatistica.indd 10

17/05/2021 13:48:07

Prefácio

Esta obra é fruto da parceria entre a Faculdade de Ciências da Nutrição e Alimentação da Universidade do Porto (FCNAUP), Portugal, e do Departamento de Nutrição da Universidade Federal do Paraná (DNUT/ UFPR), Brasil. Tem como objetivo orientar estudantes, que estão iniciando sua experiência como pesquisadores acerca dos princípios básicos da estatística que é aplicada frequentemente na área de Nutrição. Pretende-se com este livro estabelecer o raciocínio lógico acerca dos principais métodos estatísticos utilizados na área de Nutrição, podendo ser uma base para a exploração de modelos mais complexos.

00-Bioestatistica.indd 11

Adicionalmente, pretende-se colocar os modelos estatísticos no contexto de pesquisas em Nutrição de forma a facilitar a comunicação entre o estudante e o estatístico. No entanto, não faz parte do escopo deste trabalho esgotar as possibilidades de desenhos científicos, tão pouco as possibilidades de aplicação de todos os métodos estatísticos disponíveis na literatura. Aconselha-se, assim, que o estatístico seja consultado para a elaboração do projeto de pesquisa, bem como do artigo científico a ser publicado. Os Autores

17/05/2021 13:48:07

00-Bioestatistica.indd 12

17/05/2021 13:48:07

Lista de Siglas e Abreviaturas

ADA

American Diabetes Association

FHS

Framingham Heart Study

ângulo de fase

fibromialgia

AGREE

Appraisal of Guidelines for Research and Evaluation

FOS

fruto-oligossacarídeos

fused toes

ingestão adequada (adequate intake)

FTO

fat mass obesity associated gene

AMB

área muscular do braço

graus de liberdade

AMDR

distribuição aceitável de macronutriente (acceptable macronutrient distribution ranges)

GLM

modelo linear geral (general linear model)

ARRIVE

Animal Research: Reporting of In Vivo Experiments

GRADE

The Grading of Recommendations Assessment, Development and Evaluation

GSSG/GSH

glutationa oxidada/glutationa reduzida

BIA

impedância bioelétrica

hipótese nula

CARE

Case Report Guidelines

hipótese alternativa

CDC

Center for Disease Control

HbA1c

hemoglobina glicada

CHEERS

Consolidated Health Economic Evaluation Reporting Standards

HMB

β-hidroxi-β-metilbutirato

CONSORT

Consolidated Standards of Reporting Trials

HMG-CoA

3-hidroxi-metil-glutaril-CoA redutase

COREQ

Consolidated Criteria for Reporting Qualitative Research

IAM

infarto agudo do miocárdio

intervalo de confiança

The Consensus-based Standards for the Selection of Health Measurement Instruments

ICC

índice de correlação intraclasse

IL-8

interleucina 8

DECH

doença do enxerto contra o hospedeiro

IMC

índice de massa corporal

densidade óptica

IMRAD

desvio-padrão

Introduction, Material and Methods, Results, and Discussion

DRI

ingestão dietética de referência (dietary reference intakes)

IOTF

International Obesity Task Force

IRC

insuficiência renal crônica massa livre de gordura antes do tratamento (tempo zero)

COSMIN

DXA

densitometria por dupla emissão de raios X

MLGord0

EAR

necessidade média estimada (estimated average requirement)

MTT

teste de viabilidade celular

EBIA

Escala Brasileira de Insegurança Alimentar

NHS

Nurses’ Health Study

EC_M_ADUT

ecografia do músculo adutor

nutrição oral

EER

necessidade estimada de energia (estimated energy requirement)

NPT

nutrição parenteral total

OMS

Organização Mundial da Saúde

EIA

Escala de Insegurança Alimentar

razão de chances (odds ratio)

ELISA

teste imunoenzimático

percentil

fibrose cística/quística

PCA

principal componente analysis

FDA

Food and Drug Administration

PLS

partial least squares

00-Bioestatistica.indd 13

17/05/2021 13:48:07

PRISMA

Preferred Reporting Items for Systematic Reviews and Meta-Analyses for Systematic Reviews and Meta-Analysis

SQUIRE

Standards for Quality Improvement Reporting Excellence

SRQR

Standards for Reporting Qualitative Research

PRISMA-P

Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols

STARD

Standards for Reporting of Diagnostic Accuracy

STROBE

Strengthening the Reporting of Observational Studies in Epidemiology

PTN

proteínas

RDA

ingestão diária recomendada (recommended dietary allowance)

TCTH

transplante de células-tronco hematopoéticas

TMO

transplante de medula óssea

RIGHT

Reporting Items for Practice Guidelines in Healthcare

TNF

fator de necrose tumoral

razão de risco/risco relativo

TRIPOD

Sig.

significância

Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis

SPIRIT

Standard Protocols Items: Recommendations for Interventional Trials

UTI

unidade de terapia intensiva

proteínas de soro de leite (whey protein)

00-Bioestatistica.indd 14

17/05/2021 13:48:07

Sumário

Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos, 1

Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação, 35

Organização de Dados na Planilha do IBM® SPSS®, 55

Identificação das Características de uma Amostra (Estatística Descritiva), 71

Medidas de Associação com Variável Dependente Nominal, 87

Medidas de Associação com Variável Dependente Quantitativa, 109

Estudos Experimentais com Comparação de Duas Amostras, 133

Estudos Experimentais com Comparação entre Três ou Mais Grupos Independentes, 149

Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas, 167

Estudos Diagnósticos e Prognósticos, 195

Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos, 219

Índice, 239

00-Bioestatistica.indd 15

17/05/2021 13:48:07

00-Bioestatistica.indd 16

17/05/2021 13:48:07

1 Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos Escolha da Área de Pesquisa | Relação Orientador-Estudante Quando o principiante em pesquisa decide ingressar em um programa de pós-graduação com a expectativa de publicar um trabalho que possa servir de base para a evolução da ciência, é necessário que o estudante esteja atento às suas expectativas quanto à área de estudo escolhida, à aderência de tal área ao programa de pós-graduação pretendido e ao professor orientador. Cada programa de pós-graduação tem ênfase em uma determinada área/linha de pesquisa e é preciso que o candidato compreenda que não encontrará um programa com excelência em todas as áreas da Nutrição. Assim, mesmo que se tenha o desejo de estudar em uma determinada instituição de ensino, deve-se verificar se esta tem em seus programas de pós-graduação linhas de pesquisa relacionadas com sua área de interesse, bem como professores orientadores disponíveis naquele momento para acompanhar o trabalho escolhido pelo estudante. Além disso, é fundamental a compreensão do papel do professor orientador no processo de admissão no programa, na definição do projeto de pesquisa e na orientação periódica do trabalho a ser desenvolvido. Acima de tudo, é importante compreender que o professor tem suas peculiaridades quanto à organização de suas tarefas e que as instituições de ensino diferem em relação ao vínculo de trabalho com os docentes. Assim, a disponibilidade do professor para orientação de pesquisa, em geral, é compartilhada com diversas atividades administrativas, tais como participação e condução de reuniões, envolvimento com comitês de especialistas, elaboração de relatórios, produção de projetos político-pedagógicos, participação de atividades ligadas às relações internacionais de

01-Bioestatistica.indd 1

ensino e pesquisa, busca de fomento para pesquisa, entre outras, que vão além da atividade de docência em sala de aula ou da orientação de estudantes tanto na pós-graduação quanto na graduação. A escolha de investir na formação em pesquisa e de ingressar em qualquer que seja o programa de pós-graduação deve levar em consideração todos os aspetos anteriormente citados, bem como o entendimento de que o professor orientador deve nortear o trabalho a ser desenvolvido e dar suporte ao estudante para que este se torne um pesquisador independente. Assim, a definição do cronograma de atividades e das estratégias de orientação e de condução do trabalho por parte do estudante deve ser esclarecida em um primeiro encontro com o professor, a fim de clarificar duas questões centrais para o bom andamento das atividades: Disponibilidade e sistema de orientação, a fim de evitar que as expectativas do estudante não sejam baseadas na idealização de um professor que terá dedicação exclusiva ao seu trabalho. Compreensão de que o estudante deve apresentar postura proativa em relação à construção do conhecimento. Ao iniciar um trabalho científico, parte-se do princípio de que o pesquisador tem conhecimento prévio do assunto a ser estudado e, assim, percebe os problemas que existem na área de estudo de seu interesse e que o instigam a buscar respostas às perguntas sobre os problemas em questão. Na academia, o conhecimento prévio está relacionado com a linha de pesquisa do professor pesquisador que, provavelmente, já terá uma série de publicações no assunto ligadas à linha de pesquisa com a qual trabalha. Nesse sentido, o estudante que inicia sua experiência em pesquisa deve buscar a orientação de um professor que trabalhe com assunto de seu interesse.

13/05/2021 18:27:56

2  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

É também desejável que as características de personalidade de ambos sejam compatíveis, em particular nos aspetos relacionados com o trabalho. Ao estabelecer uma relação de aprendizado com o professor orientador, mesmo que este tenha conhecimento prévio mais ou menos aprofundado sobre o assunto em questão, o estudante que inicia suas atividades de pesquisa deverá se apropriar do assunto a ser estudado e da metodologia da pesquisa. Assim, é fundamental realizar uma cuidadosa revisão da literatura para atualizar-se sobre o tema, para que haja compreensão dos problemas que geram as perguntas científicas.

Revisão dos Elementos Básicos de Construção do Projeto de Pesquisa A primeira etapa da realização de qualquer pesquisa é a organização de um projeto que contenha todo o detalhamento do que será realizado pelo pesquisador, desde a fundamentação teórica em que se baseou para dar início ao projeto, passando pelas instituições e respectivos investigadores envolvidos, meios necessários e tarefas a realizar, até o cronograma que estima o tempo necessário para a realização de todas as etapas a serem cumpridas. Este processo deve ser pautado em princípios éticos que, muitas vezes, são desafiadores para o pesquisador, especialmente em países em desenvolvimento onde há escassez de recursos.1 É cada vez mais enfatizado que o projeto de pes quisa deve garantir publicações com rigor científico e transparência. Assim, o uso de modelos adequados é fundamental.2 A formatação do projeto varia um pouco conforme as normas adotadas para a escrita; alguns elementos, no entanto, são indispensáveis. Como referência para o projeto, tomemos como exemplo um modelo comumente utilizado para organizar artigos científicos: Introduction, Material and Methods, Results, and Discussion (IMRAD). Mais detalhes sobre o sistema IMRAD podem ser encontrados em Ramashandran e Vimala (2014).3 Trata-se de uma diretriz para o artigo científico que será resultado do projeto de pesquisa. Este pode ser mais longo e até fazer parte de um estudo maior, recomendando-se discutir, a princípio, quais os autores de cada publicação e a respectiva ordem. Cada publicação pode conter mais informações que o exemplo a seguir; no entanto, deve contemplar os elementos que constituirão

01-Bioestatistica.indd 2

o artigo, que facilitam a compreensão do estudo e a sua reprodutibilidade por outros investigadores. O termo IMRAD traz linhas gerais que devem constar no artigo científico, mas algumas etapas devem ser complementadas conforme a Tabela 1.1, que resume as principais características a serem destacadas em um estudo científico. O modelo diz respeito às informações básicas exigidas pela maioria das revistas indexadas e com um fator de impacto de boa reputação. Quando se tratar do projeto de pesquisa, haverá alguns elementos que não constam na Tabela 1.1: A revisão de literatura que detalha o assunto central do projeto e o cronograma. Os itens Resultados, Discussão, Conclusão e Agra decimentos, uma vez que se trata ainda do projeto em que o levantamento e a exploração de dados ainda não ocorreram. No entanto, o projeto/projecto poderá ter uma seção em que se descrevem genericamente os resultados esperados. Para uma revisão sobre os principais elementos do projeto de pesquisa, consulte Barletta (2008),4 Weber e Cobaugh (2008),5 Rhodes (2012),6 Al-Jundi e Sakka (2016),7 Sudheesh et al. (2016)8 Toda pesquisa científica tem um desenho que caracteriza a forma como a pesquisa será conduzida. O desenho científico, ou delineamento científico, pode ser definido como o tipo de estudo a ser aplicado para responder à(s) pergunta(s) científica(s) que justifica(m) a realização de uma dada pesquisa. Assim, os desenhos variam de acordo com a natureza da pesquisa que é definida pelas incertezas que o pesquisador tem sobre algum fenômeno e que procura explorar, seja observando o que acontece na natureza ou interferindo sobre ela. Neste capítulo, as bases para a identificação do desenho científico quando da elaboração do projeto de pesquisa serão exploradas como uma maneira de direcionar a escolha das análises estatísticas mais apropriadas para cada caso. O objetivo não é explorar os desenhos científicos em profundidade, mas sim identificá-los como uma forma de direcionar as análises estatísticas. Assim, pretende-se dar suporte ao iniciante em pesquisa para que este possa organizar, de forma sistemática, o seu projeto de pesquisa, incluindo as principais análises estatísticas a serem realizadas nas situações mais comuns na área de Nutrição,

13/05/2021 18:27:56

Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos  3

TABELA 1.1

Modelo IMRAD – principais elementos de um artigo científico

Elementos

Função

Título

Qual é o assunto do artigo? Que pergunta o artigo pretende responder? Sugere-se que o título contenha as principais palavras-chave do artigo

Autores

Nomes e afiliação dos autores

Palavras-chave

Terminologia que melhor descreve o trabalho

Resumo

Curta e objetiva narrativa do artigo

Introdução

Por que este artigo? O problema, o que é sabido e controverso sobre o assunto escolhido (estado da arte) e os objetivos do estudo

Materiais e métodos

Como o estudo foi feito? Desenho científico a ser adotado com identificação dos participantes (características, cálculo do tamanho da amostra, critérios de seleção/randomização). Indicação do local de realização do trabalho e aprovação de Comitê de Ética em pesquisa correspondente ao objeto de estudo (humanos, animais). Descrição de materiais utilizados, tais como equipamentos e reagentes. Descrição de métodos de investigação (questionários, análises experimentais). Análise estatística

Resultados

Quais foram os achados do trabalho? Apresentação e descrição dos resultados, auxiliados por tabelas e gráficos e pela análise estatística empregada

Discussão

Qual o significado dos achados no contexto da pesquisa? Como os resultados podem ser comparados aos de outros trabalhos e em quais aspectos divergem. Quais as limitações do trabalho e os encaminhamentos futuros?

Conclusão

Quais as conclusões referentes aos objetivos que foram propostos ou quais as respostas às perguntas científicas que definiram os objetivos do trabalho? Possíveis implicações dos achados

Agradecimentos

Quem ajudou os autores no trabalho e como? Qual foi a fonte de financiamento do trabalho?

Referências

Relação dos artigos, livros e outro material publicado citados no trabalho

Apêndices

Material suplementar (questionários utilizados, parecer de Comitê de Ética, entre outros)

Fonte: adaptada de Ramashandran e Vimala, 2014.3

especialmente em estudos com humanos. Para uma leitura abrangente sobre diversos desenhos científicos na área de saúde e Nutrição, consulte as publicações de Barrie e Michael (1997) 9 e Hulley et al. (2013).10 Como o componente central do projeto é o desenho científico, deve ser estabelecido de modo criterioso, o que depende de algumas informações preliminares, tais como: a pergunta científica, os objetivos do trabalho, as variáveis envolvidas, os indivíduos a serem investigados e o tipo de informação que se pretende obter desses indivíduos para responder à(s) pergunta(s) científica(s) formulada(s). Tendo como foco o desenho do estudo e as análises estatísticas, mais detalhes serão apresentados aqui sobre os elementos necessários para definir os materiais e métodos, a saber: a pergunta científica, variáveis (preditoras, confundidoras e de desfecho), o desenho científico e, por fim, os aspectos da análise estatística tanto na definição da amostra e seleção de indivíduos quanto na análise das variáveis. A questão “Como o estudo foi feito”, destacada no modelo IMRAD, diz respeito a tais aspectos.

01-Bioestatistica.indd 3

Para a escolha do desenho científico, muitas questões devem ser observadas cuidadosamente, e estas serão aqui apresentadas para dar direcionamento à escolha do desenho científico e, em seguida, à escolha das análises estatísticas relacionadas. Serão destacados os tipos de pesquisa e desenhos utilizados em pesquisa clínica; no entanto, também será apresentada uma breve explanação sobre outros estudos em que se utilizem ou não análises estatísticas. Em um contexto amplo, é possível colocar as pesquisas na área de Nutrição assim distribuídas (Tabela 1.2). Ao observar o modelo da Tabela 1.2, o estudante deve compreender que, apesar de o tema central ser a ciência da Nutrição, a cooperação entre profissionais de diversas áreas se faz necessária para uma compreensão mais profunda dos fenômenos a serem estudados. No caso das análises estatísticas, é fundamental que o pesquisador ajuste seus pensamentos à linguagem da matemática e às informações necessárias sobre o projeto para que seja capaz de interagir de forma mais adequada com o estatístico.11

13/05/2021 18:27:56

4  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

TABELA 1.2

Exemplo de pesquisas comumente realizadas na área de Nutrição humana

Pesquisa básica (experimental)

Estudos in vitro de dosagem e caracterização de componentes alimentares (análise de alimentos) Estudos in vitro e ex vivo com cultivo de células e de tecidos (descrição de mecanismos moleculares ligados à nutrição) Estudos in vivo com animais (experimentos com intervenção utilizando-se de dietas e suplementos)

Pesquisa epidemiológica

Estudos para identificação de incidência e prevalência de condições relacionadas ao estado nutricional ou práticas alimentares encontradas na população Estudos para observação e análise de fenômenos que expliquem condições clínicas ou que indiquem riscos associados ao estado nutricional ou práticas alimentares da população Estudos para identificação de fatores de risco associados à alimentação que comprometam a condição de saúde

Pesquisa clínica

Estudos voltados a observar associações entre práticas alimentares e condutas clínicas sobre a condição de saúde ou estado nutricional de indivíduos enfermos ou da condição de saúde sobre o estado nutricional e riscos relacionados Estudos experimentais com intervenção (experimento) para avaliar efeito de práticas alimentares ou uso de suplementos, medicamentos e outros tratamentos sobre indivíduos internados, institucionalizados ou em atendimento ambulatorial (doentes ou saudáveis)

Pesquisa qualitativa

Estudos em que há registro e interpretação de visões, perspectivas, conhecimento e sentimentos quanto ao estado nutricional, alimentação e segurança alimentar e nutricional dos diversos atores envolvidos no universo da alimentação e nutrição

Fonte: elaborada pelos autores.

Para a pesquisa clínica, que pode abranger aspectos ligados a outros modelos de pesquisa na área de Nutrição, os principais elementos que fundamentam a escolha das análises estatísticas estão apresentados na anatomia da pesquisa descrita na Tabela 1.3. Na sequência, serão apresentados com mais detalhes os elementos citados na Tabela 1.3.

Pergunta Científica como Primeiro Passo para a Organização do Projeto de Pesquisa Como mencionado, o professor orientador tem conhecimento amplo sobre a linha de pesquisa com a qual trabalha. No entanto, o novo projeto de pesquisa elaborado em conjunto com o estudante, via de regra, traz elementos ainda não explorados e cuja revisão de literatura deve servir de base para a sua construção. Assim, é necessário que o estudante realize uma ampla revisão da literatura para se apropriar do assunto em questão. Isso não quer dizer que somente a observação do que está na literatura pode levar a perguntas científicas relevantes. Além disso, é necessário observar uma rotina de trabalho em que

01-Bioestatistica.indd 4

se pode questionar um procedimento; o comportamento de grupos ou indivíduos em um determinado contexto; ou, ainda, fenômenos presentes na natureza que ainda não tenham sido explorados. A pergunta científica é a incerteza de que o pesquisador quer resolver, e cabe especialmente em trabalhos em que se estudam hipóteses. Identificar a(s) pergunta(s) científica(s) que irá(ão) compor o projeto de pesquisa não é tarefa fácil e tem sido alvo de várias publicações em que se descrevem a importância do tema e as estratégias para elaboração de perguntas científicas adequadas.12-17 Podem ser citados alguns exemplos de problemas e perguntas relacionadas, a saber: Na área clínica. Um problema comum na prática clínica está relacionado com o uso de antibióticos, uma vez que provoca modificação da microbiota intestinal que pode levar à diarreia e causar redução da ingestão alimentar e absorção de nutrientes com consequente perda de peso, especialmente em idosos. Como resultado, há aumento na mortalidade nessas condições. Tendo conhecimento dos efeitos fisiológicos do uso de probióticos na prática clínica, um pesquisador pode propor a seguinte pergunta científica: o uso de lactobacilos e bifidobactérias previne diarreia associada ao uso de antibióticos em pacientes idosos institucionalizados?

13/05/2021 18:27:56

Etapas Fundamentais que Antecedem a Escolha dos Métodos Estatísticos  21 Pergunta científica. O baixo peso ao nascer está relacionado com o aumento na incidência de diabetes em adultos? Os indivíduos são separados de acordo com o fator de risco (baixo peso ao nascer) identificados em arquivos do passado

A pesquisa começa aqui

Número de casos de diabetes em adultos que tiveram baixo peso ao nascer é registrado

Fator de risco +

Número de casos de diabetes em adultos que não tiveram baixo peso ao nascer é registrado

Fator de risco –

Fator de risco +

Fator de risco –

FIGURA 1.8 Modelo de estudo de incidência (estudo retrospectivo). A identificação das variáveis de risco e desfecho neste modelo é análoga ao descrito na Figura 1.7; no entanto, o desfecho já ocorreu e, por isso, o pesquisador vai buscar as informações em registros feitos no passado Fonte: adaptada de Barker e Clark, 1997.52

Estudos caso-controle de incidência Os estudos de caso-controle consistem em estudar uma doença já existente em uma determinada população e escolher indivíduos saudáveis dessa mesma população para observar se o fator de risco proposto pelo pesquisador está mais presente no grupo que tem a doença em relação ao grupo saudável. São derivados dos estudos de incidência (longitudinais). Pode-se elaborar um desenho científico do tipo ca so-controle de incidência e de prevalência. O primeiro poderia ser elaborado a partir de um estudo longitudinal de incidência. Por exemplo: no estudo longitudinal com as mulheres chinesas (Figura 1.7), todos os casos de câncer de mama ao final do estudo seriam selecionados, sendo eles pertencentes ao grupo que bebe mais álcool ou ao grupo que bebe menos álcool. Assim, o grupo sofreria uma nova divisão, agora não baseada no consumo de álcool, mas nos casos da doença. Um grupo controle seria formado com as mulheres chinesas que não tiveram a doença, e outros

01-Bioestatistica.indd 21

fatores de risco poderiam ser verificados, como, por exemplo, a obesidade. Daí o nome caso-controle de incidência. Importante destacar que essa característica (obesidade) deveria ter sido registrada no início do seguimento e mantida ao longo do tempo até o desfecho. Assim, seria possível relacionar a incidência de câncer de mama com a obesidade nessa população.

Estudos de prevalência (transversais) No caso dos estudos transversais de prevalência, a intenção do pesquisador também é estabelecer uma relação entre fatores de risco e desfechos; no entanto, neste modelo, o desfecho já está presente no momento da coleta de dados. Cada indivíduo é avaliado apenas em um instante do tempo, ou seja, não há seguimento e somente é possível coletar dados de prevalência de desfechos. Por esse motivo, os estudos de prevalência não são caracterizados como longitudinais, mas transversais. A seguir, é mostrado um exemplo. Suponhamos que o interesse do pesquisador fosse estabelecer uma relação entre o consumo de bebidas

13/05/2021 18:27:59

22  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

adoçadas e a obesidade em escolares de uma determinada cidade na faixa etária de 11 anos. A população de estudo seria separada, de acordo com o fator de risco, em consumidores diários de bebidas adoçadas (consumidores frequentes) e consumidores semanais de bebidas adoçadas (consumidores esporádicos). Nesse caso, as variáveis seriam coletadas perguntando-se aos pais sobre a frequência de consumo destas bebidas. O desfecho seria a presença ou não de obesidade. A relação entre o consumo de bebidas açucaradas e prevalência de obesidade seria então determinada. Os custos deste tipo de estudo são inferiores aos longitudinais; no entanto, neste caso, como o pesquisador escolhe a posição das variáveis, existe o risco de inversão dos fatores, ou seja, o consumo de bebidas açucaradas é fator de risco para obesidade ou a obesidade leva ao consumo maior de bebidas açucaradas? É uma situação em que pode ocorrer a causalidade inversa. Também poderia acontecer de a maioria das crianças com obesidade já ser acompanhada por profissionais de saúde e, no momento do estudo, o seu consumo de bebidas açucaradas até fosse inferior ao das crianças sem obesidade, constituindo como variável confundidora a alteração (recente) dos hábitos de consumo de bebidas açucaradas. Para ilustrar este estudo transversal de prevalência, pode-se observar a Figura 1.9.

Estudos de caso-controle de

prevalência

Nos estudos de caso-controle de prevalência, selecionam-se dois grupos de indivíduos: um que apresenta certa característica (casos de uma doença rara, por exemplo) e outro que, conhecidamente, não tem essa característica (controles saudáveis). Observe que, no exemplo anterior (Figura 1.9), primeiro eram selecionados os indivíduos e depois estes eram divididos de acordo com a presença ou não de determinada característica. Em um estudo de caso-controle de prevalência, poderíamos, por exemplo, selecionar um grupo de crianças com obesidade e um grupo de crianças sem obesidade e comparar o consumo de bebidas açucaradas entre eles. São derivados dos estudos de prevalência (transversais). Estudos

observacionais na prática clínica | Características básicas

Embora os modelos observacionais sejam comuns em estudos epidemiológicos, estudos clínicos podem também assumir características de estudos observacionais descritivos e observacionais analíticos do tipo longitudinais e transversais. Uma diferença a ser considerada é que, nos estudos epidemiológicos, o número de indivíduos estudados e o período de seguimento, no

Pergunta científica. O uso de bebidas açucaradas está associado à prevalência de obesidade na infância? As crianças são divididas em dois grupos de acordo com o consumo de bebidas açucaradas Consumidores frequentes

Consumidores esporádicos

Número de crianças obesas neste grupo (prevalência) é registrado

A expectativa do pesquisador é que a prevalência de obesidade seja maior entre as crianças que consomem bebidas açucaradas mais frequentemente FIGURA 1.9 Modelo de estudo de prevalência (transversal) tendo como fator de risco o consumo de bebidas açucaradas

e desfecho de obesidade entre escolares. Não há seguimento das crianças ao longo do tempo, pois as medidas são tomadas de forma transversal Fonte: elaborada pelos autores.

01-Bioestatistica.indd 22

13/05/2021 18:27:59

2 Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação Organização das Variáveis na Planilha de Dados para Posterior Análise Estatística Conforme descrito no Capítulo 1, um trabalho de investigação deve começar com a pergunta científica. Nessa etapa, identifica-se a população a ser estudada, as variáveis de interesse e o tipo de desenho científico mais adequado para responder ao postulado pelo pesquisador. A fase que antecede os cálculos estatísticos é a escolha das variáveis a serem estudadas. Em seguida, e após a definição do desenho científico, a primeira etapa que envolve a matemática é o cálculo do tamanho da amostra,1-4 seguida dos processos de randomização para escolha de uma amostra representativa da população de interesse e, quando for o caso, para divisão desta em grupos homogêneos.5 Resumidamente, a sequência de eventos está apresentada mais adiante na Figura 2.1. As etapas iniciais envolvidas na escolha do tratamento estatístico a partir da pergunta científica são: A. Definição da(s) pergunta(s) científica(s), com a identificação de população/amostra-alvo. B. Identificação das variáveis presentes na pergunta científica e definição de suas características. C. Definição do tipo de desenho científico a ser atribuído para responder à(s) pergunta(s). D. Identificação das variáveis a serem controladas (confundidoras). E. Cálculo do tamanho da amostra. F. Definição dos processos de randomização. Importante destacar que a interação do estudante com o orientador da pesquisa é fundamental nessa fase do projeto, não somente para a definição de população, tamanho da amostra e processos de randomização, mas também para a adequada identificação das variáveis a serem exploradas.

02-Bioestatistica.indd 35

A clareza na definição das variáveis a serem exploradas e a forma como serão expressas é uma etapa de extrema importância e está implícita nos itens B e D. Trata-se de uma etapa crítica do trabalho, pois as variáveis devem ser expressas de modo a permitir que os objetivos da pesquisa sejam atendidos. Para tanto, devem traduzir adequadamente as características do objeto de estudo. Assim, a organização das variáveis de interesse em uma planilha é uma tarefa bastante complexa, pois não se trata da simples digitação de todas as informações recolhidas ou registradas em documentos sobre os participantes de uma pesquisa, por exemplo. Nesta etapa, é necessária uma análise crítica sobre a melhor forma de representar as informações dos participantes. Por exemplo, uma variável bastante comum em estudos de Nutrição é o peso, mas nem sempre expressá-lo como medida original é a escolha do pesquisador. Dependendo do objetivo do trabalho, poderá ser expresso como % de perda de peso, ganho de peso em x dias, categorizado em variável binária como perda de peso ≥5% ou <5% em 30 dias, classificado de acordo com escores Z ou em percentis, entre outras possibilidades. Além disso, ao categorizar indivíduos em grupos de acordo com determinada variável, é fundamental a busca de padrões adequados de referência6 e critérios validados de classificação, por exemplo, graus de desnutrição de acordo com a Organização Mundial da Saúde (OMS) (ver Capítulo 1, Figuras 1.2 e 1.3). A decisão de categorizar as variáveis deve levar em conta o significado clínico desta decisão, sem deixar de considerar também suas limitações, como, por exemplo, a diminuição do poder do estatístico e o risco de viés.7 Nesta fase, é possível citar também a necessidade de separar os indivíduos de acordo com sexo, intervalos de idade, faixa salarial, composição de agregado familiar, tipo de tratamento, entre outros aspectos.

18/05/2021 17:00:57

36  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

Tanto nos casos em que há uma classificação ou separação de indivíduos de acordo com critérios preestabelecidos, como o índice de massa corporal (IMC), por exemplo, quanto nos casos em que este critério não está claramente definido, como na separação de indivíduos de uma amostra de acordo com a doença diagnosticada no internamento ou conforme o uso de medicamentos, por exemplo, especialmente quando a amostra é pequena, é importante verificar que um número muito grande de categorias deixará a amostra “diluída” entre as múltiplas possibilidades, dificultando as análises estatísticas.8,9 Neste caso, é importante revisar os dados e agrupar duas ou mais categorias em uma, de modo a diminuir o número total de categorias, aumentando, assim, o número de casos em cada uma delas. Por exemplo, para verificar a relação entre sexo e diagnóstico de enfermidades como motivo de afastamento do trabalho em um hospital de grande porte em uma amostra de mais de cinco mil funcionários, a divisão das categorias de enfermidades em mais de 30 possibilidades pode mostrar baixa frequência de casos em algumas categorias. Para ilustrar a situação de número excessivo de categorias, imaginemos que apenas um indivíduo teve uma determinada enfermidade. Suponhamos que tal enfermidade seja um tumor intestinal raro e, ainda, que outros 18 indivíduos tiveram também tumores intestinais menos comuns, embora com diferentes características histológicas. Neste caso, parece razoável que essas duas categorias fossem agrupadas em uma única sob o título de tumores intestinais raros, aumentando, portanto, o número de casos nessa categoria. Outros exemplos seriam o agrupamento de variáveis em um grupo de afastamentos por motivo psicológico, por lesões musculares, entre outras. Obvia mente, quando a prevalência de doenças é maior, não existe a necessidade de agrupamento como no caso das doenças endócrinas e metabólicas. Alguns exemplos de organização das variáveis podem ser observados mais adiante neste capítulo sob o subtítulo: a definição da forma de apresentação das variáveis. Ao longo deste capítulo, serão abordados os seguintes assuntos: Definição e forma de apresentação das variáveis do estudo científico. Cálculo do tamanho da amostra. Processos de randomização e pareamento.

02-Bioestatistica.indd 36

Características demográficas dos grupos a serem estudados. Exemplos relacionados com a ciência da Nutrição serão apresentados para cada etapa, especialmente estudos com humanos, mas não obrigatoriamente.

Definição da Forma de Apresentação das Variáveis Como já mencionado, quando o pesquisador estabelece a(s) pergunta(s) científicas de seu trabalho, pode optar por apresentar as variáveis de diferentes formas que não são necessariamente as originalmente coletadas da população de interesse. A seguir, são mostrados alguns exemplos. Suponhamos que um pesquisador queira investigar se há influência dos tipos de carboidratos ingeridos por mulheres sobre a incidência de diabetes; observemos como os elementos principais da pergunta podem ser destacados para direcionar as escolhas quanto ao desenho científico e ao tratamento estatístico dos dados considerando, por exemplo, a pergunta de investigação: O consumo inadequado de açúcares livres pode levar a um aumento do risco de incidência de diabetes tipo 2 em mulheres da cidade x? Um dos pré-requisitos fundamentais quando da elaboração da pergunta científica é a clareza das informações nela contidas. Neste exemplo, está evidente que as variáveis de interesse são: os açúcares livres ingeridos como variável independente e, como variável dependente, a incidência de diabetes. Os participantes da pesquisa, como mencionado, serão mulheres. Quando se trata de incidência de diabetes, a pergunta indica desfecho, ou seja, algo que será medido ao longo de um período e não em um dado momento do tempo. Assim, pode-se entender que é um estudo observacional longitudinal de inci dência (ver Figura 1.6). A variável relativa ao consumo de açúcares livres é originalmente quantitativa contínua e é computada no banco de dados como total somando-se a quantidade, em gramas, de monossacarídeos e dissacarídeos presentes em bebidas comerciais, no preparo de alimentos pelas mulheres, além dos açúcares naturalmente presentes no mel, por exemplo. No entanto, como a pergunta científica pressupõe um estudo de incidência, o pesquisador pode optar

18/05/2021 17:00:57

Bioestatística no Contexto das Publicações Científicas | Para cada Etapa do Projeto, uma Aplicação  47

A média de células natural killer foi 65,5 65,5

O valor da média da população estaria próximo à média encontrada no estudo, em um intervalo de 95%, e podem, então, ser qualquer valor neste intervalo Os valores extremos e, portanto, apresentando um número pequeno da população somam 0,05 e correspondem ao valor de erro alfa cujo nível de significância é estabelecido como p <0,05

0,95

0,025 –2 Desvios-padrão P2,5 Escore Z= –1,96

Média +2 Desvios-padrão P50 P97,5 Escore Z = 0 Escore Z = +1,96

FIGURA 2.7 Representação gráfica do intervalo de confiança P: percentil. Fonte: elaborada pelos autores.

Para o caso do valor de alfa assumido ser 5%, o IC a 95% irá corresponder a valores de Z entre –1,96 e +1,96. O escore Z = +1,96 é o valor do percentil 97,5 da curva, e Z = –1,96 está associado ao percentil 2,5. Assim, 95% da população encontra-se no intervalo entre cerca de 2 desvios-padrão acima e 2 desvios- padrão abaixo da média. O erro beta diz respeito à aceitação equivocada da hipótese nula (H0), ou seja, concluir que não há diferença entre grupos ou proporções quando elas existem. Neste caso, seria rejeitar, erroneamente, a hipótese do pesquisador. O erro beta, que é escolhido de forma convencional em pesquisas de boa qualidade, tem valores habituais de 10% ou 20% e é utilizado para calcular o poder estatístico da análise (1-beta). Admitir 10% de chance de errar ao assumir que o tratamento não funcionou significa que a chance de detectar uma real diferença entre grupos de médias é de 90%. O poder da análise também deve ser usado no cálculo do tamanho da amostra. Nas fórmulas de cálculo do tamanho da amostra, quando se assume a normalidade da distribuição, é comum usar os escores Z em função dos valores de alfa e beta. Na Figura 2.8, estão apresentados os dados para o cálculo do tamanho da amostra para o exemplo do

02-Bioestatistica.indd 47

efeito da dieta imunomoduladora suplementada com quercetina sobre a competência imune de pacientes criticamente doentes. Neste caso, o foco está na informação dos erros alfa e beta. Importante notar que o tamanho da amostra do estudo preliminar tinha 10 indivíduos para cada grupo, e tamanho do efeito de 0,5, de acordo com as informações adicionadas pelo pesquisador. Este tamanho não será suficiente para o estudo final. O tamanho da amostra calculada para um poder de 80% foi de 42, ou seja, cada grupo deverá ser composto de 14 indivíduos. Considerando que alguns pacientes podem deixar a amostra, neste caso, por óbito, alta, intolerância ao suplemento ou outra intercorrência que o impeça de seguir, uma margem deve ser adicionada ao valor inicialmente calculado. Tal margem também pode ser estimada com base na característica da população e do desenho científico. Por exemplo, idosos com alguma enfermidade e que, para participar de uma pesquisa, tenham que se locomover a algum local distante de suas residências em dias de inverno podem desistir com mais facilidade do que adolescentes saudáveis que sejam avaliados em suas escolas. Da mesma maneira, quando se trata de um estudo transversal com uma única avaliação, a desistência tende a ser menor do que no caso de estudo

18/05/2021 17:01:00

48  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

2 3 4 *

FIGURA 2.8 Valores de erro alfa e beta para o cálculo do tamanho da amostra em um estudo de comparação de médias entre três grupos. Neste exemplo, foi utilizada atividade de células natural killer em % com base no valor líquido (% antes da intervenção menos a % após a intervenção), uma vez que os valores iniciais da atividade dessas células eram diferentes entre os grupos por serem pacientes pouco estáveis. Observe que o valor total do tamanho da amostra = 42 está circulado com *. 1. O teste escolhido pelo pesquisador foi a ANOVA: análise de variância (fixed effects, omnibus one way). 2. A análise solicitada foi o tamanho da amostra – dado o valor de alfa, poder e tamanho do efeito. 3. O tamanho do efeito escolhido (effect size) foi 0,5. 4. O erros-alfa (0,05) e beta (0,8) devem ser aqui informados Fonte: imagem do programa GPower® editado pelos autores.

longitudinais com vários momentos de avaliação ao longo de semanas ou meses. Essa margem pode ainda ser proposta com base em outros estudos publicados ou na experiência do pesquisador ou, ainda, em estatísticas/registros do próprio serviço da unidade de terapia intensiva (UTI). Assim, imaginando-se que esta margem fosse calculada em 25%, o número total de indivíduos seria de 52,5. Dividindo-se por três, seriam 17,5. Obviamente, não é possível estudar um número não inteiro de indivíduos, devendo ser selecionados 18 indivíduos por grupo. Caso o valor do poder da amostra fosse aumentado para 90%, o tamanho da amostra aumentaria. Se a variação dos dados, ou seja, o desvio padrão, fosse muito alta, o tamanho da amostra também aumentaria consideravelmente. Caso a diferença entre as médias fosse maior, ou seja, se a expectativa de que o suplemento tivesse um efeito que fizesse a atividade das células aumentar muito em relação às outras, o tamanho da amostra diminuiria, porque a diferença seria mais fácil de detectar.

02-Bioestatistica.indd 48

Enfim, um trabalho mais rigoroso (poder elevado) exige um maior número de indivíduos. Uma intervenção com um efeito muito brando (resultado com diferenças pequenas) precisaria de uma amostra grande para mostrar valia, ou seja, talvez o impacto sobre os doentes não fosse clinicamente significativo, e o pesquisador deveria pensar se é válido o investimento e se seria ético experimentar. Uma variável que tenha a característica, por natureza, de ser muito diferente (heterogênea) entre os indivíduos, por exemplo, exigiria um maior tamanho da amostra; no entanto, se o efeito fosse muito bom, amenizaria as exigências quanto ao tamanho da amostra. Uma observação importante a ser feita aqui é que algumas das fórmulas para o cálculo do tamanho da amostra pressupõem número igual de participantes em cada grupo para manter o máximo poder da análise. No entanto, em muitos casos, isso não é possível por motivos diversos. Nos estudos experimentais, pode ocorrer que, por uma questão de custos ou por dificuldade de selecionar controles, ou mesmo

18/05/2021 17:01:00

3 Organização de Dados na Planilha do IBM® SPSS® Introdução No universo da Nutrição, os procedimentos estatísti cos permitem determinar o tamanho de uma amostra representativa da população, organizar dados para descrever as suas características nutricionais e, não menos importante, testar as hipóteses ou as inferên cias estabelecidas pelo pesquisador no momento da elaboração de seu estudo científico. Além disso, os testes também são utilizados para validar instrumen tos de avaliação do estado nutricional e de educação nutricional, estabelecer equações destinadas à deter minação do gasto energético e outras relacionadas com o metabolismo e a composição corporal. Além disso, a estatística é utilizada em trabalhos para iden tificação, isolamento e caracterização de compostos nutricionais e bioativos em alimentos. Importante ressaltar que a escolha das análises esta tísticas a serem utilizadas para exploração de dados, independentemente da natureza do trabalho científi co em questão, deve ocorrer somente após elabora ção cuidadosa do projeto de pesquisa. Para a elabo ração cuidadosa do projeto, o pesquisador deve ter clareza sobre o assunto a ser tratado, as perguntas científicas e os objetivos da pesquisa, além da defi nição da natureza das variáveis a serem exploradas. Adicionalmente, deve definir o tipo de desenho cien tífico a ser empregado. Infelizmente, por não explorar adequadamente a literatura acerca do seu objeto de estudo, pode acontecer de o acadêmico vir a reproduzir hipóteses já exaustivamente exploradas, que sejam irrelevantes para a sociedade, desconectadas dos objetivos do trabalho, em particular no caso em que a pergunta científica não tenha sido claramente estabelecida, ou até que eventualmente levantem algumas questões éticas. Assim, ressalta-se a importância do tempo des tinado à elaboração criteriosa do projeto de pesquisa

03-Bioestatistica.indd 55

e a interação com o professor orientador, conforme destacado no Capítulo 1. Para a organização dos capítulos que se seguem, será adotado um sistema em que serão abordados os conceitos básicos dos testes estatísticos, a sua aplica ção e a execução de análises com resultados comen tados utilizando-se o programa IBM® SPSS® versão 25 (SPSS). Muitos exercícios tiveram como base projetos de graduandos, residentes e mestrandos em Nutrição; no entanto, não reproduzem os projetos, especial mente em relação aos dados, pois estes foram mo dificados por questões éticas. Para alguns exemplos, foram simulados projetos e dados fictícios. Este documento não pretende discutir todas as possibilidades de aplicação da estatística e em todas as áreas da Nutrição; assim, as Tabelas 3.1 a 3.3 apresen tam os assuntos que serão abordados, conforme o tipo de estudo e as características das variáveis envolvidas. Para explorar aspectos básicos sobre as análises indicadas nessas tabelas, pode-se recorrer a algumas publicações que trazem considerações sobre a esco lha de testes estatísticos.1-7 Umas das dificuldades em estabelecer as análises estatísticas é o fato de não haver uma única maneira de analisar dados, cabendo ao pesquisador o senso crítico para explorar as variáveis da melhor forma pos sível. Assim, os modelos que serão aqui apresentados seguirão uma lógica para apresentação didática dos principais testes estatísticos utilizados em Nutrição, mas que não necessariamente são a única alternativa para explorar os dados que serão apresentados. Antes de apresentarmos as análises estatísticas propriamente ditas, algumas tarefas para organização de planilhas serão exploradas com base no guia publi cado pela IBM Corporation.8 Para os tutoriais com os exemplos de uso do SPSS, serão apresentadas cópias das planilhas de banco de dados simulados para esta publicação e resultados das

18/05/2021 17:46:55

56  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

TABELA 3.1

Análises univariadas

Variável em estudo

Quantitativa normal: uma

Quantitativa não normal: uma

Qualitativa ordinal: uma

Qualitativa nominal: uma Categorias: diversas

Categorias: duas

Estatística descritiva

Média e desvio-padrão; mínimo e máximo

Mediana e P25, P75; mínimo e máximo

Frequência relativa (%)

Associação com: uma quantitativa normal

Associação de Pearson

Associação de Spearman

–

Curva ROC

Associação com: uma quantitativa não normal

Associação de Spearman

–

Curva ROC

Comparação entre grupos independentes: dois grupos

Teste t para amostras independentes

Teste de Mann-Whitney

Teste do qui-quadrado

Comparação entre grupos independentes: três ou mais grupos

ANOVA

Teste de Kruskal-Wallis

Teste do qui-quadrado

Comparação entre medidas pareadas de um grupo: duas medições repetidas

Teste t pareado

Teste de Wilcoxon

Teste de McNemar ou κ de Cohen

Teste de Friedman

Teste de McNemar ou κ de Cohen

Objetivo

Comparação entre medidas ANOVA para medidas pareadas de um grupo: três ou repetidas mais medições repetidas Fonte: elaborada pelos autores.

TABELA 3.2

Análises multivariadas Variável em estudo

Variável dependente

Variáveis independentes

Abordagem estatística

Associação entre diversas quantitativas e uma média

Quantitativa normal: uma

Quantitativas normais

Regressão linear

Associação entre diversas variáveis e a chance de um evento

Qualitativa nominal dicotômica: uma

Diversas: qualquer tipo

Regressão logística

Associação entre diversas variáveis e uma média

Quantitativa normal: uma

Várias quantitativas normais e/ou qualitativas nominais

ANOVA univariada

Associação entre diversas variáveis e várias médias de medidas repetidas

Várias avaliações pareadas da mesma medida quantitativa normal

Várias quantitativas normais e/ou qualitativas nominais

ANOVA para medidas repetidas

Associação entre diversas variáveis e várias médias de medidas diferentes

Várias medições de medidas diferentes quantitativas normais

Várias quantitativas normais e/ou qualitativas nominais

ANOVA multivariada

Objetivo

Fonte: elaborada pelos autores.

TABELA 3.3

Estudos temporais Variável em estudo

Variável independente

Variável dependente

Abordagem estatística

Associação entre uma condição e o tempo até o evento

Qualitativa ordinal ou nominal: uma

Quantitativa

Kaplan-Meier

Associação entre diversas condições e o tempo até o evento

Qualitativas ou quantitativas: diversas

Quantitativa

Análise de regressão de Cox (proporção de risco de Cox)

Objetivo

Fonte: elaborada pelos autores.

03-Bioestatistica.indd 56

18/05/2021 17:46:56

Organização de Dados na Planilha do IBM® SPSS®  67

3 3 1

2 4 4

5 5

A A

B B

FIGURA 3.18 (A e B) Seleção de variáveis. Neste exemplo foi criado um filtro em que valores de número de horas em

que vê TV (horastv) fosse igual ou inferior a 11. Observe que o número 11, na linha 16, não foi selecionado e não será computado nas análises que seguirem esta etapa

Fonte: planilha do SPSS® editada pelos autores.

No caso de intervalo de dados Neste mesmo banco de dados, caso o desejo seja ava liar somente aqueles com idade entre 13 e 15 anos, procede-se da mesma maneira. No entanto, um inter valo referente aos dados da coluna idade será criado (Figura 3.19).

e, sim, por indivíduo, ou seja, todas as informações sobre um determinado caso serão selecionadas e, por consequência, nenhuma variável dos casos não selecionados fará parte da análise estatística realizada com base nesse tipo de seleção. Supondo-se, neste exemplo, que o pesquisador deseja incluir somente os dados presentes até a linha

No caso da seleção por faixa de casos

178, ou seja, meninas até o caso 178, esta poderia

Pode-se também utilizar a ferramenta para selecionar

balhando com dados retrospectivos obtidos de um

somente um determinado número de casos. Destaca-

banco de dados de um determinado hospital. Poderia

se aqui que a seleção não é realizada por variáveis

ocorrer, por exemplo, que os dados computados a

03-Bioestatistica.indd 67

ser uma situação em que o pesquisador estivesse tra

18/05/2021 17:47:02

68  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

4 4 3 3

1 1

2 2

A A 5 5 7 7 6 6

8 8 B B

FIGURA 3.19 (A e B) Seleção de casos de acordo com um intervalo de valores. 1. No quadro grupo de funções, seleciona-

-se Procurar. 2. Em funções e variáveis especiais, seleciona-se Range. 3. Transfere-se Range para a caixa que está sendo editada com o auxílio da seta. 4. O sinal ? surge na caixa de seleção com três opções (A). 5. Seleciona-se a variável para definir o intervalo (idade em anos). 6. Transfere-se a variável utilizando-se a seta. 7. Digitam-se os valores escolhidos para o intervalo (13 e 15). 8. Seleciona-se Continuar (B)

Fonte: planilha do SPSS® editada pelos autores.

partir do indivíduo 178 apresentassem muitas infor

Em todos os exemplos aqui citados para seleção de

mações faltantes ou incompletas que compromete

casos, pode-se salvar a planilha com os filtros ativos

riam as análises caso fossem considerados. Assim,

em arquivos separados. Basta digitar na opção “saí

neste caso, é apropriado encerrar as análises no

da” o nome do novo arquivo (Figura 3.21).

caso 178.

Os exemplos aqui apresentados encerram alguns

O caminho seria: selecionar “com base na hora

dos mais comuns relacionados com a edição de dados

ou faixa de caso” seguido da inclusão dos números 1

em planilhas do SPSS. Nos capítulos a seguir, serão

e 178 na caixa “selecionar casos: amplitude” (Figura

apresentados procedimentos estatísticos mais especí

3.20).

ficos para descrição ou análise de dados.

03-Bioestatistica.indd 68

18/05/2021 17:47:03

4 Identificação das Características de uma Amostra (Estatística Descritiva) Introdução Estatística descritiva é assim chamada por ser utilizada na descrição de fenômenos que, na área de Nutrição, dizem respeito às variáveis que conferem identidade a uma dada amostra ou população sob o ponto de vista de saúde. Pode-se descrever um grupo de indivíduos com dados qualitativos, por exemplo, identificando a frequência absoluta (número total de casos) ou relativa (percentual) de casos com e sem uma deficiência vitamínica, obesos e não obesos, que tiveram como desfecho óbito ou sobrevivência em função da desnutrição, entre outros. Bastante comum também é a descrição desses grupos por meio de medidas de tendência central e dispersão. Tais medidas remetem à ideia de conjunto, ou seja, o quanto os indivíduos que pertencem a um determinado grupo apresentam características similares ou divergentes e são representadas, basicamente, pela média, desvio-padrão, mediana e variância, como é o caso dos dados quantitativos como consumo de nutrientes em grama (g), medidas antropométricas em centímetro (cm), milímetro (mm) ou quilograma (kg), níveis circulantes de nutrientes em micrograma (µg) ou miligrama (mg), hormônios, lipoproteínas, entre outros. Essas medidas de tendência central e dispersão são discutidas ao longo desta obra; no entanto, surgem à medida que fazem parte das análises estatísticas mais comuns na área de Nutrição. Assim, para aqueles que estão iniciando sua experiência na área de pesquisa em Nutrição, é aconselhável acessar livros-textos básicos de bioestatística ou artigos de revisão que tratam do assunto, tais como Hazra e Gogtay (2016),1 Mishra et al. (2019).2 Pode-se encontrar também sugestões de como reportar essas medidas em artigos científicos.3,4

04-Bioestatistica.indd 71

Para observar um exemplo de estatística descritiva utilizando frequências relativas de dados de consumo alimentar, consultar Slater e Mudryj (2018);5 para dados clínicos, incluindo estado nutricional, consultar Olivares et al. (2019).6 No caso do exemplo de estatística descritiva envolvendo medidas de tendência central, com dados antropométricos e metabólicos, entre outros, consultar o trabalho de González-Quiroz et al. (2017).7 A identificação das características das variáveis é uma etapa inicial importante de uma pesquisa, pois é possível explorar os dados de modo a compreender a amostra a ser estudada e, assim, direcionar a melhor abordagem estatística e interpretação dos resultados. No caso de dados quantitativos, são sugeridas as seguintes tarefas antes de iniciar as análises propriamente ditas: A. Caracterização do comportamento dos dados quanto à sua distribuição (testes de normalidade). B. Identificação de dados com comportamento divergente em relação ao conjunto de dados (valores extremos e discrepantes). C. Recodificação de valores de acordo com a sua frequência no conjunto de dados (distribuição de frequências). Uma das preocupações iniciais do pesquisador é a observação da forma de distribuição das variáveis, quando quantitativas, pertencentes ao conjunto de dados a ser analisado. Tal preocupação é pertinente, considerando que o tipo de distribuição dos dados direciona a escolha dos testes estatísticos a serem aplicados nas etapas subsequentes, especialmente quando se tratam de amostras pequenas (até 30 ou 40 indivíduos). Este é o caso, em especial, de estudos clínicos quando se pretende comparar grupos de indivíduos. Cabe ressaltar, no entanto, que os valores extremos ou discrepantes citados (item B) podem ser

18/05/2021 17:54:36

72  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

resultantes de erros em várias etapas do estudos cien-

para o consumo de nutrientes indicado nas DRI tive-

tíficos, desde a seleção dos participantes e o uso ina-

ram como base o consumo alimentar da população

dequado de instrumentos,8 mas também podem ser

saudável de países desenvolvidos e complementados

característica de uma população que apresenta ver-

com estudos clínicos.10 Contudo, nem todos os nu-

dadeira heterogeneidade de um fenômeno clínico.

trientes apresentam um consumo homogêneo na po-

Assim, o fato de uma população apresentar alguma

pulação. Assim, diferentes recomendações são ado-

variável de interesse do pesquisador com distribuição

tadas com base no comportamento de cada variável/

não homogênea em torno da média aritmética dos

nutriente (Tabela 4.1).

dados não significa, obrigatoriamente, que haja al-

A distribuição normal (por vezes, chamada de pa-

gum erro metodológico na seleção de indivíduos ou

ramétrica) é caracterizada por uma simetria na dis-

na coleta de dados.

tribuição dos dados e curtose nula.11 Tal distribuição

Observe o exemplo das dietary reference intakes

é caracterizada por um gráfico em formato de sino

(DRI), a saber: estimated average requirement (EAR),

que pode ser observado na Figura 4.1, em que estão

recommended dietary allowance (RDA), adequate in-

apresentados os dados de consumo de vitamina C por

take (AI), upper limit (UL) e acceptable macronutrient

mulheres adultas saudáveis. Por ser uma distribuição

distribution ranges (AMDR). Os dados de referência

simétrica, a média é igual à mediana. Observa-se que

TABELA 4.1

Dietary reference intakes (DRI) e seu uso para a avaliação da ingestão energética e de nutrientes para estudos científicos

Referência

Para avaliação de grupos

Estimated average requirement (EAR): média de ingestão diária estimada para atender ao requerimento de metade dos indivíduos saudáveis em um determinado estágio da vida e sexo Mediana de ingestão

Utilizado para avaliar a prevalência de inadequação de ingestão de um grupo considerando-se como referência a população saudável da EAR

Recommended dietary alowance (RDA): média de ingestão diária suficiente para atender quase a totalidade de indivíduos (97% a 98%) saudáveis em um determinado estágio da vida e sexo RDA = EAR + 2SD

Não deveria ser utilizada para avaliação de grupos (só na avaliação de indivíduos)

Adequate intake (AI): média de ingestão diária recomendada baseada em aproximações ou estimativas de observações ou experimentos de um grupo (ou grupos) de indivíduos saudáveis – usada quando a RDA não pode ser determinada

Utilizada para avaliar a prevalência de inadequação de ingestão quando a EAR não está disponível. Deve ser observada com mais cuidado que a EAR quando não tiver sido estabelecido como a média de ingestão da população saudável

Tolerable upper intake level (UL): média de ingestão diária mais elevada e que provavelmente colocaria em risco de efeitos adversos à saúde todos os indivíduos saudáveis de um determinado estágio da vida e sexo

Utilizado para identificar a proporção da população que se encontra em risco ou fora de risco de ingestão excessiva

Estimated energy requirement (EER): requerimento energético estimado para manter o balanço energético de uma população saudável conforme idade, sexo, peso, estatura, nível de atividade física e estágio da vida (gestação, lactação)

Utilizado para identificar a proporção da população que se encontra acima, no intervalo ou abaixo desta amplitude determinada

Acceptable macronutrient distribution ranges (AMDR): faixa de ingestão de uma fonte de energia (carboidratos, proteínas e lipídios) que está associada a um risco reduzido de doença crônica, ainda garantindo quantidades adequadas de nutrientes essenciais. Expressado como percentual do total de energia ingerida. Os valores de referência variam entre limite superior e inferior

Utilizada para identificar a proporção da população que se encontra acima, no intervalo ou abaixo da amplitude determinada. Ingestão que estiver identificada abaixo ou acima da faixa estabelecida aumenta o potencial para um risco elevado de doenças crônicas, bem como o consumo inadequado de nutrientes essenciais

Prevalência de inadequação é referida como a porcentagem de um grupo com ingestão abaixo dos requerimentos. Fonte: adaptada de IOF, 2006.10

04-Bioestatistica.indd 72

18/05/2021 17:54:36

Identificação das Características de uma Amostra (Estatística Descritiva)  81

60,00 55,00

Máximo (Q3 + 1,5*IQR)

o19 o22

Valores discrepantes

MLGord0

50,00

3o quartil (P75)

45,00

Intervalo interquartil (Q3 – Q1)

40,00

Mediana (2o quartil, P50) 1o quartil (P25)

o10

35,00

Mínimo (Q1 – 1,5*IQR)

30,00 Exercício

Dieta

Exercício e dieta Grupo

FIGURA 4.6 Massa livre de gordura no tempo zero (MLGord0) para três grupos de tratamento: exercício; exercício e

dieta; dieta. O desenho indica a distribuição dos valores (em marrom) em torno da mediana (traçado preto), bem como o desvio-padrão e a indicação dos valores discrepantes indicados por círculos (o) com indicação da linha da planilha que localiza o caso em que estes valores se encontram. Nenhum valor extremo está presente nesta análise. Caso ocorresse, um sinal de * estaria indicando este valor. Q1: 1o quartil; Q3: 3º quartil; IQR: intervalo interquartil; P25: percentil 25; P50: percentil 50; P75: percentil 75 Fonte: resultado do SPSS® editado pelos autores.

amostra exerce uma função na quantidade de dados assinalados no diagrama de caixa e bigodes. Assim, não é aconselhável retirar os dados quando estes são apontados como discrepantes, sob o risco de manipulação tendenciosa de resultados. Mesmo no caso da identificação de valores extremos, não há indicação de retirada dos dados da análise, a não ser que seja identificada alguma incoerência em seu registro. Em geral, o teste de Shapiro-Wilk é aplicado para amostras até perto de 50 indivíduos e o teste de Kolmogorov-Smirnov é indicado para avaliar amostras maiores. Assim, no exemplo aqui utilizado, o teste mais indicado seria o primeiro citado que indicou somente a renda no grupo exercício e dieta como tendo uma distribuição não normal. Os critérios que podem ser observados para definição do tipo de distribuição estão resumidos na Tabela 4.6. Os pontos de corte do tamanho amostral apresentados na Tabela 4.6 devem ser entendidos como uma orientação, e os procedimentos apresentados devem ser complementados com uma análise dos gráficos relativos à distribuição. Adicionalmente, quando

04-Bioestatistica.indd 81

TABELA 4.6

Testes para observação da normalidade de uma amostra | Escolha do critério para definição do tipo de distribuição de uma amostra com base no tamanho aproximado da amostra

Critérios

Tamanho da amostra (n)

Teste de Shapiro-Wilk

Teste de Kolmogorov-Smirnov

50 a 100

Assimetria e curtose

>100

Fonte: adaptada de Razali e Wah, 2011.

pretendemos analisar a normalidade de diversas variáveis, deverá ser utilizado sempre o mesmo procedimento, mesmo quando o tamanho amostral esteja perto de 50 ou 100 indivíduos e haja valores omissos para algumas das variáveis. Distribuição

de frequências e valores por percentis

A apresentação de dados conforme a frequência em que existem em uma dada população é uma maneira

18/05/2021 17:54:39

82  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

também de descrever os achados de um trabalho científico. Esta é uma estratégia bastante utilizada em trabalhos observacionais tanto de incidência quanto de prevalência, pois melhora a visualização dos mesmos, especialmente quando se tem mais de 20 observações. A frequência absoluta consiste, basicamente, no número de vezes em que há ocorrência de um determinado valor correspondente a uma variável quantitativa ou de casos de uma variável qualitativa em um dado conjunto de dados. No caso da frequência relativa, os dados são apresentados em valores percentuais relativos ao número total de ocorrências verificado na fre quência absoluta. Quando a frequência é utilizada para descrever uma amostra, geralmente é apresentada no capítulo inicial de uma dissertação ou tese no momento em que se caracteriza a população estudada. No entanto, pode também ser utilizada em estudos populacionais de incidência e prevalência, como resultado da investigação. Ao pensar em incidência e prevalência, logo se faz uma associação com casos de doenças; no entanto, na área de Nutrição, além da incidência de doenças ligadas à alimentação, como obesidade e anemias carenciais, por exemplo, outras possibilidades têm sido exploradas, como é o caso da frequência no consumo de alimentos. Suponhamos que o pesquisador deseja observar o comportamento alimentar de meninos e meninas entre 5 a 10 anos de idade e entre préadolescentes de 10 a 14 anos de idade integrados a um dado Programa de Alimentação Escolar. Um dos focos consiste em verificar a frequência no consumo de alimentos ultraprocessados fora do ambiente escolar e estabelecer três categorias de consumo: regularmente, irregularmente e raramente. A identificação

TABELA 4.7

da frequência dividida entre meninos e meninas nos dois grupos de faixa etária e por categoria de fre quência pode então ser apresentada, como ilustrado na Tabela 4.7. Para dados que foram coletados com base em uma contagem de ocorrências para cada categoria apresentada, como o exemplo anterior, a apresentação da distribuição de frequências é uma forma razoável de exibir os dados. Já para dados quantitativos contínuos), caso não haja muitos casos coincidentes, como na questão do peso, por exemplo, a apresentação dos dados na forma de frequências não facilita sua observação. Neste caso, a estratégia mais adequada é a apresentação dos dados em percentis em que a ocorrência ocorre com base em pontos de corte. Para ilustrar o exposto, um exemplo relacionado com pacientes internados será utilizado (Figura 4.7), supondo-se que o pesquisador queira explorar os dados de número de dias de permanência na unidade de terapia intensiva (UTI) (variável quantitativa) e ocorrência de óbitos (variável qualitativa dicótoma). Como se pode observar na Figura 4.8, a escolha das variáveis a serem analisadas segue o mesmo padrão das caixas de diálogo do SPSS para qualquer análise. Via de regra, basta transferir as variáveis de interesse, com o auxílio da seta, para o espaço destinado às mesmas. Observe que, por padrão do programa, nesta caixa inicial já está marcado “Exibir tabelas de frequência”. Ao escolher, Estatísticas..., a janela que permite escolher o tipo de frequências fica então disponível. Nesta janela, há três opções para os percentis: 1. Divisão dos valores em quartis: o programa apresentaria o valor para os percentis 25, 50 e 75.

Exemplo de distribuição de frequências relativas (%) e absolutas (n) para consumo de alimentos (variável categorizada) entre meninos e meninas em duas faixas de idade Frequência no consumo de alimentos ultraprocessados fora do ambiente escolar 5 a 9,9 anos de idade

Meninos (n = 518/728) Meninas (n = 648/634)

10 a 14 anos de idade

Regularmente

Irregularmente

Raramente

Regularmente

Irregularmente

Raramente

51,7

31,7

16,6

55,4

40,4

4,2

268

164

403

294

54,2

33,3

12,7

31,7

21,3

351

215

201

135

298

Fonte: elaborada pelos autores.

04-Bioestatistica.indd 82

18/05/2021 17:54:39

5 Medidas de Associação com Variável Dependente Nominal Medidas de Associação | Teste Exato de Fisher e Teste do Qui-Quadrado para a Independência, e Regressão Logística em Estudos Observacionais Analíticos Coorte (de Incidência) e Transversais (de Prevalência) Como já mencionado anteriormente nos estudos observacionais, o pesquisador pode analisar o comportamento de uma população, seja ao longo do tempo (estudo coorte ou de incidência) ou em um dado momento no tempo (estudo transversal ou de prevalência). Nos dois casos, quando o pesquisador deseja encontrar explicações para eventos cuja incidência ou prevalência é observada na população, o desenho passa a ser analítico. Em geral, a análise feita envolve relações de causa-efeito, ou seja, buscam-se as causas dos eventos observados ou o risco que um determinado comportamento representa como potencial causador do problema observado. Podem-se citar como estudos longitudinais de incidência (coorte), estudos populacionais de grande porte como o Nurses’ Health Study (NHS), com mais de 40 anos de seguimento, e o Framingham Heart Study (FHS), que completou 70 anos em setembro de 2018.1,2 Estudos longitudinais de incidência (coorte) e de prevalência (transversais) são muito comuns na área de Nutrição, especialmente no levantamento de hábitos alimentares que possam evitar a incidência de doenças prevalentes na população mundial na atualidade, tais como obesidade, diabetes, doenças cardiovasculares, câncer, entre outras crônicas não transmissíveis. Nos grandes estudos citados, NHS e FHS, os hábitos alimentares e o uso de suplementos estão entre os fatores de risco ou de proteção estudados. Os estudos de prevalência (transversais) são mais comuns entre a comunidade acadêmica, considerando

05-Bioestatistica.indd 87

que o período de permanência do estudante em formação é relativamente curto, bem como o fato de os estudos transversais apresentarem menor investimento financeiro e de recursos materiais e humanos. Da mesma forma que nos estudos de incidência, nos estudos de prevalência há tentativas de explicar fatos e associar causa e efeito, devendo ser considerada a possibilidade de ocorrer causalidade inversa (ver Capítulo 1). Importante destacar que, nos estudos de prevalência, é muito comum que a abordagem de causa e efeito esteja relacionada a variáveis do tipo desfecho substituto (surrogate), ou seja, o efeito do fator causal é estudado por meio de variáveis que não caracterizam o desfecho em si, mas um desfecho intermediário ou substituto.3 Um exemplo seria estudar os efeitos da dieta sobre a microbiota fecal, na tentativa de estabelecer uma relação de causa-efeito entre dieta e câncer (cancro). Nesse tipo de estudo, é frequente explorar, por exemplo, a presença de ácidos graxos (gordos) de cadeia curta no material fecal, especialmente o butirato, uma vez que este tem sido associado à prevenção de câncer de cólon.4,5 No entanto, o estudo avalia o impacto da dieta sobre a produção desses ácidos graxos e não sobre a incidência de câncer propriamente dita (Figura 5.1). Do ponto de vista da estatística, obviamente, há diversas formas de se abordar as variáveis de estudos observacionais analíticos. Para uma abordagem didática e seguindo-se a apresentação de diversas análises estatísticas em uma sequência lógica de introdução aos modelos mais comuns, aqui serão abordadas as medidas de associação que buscam relação de causa- efeito. Tais medidas são constituídas, basicamente, de correlações ao investigar a relação entre duas variáveis qualitativas ou quantitativas. Quando se pretende estudar a relação simultânea entre diversas variáveis independentes sobre a variável de interesse (desfecho), usam-se regressões.6

18/05/2021 18:06:17

88  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

Fator causal

Desfecho substituto

Butirato fecal

Dieta

Lipoproteínas circulantes

Expressão de mTOR

Desfecho

Câncer de cólon

Infarto do miocárdio

Hipertrofia muscular

FIGURA 5.1 Diagrama demonstrativo de estudos transver-

sais em que se estuda a relação de uma variável causal sobre um provável desfecho, por meio de um desfecho substituto. Tanto o butirato quanto o perfil lipídico e a expressão do mTOR não são, de fato, os desfechos que se pretende relacionar com a dieta, e sim desfechos intermediários que são indicadores dos desfechos de fato Fonte: elaborada pelos autores.

Testes Estatísticos com Medidas de Associação | Modelos Comentados Teste

exato de Fisher e teste do qui-quadrado (Σ2) para a independência

Em geral, na área de Nutrição, busca-se com esses testes avaliar a distribuição de frequências de um determinado desfecho de acordo com grupos de risco. Os testes podem ser utilizados, por exemplo, para avaliar a amamentação como fator de risco (aleitamento materno exclusivo até seis meses de idade: sim ou não) sobre a incidência de doença inflamatória intestinal na vida adulta (diagnóstico da doença: sim ou não). A pergunta de investigação poderia ser formulada da seguinte maneira: a frequência de indivíduos com doença inflamatória intestinal calculada no conjunto de indivíduos que tiveram aleitamento materno exclusivo até 6 meses de idade é diferente da frequência de indivíduos com doença inflamatória intestinal calculada no conjunto de indivíduos que não tiveram aleitamento materno exclusivo até 6 meses de idade? Em estudos longitudinais clínicos, mais curtos em termos de seguimento, pode-se, por exemplo, verificar como fator de risco o déficit de ingestão energética superior a 10.000kcal em 15 dias de internamento na unidade de terapia intensiva (UTI) (acima de

05-Bioestatistica.indd 88

10.000kcal: sim e não) sobre a incidência de mortalidade (sim ou não). No caso de um estudo de prevalência, pode-se observar o impacto da frequência do consumo de frutas entre crianças sobre a prevalência de obesidade de forma transversal, ou seja, naquele momento do estudo, ou, ainda, quanto à distribuição de frequências de obesidade e eutrofia entre meninos e meninas em uma dada escola. Tratando-se de dados qualitativos, o número de participantes do estudo necessita ser relativamente elevado quando comparado a estudos clínicos experimentais em que se utilizam, mais frequentemente, as variáveis quantitativas. Assim, na área de Nutrição, o teste de Fisher e o teste do qui-quadrado têm sido aplicados em grandes estudos populacionais relacionando a incidência de doenças crônicas não transmissíveis a fatores de risco ou de proteção ligados à alimentação (consumo de gorduras saturadas, de carnes vermelhas, de antioxidantes) e em estudos de prevalência em escolares relacionando hábitos alimentares e desfechos relativos ao estado nutricional. Em estudos experimentais, o seu uso é menos frequente; em algumas situações, no entanto, pode ser útil para testar o impacto de uma intervenção sobre um desfecho clínico. O teste de Fisher pode ser calculado para avaliar a independência entre duas variáveis de forma exata para tabelas 2 × 2 e pode-se obter um valor assimptótico para tabelas de qualquer dimensão, podendo estes cálculos serem mais demorados. O teste do qui-quadrado é uma boa aproximação à avaliação da independência quando a amostra é suficientemente grande, devendo a contagem esperada em cada célula (ou seja, em cada combinação de casos) ser superior a 5. Nesse caso, o que ocorre é que, algumas vezes, o tamanho da amostra é muito pequeno ou o número de categorias é demasiadamente grande, resultando em baixa frequência de casos entre as categorias. Em tal situação, poderá ser útil o agrupamento de alguns casos em uma mesma categoria. Para uma revisão sobre o agrupamento de variáveis, pode-se consultar o Capítulo 2. Caso o agrupamento venha a comprometer os objetivos do pesquisador, o teste de Fisher é mais viável. Assim, pode-se adotar como critério para escolha de um dos testes: amostras pequenas com frequência absoluta de desfechos esperados menor do que 5 em mais de 20% das células = exato de Fisher; amostras maiores, caso as contagens atendam ao pressuposto

18/05/2021 18:06:17

6 Medidas de Associação com Variável Dependente Quantitativa Medidas de Associação | Correlação e Regressão Linear em Estudos Observacionais Analíticos Coorte (de Incidência) e Transversais (de Prevalência) No Capítulo 5 foram apresentadas medidas de associação em que as variáveis dependentes eram qualitativas, sendo que as variáveis independentes poderiam ser qualitativas (qui-quadrado) ou quantitativas e qualitativas (regressão logística). Nesses casos, quando se trata de um desenho do tipo coorte em que o tempo de seguimento é longo e é possível aguardar pelo desfecho que caracteriza uma condição clínica colocada como doente ou não doente, melhora ou piora, ou, ainda, morte (sim ou não) ou infarto agudo do miocárdio (IAM) (sim ou não), por exemplo, fica claro que a regressão logística e o qui-quadrado ou teste exato de Fisher serão os métodos estatísticos a escolher. No caso do IAM, por exemplo, pode-se associar o consumo semanal de gorduras saturadas (em % da energia diária consumida) com esse desfecho binário por meio da regressão logística. Entretanto, em um estudo clínico, mesmo que longitudinal, em que não é possível aguardar o tempo suficiente para um desfecho definitivo como IAM (sim ou não), pode-se utilizar um desfecho intermediário quantitativo (para mais exemplos de desfechos intermediários, ver Capítulo 5, Figura 5.1) que, neste caso, poderão ser os níveis séricos de colesterol em mg/dL. Assim, em alguns casos, o pesquisador pode precisar estabelecer associações entre variáveis exclusivamente quantitativas. Nesse contexto em que a associação entre duas medidas quantitativas é proposta, a correlação ou regressão linear simples1 é aplicável (consumo de gordura saturada em % de energia diária consumida versus níveis séricos de colesterol em mg/dL). Ao incluir no modelo mais de uma variável

06-Bioestatistica.indd 109

independente, mantendo-se o caráter exclusivamente quantitativo, a regressão linear múltipla2,3 é aplicável, por exemplo, na avaliação da associação do consumo semanal de gordura saturada e idade (em anos) versus níveis séricos de colesterol. Com base nessas condições, os modelos de correlação e de regressão linear com a interpretação de algumas análises básicas4-6 serão apresentados neste capítulo. Existe também a possibilidade da aplicação de modelos mistos (mixed models); no entanto, não é o foco da presente obra tratar de tais modelos. A base dos dois modelos que serão aqui explorados é verificar se as unidades de uma variável variam na mesma direção que outra ou em direção oposta. Uma correlação positiva significa que valores mais elevados em uma variável estão associados a valores, em média, mais elevados na outra; enquanto em uma correlação negativa valores mais altos de uma variável estão associados a valores, em média, mais baixos da outra. Uma correlação (muito próxima) de zero indica que valores diferentes de uma das variáveis estarão associados, em média, ao mesmo valor da outra variável. Para visualização dessas duas situações, a Figura 6.1 traz o gráfico de correlação entre consumo de gordura saturada (% da energia diária consumida) e níveis de LDL-colesterol (mg/dL), que apresentaram uma correlação positiva, bem como o gráfico de correlação entre consumo de fibras dietéticas (g/dia) e níveis de colesterol, que apresentaram uma correlação negativa.

Testes Estatísticos com Medidas de Associação | Modelos Comentados Correlação

de Pearson (R) e Spearman ()

O modelo mais simples de associação entre variáveis quantitativas ou qualitativas ordinais é o da correlação

18/05/2021 18:14:42

110  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Associação entre ingestão de gorduras saturadas de LDL-colesterol sérico 300 275 250 225 200 175 150 125 100 75 50 25 0 5

Gorduras saturadas ingeridas (% da energia total diária)

Associação entre ingestão de fibras dietéticas e LDL-colesterol sérico

B HDL-colesterol sérico (µg/mL)

HDL-colesterol sérico (µg/mL)

180 160 140 120 100 80 60 40 20 0 8

Fibras dietéticas ingeridas (g/dia)

FIGURA 6.1 (A e B) Representação gráfica de correlação positiva entre ingestão de gorduras saturadas e LDL-colesterol sérico (A) e negativa entre ingestão de fibras dietéticas e LDL-colesterol sérico (B). Observa-se que, no exemplo (A) as medidas crescem na mesma direção e, no exemplo (B) em direções opostas. A análise da correlação não propõe relação de dependência; no entanto, convencionou-se o uso do modelo adotado em regressão linear em que a suposta variável dependente estaria no eixo Y e a independente estaria no eixo X. Os valores são hipotéticos e escolhidos para tornar clara a relação entre as variáveis; contudo, em dados de consumo e de controle metabólico como neste exemplo, as associações tendem a ser menos lineares Fonte: elaborada pelos autores.

que avalia se há uma relação linear entre duas variáveis. Na área de Nutrição, é comumente aplicado nas seguintes situações: Na associação entre duas variáveis em que se busca uma relação de dependência linear entre elas, podendo ser ou não uma etapa prévia à análise de regressão linear. Em estudos de validação, como um dos passos para verificar se um equipamento em teste consegue mostrar que a variável por ele detectada segue o mesmo padrão de um equipamento já validado. Em testes de concordância entre ou intra-avaliadores, como uma etapa que antecede outros cálculos. Observe que, no caso da verificação de dependência entre duas variáveis, a correlação pode ser utilizada como uma etapa inicial de estudos que pretendem estabelecer relação de causa-efeito; no entanto, não é possível chegar a tal conclusão somente com essa medida de associação. Da mesma forma, no caso de validação ou de concordância, a correlação também é utilizada como etapa preliminar e outros testes deverão ser aplicados (ver Capítulo 10). No primeiro caso, é possível observar uma correlação positiva ou negativa no caso de existir dependência entre as variáveis em estudo, enquanto nos estudos de validação ou de concordância a correlação deverá ser positiva e elevada.

06-Bioestatistica.indd 110

Quanto ao comportamento das variáveis quantitativas ou qualitativas ordinais a serem analisadas nos estudos de correlação, quando ambas as variáveis são quantitativas e apresentam distribuição normal, utiliza-se a associação de Pearson (R) e, nos outros casos, a correlação de Spearman (ρ)2.7 Para exemplificar uma situação em que a correlação seria útil, imaginemos uma situação que seria uma alternativa para complementar o exemplo utilizado no Capítulo 5 para o qui-quadrado em que se buscou resposta para a seguinte pergunta científica: a frequência de obesos entre meninos é diferente de obesos entre meninas que estudam em escolas públicas da cidade x? Como o resultado do qui-quadrado indicou que há risco maior de obesidade entre as meninas, o pesquisador poderia explorar esse achado, perguntando, por exemplo: há associação entre o índice de massa corporal (IMC) (kg/m2) das meninas e o consumo semanal de carboidratos simples (g/kg de peso)? Neste caso, dado que são duas variáveis quantitativas, a correlação seria aplicada. Após a verificação do comportamento das variáveis, se ambas apresentassem distribuição normal, a correlação de Pearson seria aplicada. Por exemplo, ao estudar a associação entre o IMC e o bem-estar de cada pessoa com relação à sua imagem corporal (em uma escala ordinal entre 0 e 10), poderia ser observado que as pessoas com pior

18/05/2021 18:14:43

Medidas de Associação com Variável Dependente Quantitativa  125

FIGURA 6.14 Etapas para ordenar casos da coluna das distâncias de Mahalanobis em ordem crescente Fonte: planilha do SPSS®.

TABELA 6.10

Valores da distribuição do qui-quadrado

P GL

0,995

0,975

0,20

0,10

0,05

0,025

0,02

0,01

0,005

0,002

0,001

0,0000393

0,000982

1,642

2,706

3,841

5,024

5,412

6,635

7,879

9,550

10,828

0,0100

0,0506

3,219

4,605

5,991

7,378

7,824

9,210

10,597

12,429

13,816

0,0717

0,216

4,642

6,251

7,815

9,348

9,837

11,345

12,838

14,796

16,266

0,207

0,484

5,989

7,779

9,488

11,143

11,668

13,277

14,860

16,924

18,467

0,412

0,831

7,289

9,236

11,070

12,833

13,388

15,086

16,750

18,907

20,515

0,676

1,237

8,558

10,645

12,592

14,449

15,033

16,812

18,548

20,791

22,458

0,989

1,690

9,803

12,017

14,067

16,013

16,622

18,475

20,278

22,601

24,322

1,344

2,180

11,030

13,362

15,507

17,535

18,168

20,090

21,955

24,352

26,124

1,735

2,700

12,242

14,684

16,919

19,023

19,679

21,666

23,589

26,056

27,877

2,156

3,247

13,442

15,987

18,307

20,483

21,161

23,209

25,188

27,722

29,588

2,603

3,816

14,631

17,275

19,675

21,920

22,618

24,725

26,757

29,354

31,264

3,074

4,404

15,812

18,549

21,026

23,337

24,054

26,217

28,300

30,957

32,909

3,565

5,009

16,985

19,812

22,362

24,736

25,472

27,688

29,819

32,535

34,528

4,075

5,629

18,151

21,064

23,685

26,119

26,873

29,141

31,319

34,091

36,123

4,601

6,262

19,311

22,307

24,996

27,488

28,259

30,578

32,801

35,628

37,697

GL: graus de liberdade. Fonte: disponível em https://www.ime.unicamp.br/~hlachos/TabelaQuiQuadrado.pdf.

pontos de interrogação. Transfere-se então a variável que recebeu o nome de Mahalanobis distance para o espaço e, em seguida, substitui-se o segundo ponto de interrogação pelo número 3, que corresponde aos graus de liberdade (três variáveis independentes). Ao pressionar OK, surge uma nova coluna com os valores de p para cada observação. São considerados valores discrepantes aqueles que tiverem p<0,001. A maior distância de Mahalanobis deste exemplo apresentou

06-Bioestatistica.indd 125

um valor de p = 0,07 e, portanto, não se trata de um valor discrepante. Também é possível observar as distâncias de Cooks30 que deveriam ser, preferencialmente, menores que 1. Alguns poucos valores acima das distâncias de Mahalanobis e Cooks não seriam problemáticos em um banco de dados de uma amostra grande; no entanto, muitos valores acima das distâncias máximas esperadas deveriam ser observados com mais

18/05/2021 18:14:48

126  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

4 1

5 7 B

FIGURA 6.15 (A a C) Cálculo do valor de p para as distâncias de Mahalanobis considerando a partição do qui-quadrado para três graus de liberdade. Valores inferiores a 0,001 são considerados discrepantes e devem ser excluídos da análise um a um. A cada exclusão, as distâncias devem ser novamente calculadas para identificação de valores discrepantes, pois se trata de uma análise multivariada Fonte: planilha do SPSS® editada pelos autores.

06-Bioestatistica.indd 126

18/05/2021 18:14:49

8 Estudos Experimentais com Comparação entre Três ou Mais Grupos Independentes Comparação de Médias e Ordenações (Rankings) em Estudos Experimentais com Três ou Mais Grupos Independentes Para este tópico, serão abordados modelos relacionados com comparação de dois ou mais grupos experimentais, embora os testes a serem apresentados não sejam exclusivos para esse tipo de desenho científico. Quando houver a necessidade de comparar mais de dois grupos em um estudo experimental, a análise da variância (ANOVA) é preferível em relação ao teste t de Student, por exemplo.1,2 A estatística de F ou razão F é usada na ANOVA. Embora possa também ser usada no teste t, há algumas diferenças importantes entre os dois testes. Primeiro: com ANOVA, pode-se comparar mais de dois grupos com um poder estatístico maior. Segundo: covariáveis podem ser incluídas no modelo, o que permite controlar confundidores e detectar interações quando uma variável modera o efeito de outra variável.3 Há de se compreender a variância intragrupos e entre grupos para perceber a vantagem do uso da ANOVA em relação ao teste t, bem como entender os resultados obtidos ao aplicar este teste. Assim como no caso do teste t, a realização dos testes paramétricos para comparação de mais de dois grupos exige homogeneidade da variância dentro de cada grupo (intragrupos), ou seja, os dados dos indivíduos pertencentes a um mesmo grupo devem estar distribuídos homogeneamente em torno de suas médias. Assim, quanto mais homogêneos os grupos a serem comparados, menor a probabilidade de assumir que há diferença entre eles ao acaso. Compreendendo-se a importância da homogeneidade intragrupos, que pode ser avaliada com testes de normalidade, no caso da ANOVA, pretende-se avaliar se as médias de cada grupo (tratamento) se

08-Bioestatistica.indd 149

encontram próximas à média do total de indivíduos estudados (médias dos valores de todos os indivíduos dos três ou mais grupos). Esta é a variação entre grupos. Um aspecto importante da análise da variância é que se trata de um teste F em que há um ajuste entre a variância intragrupos e entre grupos para identificar se os grupos pertencem ou não a uma mesma população. A razão da variância entre grupos em relação à variância intragrupos é calculada (F). Quanto maior for o valor de F, maior a probabilidade de os grupos estudados não pertencerem à mesma população, ou seja, serem diferentes.1,3 Observe na Figura 8.1: a variância de três grupos pode ser visualizada nas linhas cheias, e a variância total dos grupos, ou seja, a média de todos os valores (grupo 1 + grupo 2 + grupo 3) pode ser visualizada na linha pontilhada. Embora a amplitude do grupo 3 em relação ao grupo 1 seja maior, as médias desses dois grupos encontram-se no intervalo de confiança do gráfico (variância total), indicando que pertencem à mesma população. Já no caso do grupo 2, a média encontra-se afastada do intervalo de confiança da população. Assim, assume-se que há diferença entre os grupos. Para observar mais figuras conceituais em relação à ANOVA, consultar Kim (2004)1 e Kim (2017).4 É fundamental compreender que quanto maior a variação intragrupos, menor a possibilidade de identificar diferenças entre os grupos, visto que a variância entre grupos será dividida pela variância intragrupos. Trata-se de uma forma de evitar que a diferença entre grupos ocorra ao acaso, dadas as variações entre indivíduos pertencentes a um mesmo grupo. Diferentemente do teste t, no caso da ANOVA, há necessidade de realização de testes a posteriori (post hoc) para identificar as diferenças entre grupos par a par. O teste de Bonferroni (mais conservador) e o teste de Tukey são comumente utilizados. No caso

18/05/2021 18:36:15

150  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

Variância total 3

FIGURA 8.1 Desenho esquemático simplificado do contexto da análise da variância. Comparação de três grupos (linhas cheias) com base na variância total dos grupos que representa toda a população (linha pontilhada). As setas indicam a posição das médias. Os grupos 1 e 3 parecem pertencer à mesma população, visto que as médias se encontram dentro do intervalo de confiança da população. O grupo 2 parece não pertencer à mesma população. Um teste adicional (post hoc) é necessário para identificar as diferenças para o par (entre 1 e 2; 1 e 3; 2 e 3) Fonte: elaborada pelos os autores.

da análise Bonferroni, há um ajuste do erro do tipo I (valor de p) com base no número de comparações a serem realizadas (número de pares a serem comparados). No caso do teste de Tukey, calcula-se a diferença mínima significativa entre as médias (variáveis dependentes) de cada comparação entre grupos para considerá-los diferentes entre si.5 Tomando, em conjunto, o exposto, observam-se três pressupostos básicos para a ANOVA:3 A variável de desfecho (dependente) deveria apresentar distribuição normal, embora o teste F seja robusto a violações desta natureza, ou seja, o erro do tipo I parece não ser gravemente afetado por populações mais desviadas da média. A variância em cada grupo deve ser a mesma (homogeneidade da variância), o que pode ser avaliada pelo teste de Levine. As observações devem ser independentes, ou seja, não podem estar correlacionadas entre elas. Destaca-se que, embora em alguns casos recorra- se ao uso do teste t de Student para comparação de três grupos realizando comparações de médias par a par, por exemplo, média do grupo 1 e média do grupo 2; média do grupo 2 e média do grupo 3; média do grupo 1 e média do grupo 3, esta não é uma alternativa adequada, uma vez que não há percepção da variância neste caso, aumentando-se, assim, o risco de erro tipo I. Dessa forma, corre-se o risco de rejeitar

08-Bioestatistica.indd 150

H0 quando, na verdade, dois ou mais grupos podem pertencer à mesma população (para revisão dos erros do tipo I e II, ver Capítulo 2, item: Erros que o pesquisador assume ao responder à pergunta científica utilizando-se da estatística).

Testes Estatísticos para Comparação de Médias e Ordenações com Três ou Mais Grupos Independentes: Modelos Comentados Análise

da variância (ANOVA, paramétrico)

Ao colocar esta breve explanação dos conceitos envolvendo a variância em um contexto de estudos experimentais, quando os grupos a serem comparados (variável independente) e o desfecho (variável dependente) referem-se a um único fator, utiliza-se a ANOVA unidirecional. Para contextualizar o modelo da ANOVA unidirecional, observe o exemplo a seguir. Sabe-se que a digestibilidade das proteínas do soro de leite de vaca é baixa, dado o alto teor da proteína betalactoglobulina, cuja estrutura globular limita o acesso das enzimas digestivas humanas à sequência de aminoácidos a serem clivados durante a digestão. Suponhamos que um pesquisador proponha dois tipos de tratamentos que afrouxem essa estrutura globular, permitindo, assim, que esta esteja mais disponível para que a digestão ocorra. Neste caso, a pergunta científica seria: o uso de tratamento X1 e X2 para mudar a conformação das proteínas do soro do leite aumenta a eficácia da digestão enzimática realizada por 30min? Neste caso, serão três grupos a comparar: a proteína nativa (controle), a proteína submetida ao tratamento X1 e a proteína submetida ao tratamento X2. Esse tipo de experimento é realizado in vitro, ou seja, a digestão é mimetizada em tubos de ensaio em que se adiciona a proteína em uma dada diluição e juntam-se as enzimas digestivas adquiridas em laboratórios especializados. A avaliação da digestibilidade das proteínas é verificada pela dosagem de proteínas na solução após 30min de tratamento. Este é o caso da digestão por pepsina que visa mimetizar a digestão no estômago. Nesse exemplo, as proteínas

18/05/2021 18:36:15

9 Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas Comparação de Médias e Ordenações (Rankings) em Estudos Experimentais com Dois Grupos ou Mais Pareados Diferentemente da análise da variância (ANOVA) para grupos independentes, quando a comparação é feita entre diferentes grupos ao longo do tempo, a análise se torna mais complexa, pois, além de comparar os grupo entre eles (avaliação entre grupos), espera-se comparar cada grupo separadamente ao longo do tempo (avaliação intragrupos), bem como a interação tempo*grupos, ou seja, comparação dos grupos entre si em cada um dos tempos avaliados.1,2 Como complemento da Figura 8.1, no Capítulo 8, que demonstra a ANOVA, pode-se sugerir o desenho da Figura 9.1, a fim de apresentar de maneira simplificada a ANOVA com medidas repetidas (distribuição normal). A partir das perguntas científicas a seguir, pode-se imaginar dois exemplos: A utilização de tratamentos químicos 1, 2, 3 e 4, a fim de mudar a conformação das proteínas do soro do leite, aumenta a eficácia da digestão enzimática ao longo de 1h30m? Neste caso, o experimento será realizado em duas etapas: primeiro, a solução de proteínas será submetida ao tratamento enzimático com pepsina por 30min, seguida do tratamento com tripsina por adicionais 60min. Durante a digestão, amostras do soro de leite serão coletadas a cada 15min para análise do conteúdo de proteína remanescente em uma bateria de 16 tubos de ensaio (quadruplicatas de cada um dos quatro tratamentos). Assim, será possível construir uma cinética da digestão com sete dosagens de proteína (0, 15, 30, 45, 60, 75 e 90min) fruto da média de quatro repetições para cada medida.

09-Bioestatistica.indd 167

No caso desta pergunta, não há preocupação com confundidores, e sim com as condições do experimento, ou seja, procedência dos reagentes, acurácia dos equipamentos e habilidades técnicas de quem realiza o experimento. O tratamento dietético, aliado ou não a medicamento (tratamentos 1, 2 e 3), melhora níveis de glutamina sanguínea, ao longo de 3 meses, em crianças de 12 a 18 anos de idade com diarreia crônica? Neste caso, os adolescentes seriam selecionados de uma clínica localizada em um hospital escola. Como as variáveis confundidoras são uma preocupação em estudos com humanos, randomização e critérios de exclusão que permitam melhorar a homogeneidade do grupo são importantes. Assim, o quadro clínico dos adolescentes e o estado nutricional deverá ser similar, por exemplo. A dosagem será realizada mensalmente (tempos 1, 2 e 3). Importante destacar que, no exemplo do estudo das proteínas do soro de leite para comparação de três grupos independentes, foi possível sugerir os atalhos para ANOVA unidirecional ou modelo geral linear (GLM; do inglês, general linear model) (Figuras 8.4 e 8.7, Capítulo 8). Já no caso das medidas repetidas (dados pareados), o GLM é a única opção, pois traz as derivações mais complexas da ANOVA.3,4 Nesta publicação, os exercícios demonstrados no SPSS® dizem respeito a alguns modelos de ANOVA; no entanto, é importante a compreensão dos outros modelos que devem ser utilizados em análises mais complexas, especialmente naquelas em que há presença de covariáveis confundidoras, comum em estudos não randomizados realizados em humanos em que se esperam variações entre grupos ou pouca homogeneidade entre grupos a serem comparados. Brevemente, é possível citar: ANCOVA (análise de covariância) em que outras variáveis, além da variável independente principal (também chamada de fator),

18/05/2021 19:05:09

168  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

Tempo 2 Variância total Tempo (grupo 1) 1 Tempo 3

Tempo 2 Variância total Tempo (grupo 2) 1 Tempo 3

Tempo 2 Variância total Tempo (grupo 3) 1 Tempo 3 A. Para cada análise intragrupo, análises a posteriori serão realizadas para identificar as diferenças de cada grupo entre os tempos, a saber: tempo 1 e 2, tempo 1 e 3 e tempo 2 e 3

Grupo 2 Variância total Grupo (tempo 1) 1 Grupo 3

Grupo 2 Variância total Grupo (tempo 2) 1 Grupo 3

Grupo 2 Variância total Grupo (tempo 3) 1 Grupo 3

B. Da mesma forma que na avaliação dos tempos para os diversos grupos, na avaliação dos diversos grupos para cada tempo, análises a posteriori são necessárias para identificar em cada tempo a diferença entre grupos 1 e 2, grupos 2 e 3 e grupos 1 e 3

FIGURA 9.1 Desenho esquemático simplificado do contexto da análise da variância para medidas repetidas. Comparação

de três grupos e três tempos (linhas cheias) com base na variância total dos grupos nos tempos e grupos (linhas pontilhadas). As setas indicam a posição das médias Fonte: elaborada pelos autores.

09-Bioestatistica.indd 168

18/05/2021 19:05:09

Estudos Experimentais com Comparação entre Três ou Mais Avaliações Pareadas  191

Dados

Arquivo dividido

Analisar todos os casos: não criar grupos

Analisar

Teste não paramétrico

Caixas de diálogo legadas

2 amostras independentes

1 4

3 6 7

FIGURA 9.19 Etapas para solicitação do teste de Mann-Whitney a ser utilizado como teste a posteriori de Fisher para comparação entre grupos. O resultado será a comparação de cada grupo nos diferentes tempos, sem considerar a com paração intragrupos. Grupos refere-se ao nome que foi dado pelo pesquisador à coluna que identifica os grupos de tra tamento (p. ex., 1 = fórmula 1; 2 = fórmula 2; 3 = fórmula 3). É necessário identificar os grupos em três etapas e, sempre que a opção for modificada, deve-se realizar a análise e voltar à etapa da definição dos grupos para substituir os pares. Por exemplo: grupos 1 e 2; 2 e 3 e 1 e 3 Fonte: planilha do SPSS® editada pelos autores.

TABELA 9.12

Resultado do teste de Wilcoxon Teste de classificações assinadas por Wilcoxon

Grupos = Fórmula 1 Estatísticas de testea,b

Risco_mortal_2 Risco_mortal_1

Risco_mortal_3 Risco_mortal_1

Risco_mortal_3 Risco_mortal_2

– ,795c

–1,136c

– ,475c

Significância Sig. (bilateral)

,426

,256

,635

GRUPOS = Fórmula 1 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos a

(continua)

09-Bioestatistica.indd 191

18/05/2021 19:05:19

192  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

TABELA 9.12

Resultado do teste de Wilcoxon (continuação)

Grupos = Fórmula 2 Estatísticas de testea,b

Risco_mortal_2 Risco_mortal_1

Risco_mortal_3 Risco_mortal_1

Risco_mortal_3 Risco_mortal_2

– ,562c

–2,975d

–3,225d

Significância Sig. (bilateral)

,574

,003

,001

Risco_mortal_2 Risco_mortal_1

Risco_mortal_3 Risco_mortal_1

Risco_mortal_3 Risco_mortal_2

– ,036c

–3,292c

–3,348c

Significância Sig. (bilateral)

,972

,001

GRUPOS = Fórmula 2 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos d Com base em postos positivos a

Grupos = Fórmula 3 Estatísticas de testea,b

GRUPOS = Fórmula 3 Teste de classificações assinadas por Wilcoxon c Com base em postos negativos a

Há mudanças no risco de mortalidade, a partir da segunda avaliação (tempo 2) para os grupos submetidos ao tratamento 2 (fórmula enteral 2) e 3 (fórmula enteral 3). Fonte: resultados do SPSS®.

TABELA 9.13

Resultado do Teste de Mann-Whitney Testes de NPar Teste de Mann-Whitney

Grupos 1 e 2 Estatísticas de teste

U de Mann-Whitney

Risco_mortal_1

Risco_mortal_2

Risco_mortal_3

232,000

230,000

140,000

Wilcoxon W

508,000

506,000

393,000

– ,478

– ,523

–2,577

Significância Sig. (bilateral)

,633

,601

,010

Risco_mortal_1

Risco_mortal_2

Risco_mortal_3

Grupos 2 e 3 Estatísticas de teste

U de Mann-Whitney

174,500

199,000

47,000

Wilcoxon W

427,500

452,000

300,000

–1,787

–1,230

–4,692

Significância Sig. (bilateral)

,074

,219

,000 (continua)

09-Bioestatistica.indd 192

18/05/2021 19:05:19

10 Estudos Diagnósticos e Prognósticos

Introdução Os desenhos científicos relacionados com modelos diagnósticos e prognósticos são geralmente discutidos em tópicos separados dos desenhos clássicos epidemiológicos e experimentais, uma vez que, na área de saúde, são mais comumente direcionados à pesquisa clínica. Neste capítulo, serão apresentados alguns exemplos de modelos diagnósticos e prognósticos, com os respectivos métodos estatísticos. Em um primeiro momento, os modelos diagnósticos e prognósticos que serão abordados referem-se a alguns casos em que se pretende identificar características de indivíduos que possam indicar se estes têm, no momento da avaliação, um determinado diagnóstico (p. ex., desnutrição) ou, ainda, se são candidatos a apresentar uma condição favorável ou não no futuro (p. ex., mortalidade por elevada perda de peso após ressecção cirúrgica). Assim, o modelo diagnóstico deve ser capaz de discriminar indivíduos em grupos de acordo com uma condição já existente, e o modelo prognóstico deve ser capaz de dividir indivíduos entre possibilidades ou risco de vir a ter um evento no futuro.1-4

Modelos Diagnósticos em Nutrição Na área de saúde, é muito comum o uso de critérios para classificar indivíduos como saudáveis ou não, ou identificá-los em uma condição mais grave ou menos grave. Para compreender este tipo de modelo, é fundamental salientar que quando um pesquisador busca uma ferramenta para avaliar enfermos, pretende identificar uma que possa indicar indivíduos que necessitem de um suporte mais especializado por já apresentarem algum desfecho desfavorável e que pode ser, por exemplo, diagnóstico de uma doença ou outra

10-Bioestatistica.indd 195

situação que possa dividir um grupo de acordo com duas possibilidades, ou seja, presença ou ausência de uma condição favorável ou desfavorável. Neste caso, as perguntas científicas poderiam ser: O índice de massa corporal (IMC) de indivíduos acometidos por insuficiência renal crônica (IRC), quando calculado após a hemodiálise, é capaz de discriminar indivíduos entre eutróficos e obesos? O nível de transferrina plasmática é capaz de discriminar indivíduos entre desnutridos e eutróficos? A glicemia de jejum é capaz de discriminar indivíduos com e sem diabetes? Após a cirurgia bariátrica, o percentual de perda de excesso de peso (%PP) é capaz de discriminar adolescentes como: tendo ou não resolução de resistência insulínica? O número de refeições na escola é capaz de discriminar crianças carentes entre desnutridas e eutróficas? O número de frutas consumidas semanalmente é capaz de discriminar crianças entre obesas e eutróficas? Tomando-se os exemplos citados, é necessária a definição de uma variável de interesse (IMC, níveis de transferrina, glicemia de jejum, %PP, número de refeições, número de frutas consumidas) e que possa servir para distinguir os indivíduos entre tendo uma condição ou não (obesidade, desnutrição, diabetes, resistência insulínica). O pesquisador busca, então, modelos diagnósticos em que se definirá um ponto de corte nos valores de IMC, níveis de transferrina, glicemia de jejum, %PP, número de refeições na escola e número de frutas consumidas na semana, de modo a separar os indivíduos entre duas possibilidades, ou seja, entre eutróficos e obesos; desnutridos e eutróficos; diabéticos e não diabéticos; e com resistência à insulina e saudáveis, entre outros

18/05/2021 19:14:47

196  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS® Desnutrição

substituto

como desfecho

No caso da ciência da Nutrição, os modelos diagnósticos são comumente aplicados para discriminar indivíduos com base nos chamados surrogate outcomes, ou seja, desfechos substitutos ou intermediários.5,6 Por exemplo, no caso da identificação do ângulo de fase (AF), medido por bioimpedância elétrica, para detectar desnutrição entre pacientes graves, a desnutrição seria um diagnóstico que teria função preditora de mortalidade. Assim, neste caso, a desnutrição é um desfecho substituto, pois indica risco de mortalidade que seria o desfecho de fato (Figura 10.1). Para elaborar um modelo diagnóstico, tendo a desnutrição como desfecho, o pesquisador poderia seguir as seguintes etapas: Identificar um grupo de pacientes pertencentes a uma população homogênea quanto às suas características individuais, inclusive quanto à uma determinada condição clínica. Classificar esses indivíduos de acordo com o seu estado nutricional, por meio de uma ferramenta validada. Realizar uma nova medida de interesse, por exemplo, o AF, com os indivíduos nas mesmas condições em que foram avaliados quanto ao estado nutricional. Aplicar um método estatístico para verificar se existe a possibilidade de identificar um ponto de corte dos níveis de AF (variável quantitativa) que possa discriminar os indivíduos de acordo com o estado nutricional (variável qualitativa binária). Tomemos outro exemplo hipotético. Um pesquisador pode ter como linha de pesquisa critérios “diagnósticos em nutrição”. Em um de seus trabalhos, estabelece um ponto de corte de transferrina sérica

Ângulo de fase medido por BIA

que caracteriza indivíduos internados em uma clínica cirúrgica como desnutridos ou eutróficos. Em seguida, define outros pontos de corte em que o nível de transferrina é inferior ao primeiro ponto de corte estabelecido e cria um critério para dividir os indivíduos em desnutrido leve ou moderado, ou em moderado e grave (Tabela 10.1). Na primeira linha da tabela, o ponto de corte foi escolhido para discriminar o indivíduo como desnutrido ou não a partir de um valor de transferrina circulante (ponto de corte 225mg/dL), e na segunda e terceira linhas, seria o caso de identificar os indivíduos entre desnutrição e desnutrição moderada e entre desnutrição moderada e desnutrição grave ou não a partir de outros pontos de corte da mesma proteína. Este tipo de classificação é muito comum na área de Nutrição; no entanto, muitas vezes, nutricionistas e outros profissionais de saúde utilizam essas ferramentas sem estarem atentos à origem dos dados e às condições em que os critérios diagnósticos foram estabelecidos. É importante que sempre se refira ao artigo original em que os pontos de corte foram definidos para identificar se a população que pretende avaliar,

TABELA 10.1

Critérios de desnutrição por transferrina sérica após ressecção de íleo terminal

Ponto de corte (mg/dL)

Classificação

<225

Desnutrição

Entre 225 e 160

Desnutrição moderada

<160

Desnutrição grave

Critérios para identificação de desnutrição de acordo com os níveis de transferrina sérica dosada no 14o dia após a ressecção do íleo terminal para tratamento de linfomas em adultos entre 50 e 70 anos de idade. Dados hipotéticos. Valores de referência para indivíduos saudáveis: 200 a 400mg/dL. Fonte: elaborada pelos autores.

Desnutrição (desfecho substituto)

Morte (desfecho final)

Medidos simultaneamente

FIGURA 10.1 A desnutrição leva a alterações metabólicas, caracterizadas por alterações neuroendócrinas e imunes,

que pioram o quadro clínico e aumentam consideravelmente o risco de mortalidade. Por este motivo, é comumente utilizada como desfecho substituto de mortalidade. Neste modelo, trata-se de um diagnóstico com função prognóstica de mortalidade Fonte: elaborada pelos autores.

10-Bioestatistica.indd 196

18/05/2021 19:14:48

11 Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos Introdução Testes de concordância podem ser entendidos como aqueles que são utilizados para identificar se resultados de instrumentos de pesquisa, quantitativos ou qualitativos, quando comparados, podem ser reproduzidos, desde que tenham a mesma unidade de medida.1-3 No caso da ciência da Nutrição, estes testes podem ser úteis para verificar instrumentos utilizados para avaliação do estado nutricional (clínica, bioquímica, antropométrica), composição corporal, cálculos de demanda metabólica, instrumentos para identificar qualidade da dieta (inquéritos, índices), entre outros. Podem também ser utilizados para verificar se os resultados provenientes de um mesmo instrumento, realizado por diferentes avaliadores, coincidem, ou ainda se um mesmo avaliador pode reproduzir os seus próprios resultados utilizando-se do mesmo instrumento em diferentes momentos. O propósito dos testes de concordância é avaliar os erros que podem ocorrer nas medidas mencionadas, seja por problemas/limitações nos instrumentos de avaliação ou relacionados com a habilidade dos avaliadores em aplicar o instrumento. Tais erros são conhecidos como erros sistemáticos,4 e podem levar a equívocos na conclusão do trabalho por não corresponderem à realidade. Também podem ser utilizados para comparar métodos que avaliam um mesmo desfecho para validação de novos instrumentos de pesquisa. Neste último caso, um dos instrumentos é considerado o “padrão-ouro”, ou seja, um instrumento já validado. Em resumo, os testes avaliam a confiabilidade (fiabilidade) de medidas com o intuito de minimizar erros, bem como a confiabilidade de novos métodos. Cabe lembrar que existem duas possibilidades de erro: erro randômico e sistemático.5 Erros randômicos6,7 ocorrem ao acaso e erros sistemáticos ocorrem

11-Bioestatistica.indd 219

por fatores que levam a resultados enviesados. Assim, os testes de concordância serão explorados neste capítulo para minimizar erros sistemáticos e para comparar métodos de acordo com o seguinte: Estudos de acurácia de medidas resultantes de equipamentos, bem como de avaliadores, para evitar erros sistemáticos que levem a trabalhos científicos com informações equivocadas. Estudos de avaliação de métodos de análise com o intuito de comparação entre métodos existentes ou validação de novos métodos. O objetivo deste texto é explorar conceitos básicos sobre concordância e está fora do escopo do trabalho estabelecer protocolos de validação, uma vez que estes envolvem múltiplas etapas e análises estatísticas mais complexas. Para uma revisão sobre concordância, consultar Watson e Petrie.8

Testes de Concordância para Equipamentos e Avaliadores | Dados Quantitativos O pesquisador deve estar muito atento para evitar erros sistemáticos (resultados errados que não correspondem à realidade) em seus estudos, uma vez que, tendo seu trabalho publicado, induzirá os leitores ao erro e poderá levar profissionais que acessam essas informações à tomada de decisões equivocadas tanto na prática clínica em atendimento individual quanto na elaboração de políticas públicas. Com a finalidade de colocar esses testes em um contexto prático, elaboramos um desenho esquemático (Figura 11.1), em que uma proposta de avaliação do estado nutricional de jovens adultas universitárias seria realizada com o uso de dois equipamentos (balanças) e por dois avaliadores e em duas escolas. Pode-se supor que a hipótese do pesquisador fosse

18/05/2021 19:26:25

220  Bioestatística em Ciências da Nutrição | Do Desenho Científico aos Modelos Comentados com Uso do SPSS®

que as jovens das duas escolas pertencessem à mesma população, ou que não pertencessem à mesma população. Para cada uma das balanças e avaliador, pode-se supor erros sistemáticos partindo da calibragem do equipamento e da habilidade do avaliador. Observe-se na Figura 11.1 que se a balança estiver descalibrada, haverá um erro sistemático (a) que não será resolvido mesmo que o avaliador realize os procedimentos de pesagem adequadamente (d). Da mesma maneira, mesmo que a balança esteja calibrada (b), se o avaliador não realizar a pesagem adequadamente (e), o erro sistemático estará presente. Para que estes erros sejam prevenidos, identificam-se três pontos que devem ser conferidos, conforme assinalado a seguir. Dando continuidade ao exemplo, para o primeiro ponto de checagem, seriam realizados: Testes de precisão e acurácia de equipamentos em que é verificada a capacidade em reproduzir (repetibilidade) a mesma medida quando esta provém de uma mesma fonte (p. ex., indivíduo ou amostra biológica de sangue), ou seja, com precisão, e,

Balança 1

a. erro b. acerto c. acerto

Ponto no 1: calibragem do equipamento (acurácia). Concordância em relação aos demais equipamentos

Balança 2

erro acerto acerto

ainda, revelar em que grau a medida se aproxima de um valor real, ou seja, acurácia.9,10 Em seguida, para o segundo e terceiro ponto de checagem, seriam realizados: Teste de precisão intra (repetibilidade) e entre avaliadores (reprodutibilidade), em que é verificada a precisão da medida de um mesmo avaliador, ao fazer a tomada de medida várias vezes, de um mesmo avaliado e utilizando-se do mesmo instrumento (intra-avaliador), ou a precisão de medidas tomadas em um mesmo instrumento por diferentes indivíduos (entre indivíduos) e sobre um mesmo avaliado.11 Obviamente, estas não são as únicas etapas em que erros sistemáticos podem ocorrer. Até mesmo o registro das informações em bancos de dados pode levar a erros. A seguir, são sugeridos alguns métodos de avaliação tanto de medidas quantitativas quanto de medidas qualitativas.

Avaliador 1

d. erro e. erro f. acerto

Ponto no 2: checagem da reprodutibilidade das medidas pelo avaliador 1 (concordância intra-avaliador) Ponto no 3: checagem da concordância do avaliador 1 em relação aos outros três avaliadores (concordância entre avaliadores)

Avaliador 2

erro erro acerto

Avaliado (universidade 1)

Quando a checagem não ocorre, há maior probabilidade de erro no resultado do estudo, sejam as escolas pertencentes à mesma população ou não

Avaliado (universidade 2)

Observação: as possibilidades de erro são as mesmas para cada um dos quatro equipamentos e avaliadores

FIGURA 11.1 Apresentação esquemática das possibilidades de erros sistemáticos derivados de calibração de equipa-

mentos, técnicas de tomadas de medida por avaliadores e reprodutibilidade intra e entre avaliadores. As palavras erro e acerto dizem respeito aos erros que podem ocorrer e influenciar a etapa seguinte da avaliação. Em cada ponto de checagem da precisão e acurácia de cada medida, existe a possibilidade de erros sistemáticos que resultarão na distorção da realidade. Ao final, erros sistemáticos podem levar a conclusões equivocadas. Resumindo, no caso do teste de hipóteses, pode-se rejeitar a H0 quando os indivíduos pertencerem à mesma população ou aceitar-se H0 quando, na verdade, eles não pertencem à mesma população. A checagem intra-avaliador e entre avaliadores deve ser realizada, preferencialmente, antes que os avaliadores se dirijam às escolas para a coleta de dados Fonte: elaborada pelos autores.

11-Bioestatistica.indd 220

18/05/2021 19:26:25

Estudos de Concordância | Do Treinamento de Avaliadores e Teste de Equipamentos à Comparação de Métodos  221 Avaliação

da repetibilidade e reprodutibilidade entre equipamentos e avaliadores | Coeficientes de variação e índices de confiabilidade/fiabilidade

Os testes de concordância avaliam a precisão de dados coletados tanto em estudos observacionais quanto em estudos experimentais. Basicamente, buscam avaliar se os dados coletados podem ser repetidos e reproduzidos e podem ser utilizados em processos para avaliar se os dados refletem a realidade encontrada na natureza (acurácia). São realizados especialmente para evitar erros sistemáticos.

Coeficiente de variação Para ilustrar as duas primeiras situações descritas, precisão de equipamentos e precisão intra e entre avaliadores, tomemos o exemplo a partir do descrito na Figura 11.1. Suponhamos que se trata de um estudo em que o peso de jovens adultas, vivendo em residências universitárias de uma determinada cidade, seria coletado por quatro avaliadores que teriam uma unidade de cada equipamento (balança) para levar até os locais de coleta. Antes de iniciar a tomada das medidas, seria preciso realizar o teste de precisão e acurácia dos equipamentos; por exemplo, as quatro balanças que seriam levadas até os locais para levantamento de dados. Assim, antes que as balanças fossem entregues aos quatro avaliadores, uma pessoa experiente faria o teste utilizando-se de pesos-padrão

TABELA 11.1

para calibração, encontrados em lojas especializadas. Basicamente, as balanças deveriam ser precisas e reproduzir as mesmas medidas quando tomadas várias vezes, utilizando-se do mesmo peso-padrão (precisão), e tais medidas deveriam refletir exatamente o valor do peso-padrão (acurácia). Essas medidas deveriam ser repetidas por, no mínimo, três vezes. Observe a Tabela 11.1, em que as medidas foram tomadas três vezes de cada uma das quatro balanças, utilizando-se peso-padrão de 10kg. As médias dos pesos registrados por cada balança e os respectivos desvios-padrão e coeficientes de variação foram calculados, e uma conclusão sobre cada equipamento foi descrita com base na característica do equipamento e da medida utilizada.12,13 Na Tabela 11.1, apresentada como exemplo, observa-se que o cenário ideal é o da balança no 2 com precisão e acurácia, e o pior cenário é o da balança no 1 que superestima o peso em 2kg, que representam um valor 20% acima do esperado. Em seguida, a balança no 3 apresenta o segundo pior cenário com uma variação de 4,3% entre as medidas e que superestima o peso em 6%. Já a balança no 4 apresenta um cenário um pouco melhor, com uma variação entre as medidas de 0,57%, superestimando o peso em 0,3%. O valor aceitável para a calibração depende do equipamento e da variável medida. O fabricante do equipamento deve informar a variação aceitável para determinada categoria, bem como a sua sensibilidade. No caso da balança que pesa no máximo 100kg e que tem sensibilidade de 100g, seria aceitável uma

Teste de precisão e acurácia de balanças

Balança

no 1

no 2

no 3

no 4

10,1

10,7

10,1

Média

10,6

10,03

0,46

0,058

CV (%)

4,3

0,57

Conclusão

Precisa, não acurada

Precisa, acurada

Não precisa, não acurada

Medida

Medida igual ao peso-padrão = acurácia

Medida reproduzida por três vezes consecutivas = precisão

Quatro balanças foram avaliadas com o uso de um peso-padrão de 10kg. A média das três medidas e os respectivos desvios-padrão (dp) foram calculados. Em seguida, foi definido o coeficiente de variação (CV em %) = (dp/média) × 100. Com base nos resultados, concluiu-se sobre a precisão e a acurácia de cada equipamento. Fonte: elaborada pelos autores.

11-Bioestatistica.indd 221

18/05/2021 19:26:25