Por que usar testes estatísticos na sua pesquisa, e quais os mais comuns?

Nota-se um déficit de conhecimento em estatística no meio acadêmico. O conhecimento em estatística é fundamental para nortear o desenho experimental de um projeto e para a compreensão de artigos científicos. Aqui, forneceremos conceitos básicos de estatística e coleta de dados para então descrever as etapas para a realização dos testes estatísticos mais utilizados em pesquisa. Esse é o artigo introdutório de uma série que abordará amostragem e distribuição normal, dois testes de hipóteses paramétricos (Teste-t, ANOVA) e três não paramétricos (Qui-quadrado, Teste de Wilcoxon e Teste U de Mann-Whitney), intervalo de confiança, probabilidade e avaliação de sensibilidade e especificidade.

Autor: Vivian Morais Paixão ^{https://orcid.org/0000-0002-4154-304X}

Revisão: Luana Luiza Bastos ^{https://orcid.org/0000-0002-6932-0438}, Wylerson Guimarães Nogueira ^{https://orcid.org/0000-0001-9910-0690}, Diego Mariano ^{https://orcid.org/ 0000-0002-5899-2052}

Introdução

O conhecimento em estatística muitas vezes é fundamental na vida acadêmica, sendo indispensável para nortear o desenho experimental de uma pesquisa e até mesmo para entender análises de dados e gráficos presentes em inúmeros artigos científicos. Mas, afinal, como exatamente esse conhecimento auxilia na pesquisa? A análise estatística faz parte do planejamento de um experimento ao auxiliar na escolha do número amostral, testar as previsões, lidar com a variabilidade, analisar e interpretar os seus dados. Além disso, ela também permite pegar esses resultados adquiridos a partir de uma pequena parcela de um grupo e estender para análise geral desse grupo como um todo.

Apesar de sua grande importância, sabemos que há um déficit desse conhecimento, inclusive entre os próprios pesquisadores e universitários. Dessa forma, visamos fornecer a seguir, e nos próximos artigos, alguns fundamentos básicos da área além do passo a passo de alguns métodos utilizados para coleta e análise de dados. Os principais tópicos que serão abordados incluem:

I. Amostragem e verificação dos dados para analisar se há distribuição normal;

II. Intervalos de confiança;

III. Teste de hipóteses;

IV. Cálculos de probabilidade;

V. Avaliação de testes (especificidade e sensibilidade).

Amostragem e distribuição Normal

Geralmente, não conseguimos analisar a população como um todo, seja por ser muito grande ou até por questões econômicas como, por exemplo, a falta de verba para um estudo em grande escala. Nesse caso, pegamos uma amostra dessa população, com a finalidade de representá-la em nosso estudo.

Dessa forma, a população é o conjunto de indivíduos/elementos que se deseja estudar, e a amostra é a parte da população selecionada para o estudo. Para a coleta amostral, precisamos utilizar metodologias e ferramentas confiáveis para que, assim, tenhamos uma representação que seja o mais fiel possível. A Figura 1, abaixo. representa esse conceito da retirada de uma amostra da população de maneira aleatória:

Figura 1. Representação de uma amostra retirada aleatoriamente da população. Fonte: Adaptado de Medium.com, disponível em: There’s No Perfect Sample, But How Do We Get Close. Acesso em 01 de Junho de 2022.

Por essa razão, é interessante que a distribuição da amostra seja normal. Essa distribuição, também conhecida como distribuição gaussiana, é representada como uma curva simétrica, uma vez que a média, a mediana e a moda dos dados coincidem. Consequentemente, vemos que 50% dos valores são iguais ou maiores do que a média e a outra metade é igual ou menor [1]. Isso mostra que não há variabilidade no padrão, dando maior confiabilidade ao estudo. A curva gaussiana é vista em formato de sino, como na Figura 2, abaixo. Ela é baseada na média (μ), que é o centro da distribuição, ou seja, a concentração dos dados de uma distribuição; e, no desvio-padrão (θ), que se refere ao espalhamento da curva e indica a homogeneidade dos dados.

Figura 2. Imagem representativa de uma curva de distribuição normal, com destaque para a média
(μ) e o desvio-padrão (θ). Fonte: Dummies.com. Acesso em 01 de Junho de 2022.

Por exemplo, a altura de uma população é conhecida por ter um formato aproximadamente normal, com tendência para uma determinada média. No caso do Brasil, segundo o IBGE (2013) [2], a altura média da população masculina de 25-39 anos é de 173 cm, então o valor representado por μ é 173.

Intervalo de confiança e testes de hipótese

Quando o estudo utiliza uma amostragem, não temos acesso aos dados individuais de toda a população, apenas da amostra que está sendo utilizada. Então, como podemos confiar na média que geramos a partir desses dados? Para isso, nós utilizamos o intervalo de confiança, que faz parte da área de inferências estatísticas. Esse intervalo, que acompanha os conceitos de “nível de confiança” e “margem de erro“, é um intervalo numérico que contém o parâmetro de interesse com certo grau de confiança. Quando determinamos a margem de erro de um experimento, podemos utilizá-lo para calcular o intervalo de confiança, que contém um limite inferior e um superior. Por exemplo, se obtemos uma média = 30 e um desvio-padrão = 1.5, o intervalo de confiança é [28,5; 30,5]. Isso significa que um resultado que esteja dentro desse nível de confiança ainda é considerado correto.

Um exemplo prático ocorre quando temos as distribuições de pressão sanguínea diastólica e sistólica em um grupo de mulheres, em que as médias são desconhecidas mas o desvio-padrão é conhecido. Se pegarmos uma amostra dessa população e, a partir dela, calcularmos a média, podemos obter através de cálculos um intervalo que contém a verdadeira média da pressão sanguínea da população com determinado nível de confiança (geralmente usa-se 95%) [3].

Se a pesquisa tem o objetivo de comparar grupos e, assim, confirmar hipóteses, o ideal é que se faça uso de testes paramétricos ou não paramétricos, a depender se a distribuição dos dados é normal ou não.

Caso seja normal, ou pelo menos simétrica, podemos usar os testes paramétricos: o Teste t de student, para uma amostra ou para duas relacionadas ou independentes, e o teste ANOVA (Análise de Variância), para mais de duas amostras independentes. Caso não atenda às pressuposições exigidas, usamos os testes não paramétricos[4], dentre os quais iremos focar no teste Qui-Quadrado, Teste de Wilcoxon e Teste U de Mann-Whitney. Abordaremos então os requisitos para a escolha de cada teste e a sua metodologia.

Probabilidade

E quanto à probabilidade? Usamos a probabilidade quando temos dados cujos resultados possíveis são conhecidos mas não sabemos qual deles irá ocorrer até que seja realizado o experimento. Dessa forma, teremos um experimento aleatório. Por exemplo, a probabilidade é empregada quando temos uma população com determinada doença e queremos saber quais as chances de que um determinado número de indivíduos desta população, escolhidos ao acaso, possua essa doença.

Além disso, na área da probabilidade temos a análise de especificidade e sensibilidade, que usamos para avaliar os testes quanto à sua acurácia. Por exemplo, o famoso teste rápido de anticorpos para a COVID-19 tem, em geral, cerca de 99% de especificidade e 72% de sensibilidade, segundo a WHO (World Health Organization)[5]. Isso quer dizer que, segundo a especificidade, 99 a cada 100 pessoas que realmente não tinham os anticorpos apresentaram teste negativo, e, segundo a sensibilidade, 72 a cada 100 pessoas que realmente tinham anticorpos apresentaram teste positivo.

Neste artigo, apresentamos a ideia principal do conhecimento estatístico, a importância desse estudo na área acadêmica, e alguns conceitos importantes. Nos artigos seguintes, explicaremos o passo a passo de cada um dos tópicos citados, desde os conceitos básicos, incluindo exemplos de aplicação. Abaixo, há um glossário com alguns conceitos do texto e seus significados.

GLOSSÁRIO

Margem de erro: A margem de erro indica um limite aceitável para o resultado de um experimento, sendo aplicado no intervalo de confiança.
Média: Indica o centro de gravidade do conjunto de dados. É calculada a partir da soma de todos os dados e dividindo o resultado pelo número de elementos desse conjunto.
Mediana: Número do conjunto de dados que, em ordem crescente, divide esse conjunto em duas partes: uma com números menores ou iguais à mediana e outra com números maiores ou iguais.
Moda: Valor que ocorre com maior frequência em um conjunto de dados. Nem sempre um conjunto tem um valor referente à moda, e também pode ocorrer de ter mais de um.
Nível de confiança: No intervalo de confiança, há um nível de confiança pré-estabelecido. Se for 95%, significa que podemos afirmar que, em 95% dos experimentos, o intervalo incluirá o resultado obtido nos cálculos.

Referências

VIEIRA, S. Introdução à Bioestatística. 4a ed. Rio de Janeiro: Elsevier Editora Ltda, 2011.
Instituto Brasileiro de Geografia e Estatística (IBGE). Disponível em: <https://www.ibge.gov.br/estatisticas/sociais/saude/29540-2013-pesquisa-nacional-de-saude.html?edicao=9163&t=resultados>. Acesso em 01 de junho de 2022.
BITTENCOURT, F; DIAS, A. Notas de aula: Estatística básica. UNIFAL. Alfenas, MG 2019.
VIEIRA, S. Bioestatística – Tópicos avançados. 4a ed. Rio de Janeiro: Elsevier Editora Ltda, 267 p. 2018.
World Health Organization (WHO). Disponível em: <https://www.who.int/publications/i/item/antigen-detection-in-the-diagnosis-of-sars-cov-2infection-using-rapid-immunoassays>. Acesso em 01 de junho de 2022.

03 Baixar