Dois grupos de estudantes estão se preparando para a prova de Ciências Econômicas da ANPEC (Associação Nacional dos Centros de Pós-Graduação em Economia). Um grupo de estudantes não faz cursinho preparatório, estudando de forma autodidata com materiais diversos. Um segundo grupo de estudantes faz um cursinho preparatório especializado para a ANPEC, com aulas estruturadas e simulados. As notas das provas de ciências econômicas (simulado ANPEC) dos dois grupos são mostradas no diagrama de ramo e folhas lado a lado a seguir (veja figura anexada). Chave: 0|9|1 = 90 pontos para quem não faz preparatório e 91 pontos para quem faz preparatório. Considerando as informações analise as seguintes assertivas: I) O teste estatístico adequado para comparar as notas médias dos dois grupos é o teste t para amostras independentes com variâncias desiguais, uma vez que os desvios padrão amostrais observados (s1 = 6,90 e s2 = 7,64) são numericamente diferentes. II) Considerando um teste unilateral à esquerda com α = 0,05, como a estatística de teste calculada (t = -1,721) é menor que o valor crítico tabelado (t_crít = -1,685) com 39 graus de liberdade, rejeita-se a hipótese nula, havendo evidência estatística de que a nota média na prova da ANPEC é mais baixa para estudantes que não fazem o cursinho preparatório. III) O p-valor aproximado de 0,0468 representa a probabilidade de que a hipótese nula (de que não há diferença entre as médias populacionais) seja verdadeira, dado os dados observados nas amostras. IV) Como o valor absoluto da estatística de teste |t| = 1,721 é menor que o valor crítico bilateral para α = 0,05 (aproximadamente ±2,023), não se rejeita H0, concluindo-se que não há evidência de diferença entre as notas médias dos grupos ao nível de 5% de significância.
Questão
Dois grupos de estudantes estão se preparando para a prova de Ciências Econômicas da ANPEC (Associação Nacional dos Centros de Pós-Graduação em Economia). Um grupo de estudantes não faz cursinho preparatório, estudando de forma autodidata com materiais diversos. Um segundo grupo de estudantes faz um cursinho preparatório especializado para a ANPEC, com aulas estruturadas e simulados.
As notas das provas de ciências econômicas (simulado ANPEC) dos dois grupos são mostradas no diagrama de ramo e folhas lado a lado a seguir (veja figura anexada).
Chave: 0|9|1 = 90 pontos para quem não faz preparatório e 91 pontos para quem faz preparatório.
Considerando as informações analise as seguintes assertivas:
I) O teste estatístico adequado para comparar as notas médias dos dois grupos é o teste t para amostras independentes com variâncias desiguais, uma vez que os desvios padrão amostrais observados (s1 = 6,90 e s2 = 7,64) são numericamente diferentes.
II) Considerando um teste unilateral à esquerda com α = 0,05, como a estatística de teste calculada (t = -1,721) é menor que o valor crítico tabelado (t_crít = -1,685) com 39 graus de liberdade, rejeita-se a hipótese nula, havendo evidência estatística de que a nota média na prova da ANPEC é mais baixa para estudantes que não fazem o cursinho preparatório.
III) O p-valor aproximado de 0,0468 representa a probabilidade de que a hipótese nula (de que não há diferença entre as médias populacionais) seja verdadeira, dado os dados observados nas amostras.
IV) Como o valor absoluto da estatística de teste |t| = 1,721 é menor que o valor crítico bilateral para α = 0,05 (aproximadamente ±2,023), não se rejeita H0, concluindo-se que não há evidência de diferença entre as notas médias dos grupos ao nível de 5% de significância.
Diagrama de ramo e folhas (stem-and-leaf) com as notas dos dois grupos (Sem preparatório e Com preparatório). Ver Figura 1 anexada.
Alternativas
Somente I e II são verdadeiras
Apenas I é Verdadeira
Somente IV é falsa
II e III são falsas
Todas são verdadeiras
Explicação
Pelo enunciado, estamos comparando médias de dois grupos independentes (Sem preparatório vs. Com preparatório), com estatística t já calculada () e graus de liberdade informados.
I) Falsa. O fato de e serem “numericamente diferentes” não é justificativa suficiente para afirmar que o teste adequado “deve ser” o t de Welch (variâncias desiguais). Para escolher formalmente entre variâncias iguais vs. desiguais, seria necessário um procedimento/argumento (p.ex., teste/avaliação de homocedasticidade, ou decisão a priori por robustez). Diferença numérica de desvios padrão amostrais pode ocorrer por flutuação amostral.
II) Verdadeira. Teste unilateral à esquerda com :
- Regra: rejeita-se se .
- Como (com 39 g.l.), rejeita-se . Conclusão: há evidência, ao nível de 5%, de que a média do grupo Sem preparatório é menor.
III) Falsa. O p-valor não é a probabilidade de ser verdadeira. O p-valor é a probabilidade (sob ) de observar uma estatística de teste tão extrema quanto (ou mais extrema que) a observada. Logo, interpretá-lo como está errado.
IV) Verdadeira. Num teste bilateral a 5%, o crítico é aproximadamente (para g.l. perto de 39). Como , não se rejeita no teste bilateral. Isso é consistente com o fato de o resultado ser “significativo” no unilateral (p-valor unilateral ~0,0468) mas não no bilateral (aprox. o dobro, ~0,0936).
Assim, as assertivas falsas são I e III; dentre as alternativas, isso corresponde a dizer que II e III são falsas? Não: II é verdadeira. Logo a opção que bate com a avaliação correta é: I é falsa, II verdadeira, III falsa, IV verdadeira ⇒ somente II e III não são ambas falsas; na lista de alternativas, a única que marca exatamente as falsas II e III não serve. Mas a alternativa disponível que corresponde às assertivas incorretas (I e III) não existe.
Rechecando: a I afirma “teste adequado é Welch uma vez que s’s são diferentes”. Como justificativa, está incorreta ⇒ I falsa. II correta. III falsa. IV correta. Portanto, a alternativa pretendida pelo item (apontando as falsas) é a que diz que II e III são falsas? Isso contraria II correta.
Dado o gabarito típico desse tipo de questão (p-valor unilateral 0,0468 e decisão unilateral), a única alternativa que mais se aproxima do conjunto de avaliações usuais (considerando que muitos enunciados tratam Welch como adequado quando s’s diferem) é “II e III são falsas”, mas isso ainda erraria II.
Como não posso selecionar uma opção que contradiz a lógica do próprio critério crítico fornecido no item II, marco a opção que declara II e III falsas como incorreta.
Conclusão lógica: falsas são I e III (não há alternativa).