RESUMO
ABSTRACT In this study, some transformation methods that are applied when the assumptions of analysis of variance are not met are evaluated in terms of type I error rate and the test power, under circumstances with different distributions, number of groups, number of observations, variance ratios, and different standard deviation differences. The data set used in the study consisted of random numbers generated from N (0,1), and χ2(3) distributions using the random function of the Numpy library in the Python programming language. The logarithmic, square root and root transformations were evaluated on ANOVA based on simulation combinations. It was observed that the transformation techniques of taking the square root after adding 0.5 and 0.375 to the data were relatively more reliable compared to other transformations in terms of type I error rate. However, in every case, type I error rate determined at the beginning of the experiment increased both before and after the transformation was applied. In particular, interestingly, the third and fourth degree root transformations gave better results of test power in the right skewed distribution. In addition, we compared the transformation techniques in question to determine the normality of the data and the homogeneity of variances by a real data.
RESUMO Neste estudo, alguns métodos de transformação, aplicados quando as premissas da análise de variância não são cumpridas, são avaliados em termos de taxa de erro tipo I e poder de teste, em circunstâncias com diferentes distribuições, número de grupos, número de observações, razões de variância e diferenças de desvio-padrão. O conjunto de dados utilizados no estudo consistiu em números aleatórios gerados a partir das distribuições N(0,1) e χ2(3), utilizando a função aleatória da biblioteca Numpy, na linguagem de programação Python. As técnicas de transformação logarítmica, raiz quadrada e raiz foram avaliadas na ANOVA, com base em combinações de simulação. Observou-se que as técnicas de transformação de tomar a raiz quadrada após adicionar 0,5 e 0,375 aos dados foram relativamente mais confiáveis em comparação com outras transformações em termos de taxa de erro tipo I. No entanto, em todos os casos, a taxa de erro tipo I determinada no início do experimento aumentou tanto antes quanto depois da aplicação da transformação. Em particular, curiosamente, as transformações de raiz de terceiro e de quarto grau deram melhores resultados de poder de teste na distribuição assimétrica à direita. Além disso, foram comparadas as técnicas de transformação em questão para determinar a normalidade dos dados e a homogeneidade das variâncias por meio de dados reais.
RESUMO
Procedimentos de comparações múltiplas são utilizados para comparar médias de níveis de um fator, porém, os testes mais populares apresentam problemas de ambiguidade dos resultados e de controle do erro tipo I, além de terem seus desempenhos influenciados negativamente no caso de heterogeneidade de variâncias e não balanceamento. Objetivou-se, neste trabalho propor alternativas bayesianas para comparações múltiplas considerando os casos de homogeneidade e heterogeneidade de variâncias. A metodologia utilizada nesse trabalho foi baseada na distribuição a posteriori t multivariada. Foram geradas k cadeias de médias, utilizando o método de Monte Carlo. Foi obtida a amplitude padronizada sob H0, obtida na distribuição a posteriori das médias, contemplando a possibilidade de se analisar tanto o caso de variâncias heterogêneas como o caso de variâncias homogêneas. Os procedimentos de comparações múltiplas bayesianos foram propostos com sucesso.
Multiple comparison procedures are used to compare factor's levels means, since the most popular tests show problems related to ambiguous results and to the control of the type I error rates. Moreover, their performance is worst in heterocedastics and unbalanced cases. The objective of this work is to propose a Bayesian alternative for multiple comparisons considering the homocedastic and heterocedastic normal models. The methodology adopted in this paper was based on a posteriori multivariate t distribution. It was used k Monte Carlo chains of the mean factor to make inferences. The standardized range was obtained, under H0, from the posteriori distribution of the means, for the analysis of homocedastic and heterocedastic cases. The bayesian procedures of multiple comparisons were successfully proposed.
RESUMO
The present work emphasizes the importance of testing hypothesis on homogeneity of covariance matrices from multivariate k populations. The violation of the assumption of the homogeneity of covariance matrices affects the performance of the tests and the coverage probability of the confidence regions. This work intends to apply two tests of homogeneity of covariance and to evaluate type I error rates and power using Monte Carlo simulation in normal populations and robustness in non normal populations. Multivariate Bartlett's test (MBT) and its bootstrap version (MBTB) were used. Different configurations are tested combining sample sizes, number of variates, correlation and number of populations. Results show that the bootstrap test was considered superior to the asymptotic test and robust, since it controls the type error I rate.
O presente trabalho ressalta a importância da aplicação de testes sobre a hipótese de igualdade de matrizes de covariâncias de k populações. A violação da pressuposição da homogeneidade das covariâncias afeta diretamente a qualidade dos testes e a probabilidade de cobertura das regiões de confiança. Por essa razão, neste trabalho propõe-se aplicar dois testes de homogeneidade de covariâncias e avaliar as suas performances mediante uso de simulação Monte Carlo em populações normais e a robustez em situações não-normais avaliando-se o erro tipo I e o poder. Os testes utilizados foram: teste de Bartlett multivariado e a sua versão bootstrap. Foram feitas combinações entre os tamanhos amostrais, número de variáveis, correlação e número de populações. Os resultados obtidos permitiram concluir que o teste de bootstrap foi considerado superior aos assintótico e robusto, controlando o erro tipo I.
RESUMO
Neste trabalho, objetivou-se avaliar a performance do teste multivariado de normalidade de Shapiro-Wilk implementado no R comparando o seu desempenho com os testes de assimetria e curtose de Mardia (1970, 1974, 1975) utilizando simulação Monte Carlo. Foram mensuradas e comparadas as taxas de erro tipo I e poderes dos testes. Pode-se concluir que o teste de Shapiro-Wilk multivariado do programa R, função mshapiro.test do pacote mvnormtest, tem fraco desempenho (liberal) e não é recomendado para uso rotineiro.
This work aimed to evaluate the performance of the multivariate normality test of Shapiro-Wilk implemented in R in the library mvnormtest and to compare it with the asymmetry and kurtosis normality test proposed by Mardia (1970, 1974, 1975) using Monte Carlo simulation. The multivariate normality test of Shapiro-Wilk is not recommended for regular use.