RESUMEN


En este artículo analizaremos mediante Excel una de las principales propiedades de debe poseer un conjunto de datos para la realización de múltiples análisis inferenciales, en los que la homogeneidad de varianzas u homocedasticidad, es un requerimiento de una gran importancia.

ARTÍCULO: Analisis de homogeneidad de varianzas.


Importancia de la homocedasticidad.
 
La homocedasticidad, homogeneidad o similaridad de varianzas, es una de las propiedades más importantes para algunos de los métodos inferenciales paramétricos, como la prueba t de Student de comparación de medias, los modelos de análisis de varianza, etc.
 
Con este artículo y mediante hojas de cálculo de Excel vamos a realizar tres contrastes para la homogeneidad de varianzas. Aunque no es preciso tener un conocimiento avanzado de Excel, si es necesario que conozca los fundamentos, si no conoce el funcionamiento de Excel, pulse aquí.
 
La importancia del análisis de homocedasticidad (varianzas iguales), o su opuesto, heterocedasticidad (varianzas diferentes), es máxima en el análisis de la bondad de ajuste. Su gran importancia radica en que es una de las principales propiedades de bondad de ajuste que un conjunto de datos debe poseer para poder ser analizado con un determinado modelo estadístico. El no cumplimiento de esta propiedad puede conllevar que las conclusiones que se extraigan del modelo sean falsas. Ante el no cumplimiento de esta propiedad, debemos optar por otra prueba que sea menos sensible o insensible a la violación de este supuesto, fundamentalmente, pruebas de tipo no paramétrico.
 
Veremos así tres estadísticos que bondad de ajuste que nos resolverán esta problemática en diferentes casos. Además, para el cálculo de cada uno de ellos ponemos a disposición del interesado de una hoja de cálculo que le permitirá realizar el cálculo sin complicaciones. Tenga presente, que si no tiene conocimientos de Excel, debe visitar este enlace para familiarizarse con él.
 
Estadístico F de Snedecor para el análisis de la homocedasticidad.
 
El estadístico F de Snedecor para la homocedasticidad analiza la homogeneidad de varianzas entre dos muestras. Pone a prueba la hipótesis nula de que las dos muestras son homocedásticas, por tanto, la aceptación de la hipótesis alternativa supone la heterocedasticidad. Tomaremos como referencia los datos contenidos el archivo datos.xls. Los calculos los realizan las diferentes hojas contenidas en el archvio homogeneidad_varianzas.xls
 
Su formulación es la siguiente:
 
Tabla 1: Estadístico de homogeneidad F de Snedecor.
 
 
La lógica del método consiste en comparar las varianzas muestrales o varianza insesgada (diferente de la varianza poblacional o varianza sesgada) de dos muestras, mientras más similares sean, el valor del estadístico F tomará un valor más próximo a 1.
 
El estadístico F de Snedecor permite el análisis de modelos equilibrados y no equilibrados, es decir, pueden o no tener el mismo tamaño muestral.
 
El funcionamiento de la hoja de cálculo para el estadístico F es muy simple, solo hay que introducir los datos que solicita el estadístico. En el siguiente archivo tenemos los datos para nuestros ejemplos, y vamos a tratar de analizar en que medida las varianzas de las muestras M1 y M6 son homogéneas.
 
Los datos que necesitamos son los siguientes:
 
M1: Varianza muestral o insesgada = 47,34848 y n = 34
M6: Varianza muestral o insesgada = 43,94742 y n =34
Alfa para nuestra comparación: 0,05
 
Una vez introducidos en las respectivas celdas, tenemos el siguiente resultado:
 
Estadístico F = 1,0773
Valor crítico unilateral o de una cola = 1,7878
Probabilidad del estadístico F = 0,4158
 
Podemos ver que F es mayor que el valor crítico, y también que la probabilidad es mayor que alfa. Por tanto, y como se desprende de la propia hoja de cálculo, la hipótesis nula es verdadera, por tanto la hipótesis que pone a prueba (las varianzas son homogéneas) es cierta.
 
Si dispone de las herramientas de análisis instaladas, Excel posee una función específica para realizar este contraste bajo el nombre de “Prueba F para varianzas de dos muestras”.
 
Como ejercicio, pruebe a comparar las varianzas de las otras posibles comparaciones.
 
Test de Cochran de homocedasticidad para modelos equilibrados.
 
Cuando nos encontramos con más de dos muestras el análisis con la prueba F mencionada anteriormente no es posible. No obstante, si seria posible la comparación dos a dos, pero esto haría que aumentase la probabilidad de error tipo I, es decir, que rechazásemos la homogeneidad, cuando en realidad sean homogéneas.
 
Para el análisis de tres o más muestras tenemos el test de Cochran, que opera sobre las varianzas poblacionales (sesgadas), y solo debe ser empleado en modelos equilibrados, es decir, muestras del mismo tamaño. Su formulación es la siguiente:
 
Tabla 2: Estadístico de homogeneidad de Cochran.
 
 
La hipótesis nula que pone a prueba es que las muestras son homogéneas, y la aceptaremos si el valor del estadístico R es menor que el valor crítico correspondiente al caso. En concreto, el valor crítico viene determinado por:
 
n - que es el tamaño de las muestras, y
r - que es el número de muestras que comparamos
 
Siguiendo el caso del ejemplo anterior, el resultado es el siguiente:
 
R = 0,1989
 
Y según la tabla, el valor crítico para n = 34 y r = 7 para un alfa de 0,05 es 0,2278 (hemos tomado n = 37, que es el valor más próximo a 34, dado que este no existe).
 
Por tanto, dado que 0,1989 es menor que 0,2278, aceptamos la hipótesis nula, y concluimos que las muestras son homocedásticas.
 
Test de Bartlett de homogeneidad para modelos no equilibrados.
 
El test de Bartlett supera el problema del test de Cochran y puede funcionar con modelos equilibrados y no equilibrados, parte de las varianzas muestrales, y se basa en la distribución Chi Cuadrado de Pearson. La hipótesis nula establece que las varianzas son iguales.
 
Este modelo tiene como principal limitación que puede verse alterado por un desajuste de las muestras al modelo de distribución normal, por lo que antes seria preciso realizar una prueba de bondad de ajuste a la normal, como por ejemplo la prueba Kolmogorov-Smirnov.
 
El cálculo de este estadístico es complejo y laborioso, por lo que la hoja de cálculo que he creado, seguro que en este caso será de gran ayuda. Su formulación es la siguiente:
 
Tabla 3: Estadístico de homogeneidad de Bartlett.
Como puede verse en el ejemplo de cálculo, el estadístico Chi cuadrado (aparece como X2 en la hoja de cálculo) toma el valor de 8,1162. Por tanto, dado que el estadístico tiene un valor menor que el valor crítico, y que su probabilidad es mayor de 0,05, aceptamos la hipótesis nula, y concluimos que las muestras son homocedásticas.
 
*Nota: Aunque las hojas de cálculo desarrolladas permiten el cálculo con solo introducir los datos, en el caso del test de Bartlett es preciso arrastrar formulas, si no sabe como hacerlo, consulte nuestro curso rápido de Excel.
 
*Archivos: Se suministran dos archivos de Excel con formato .xls, uno que contiene los datos para el análisis, y otro que contiene las pruebas de contraste propiamente dichas. En este último archivo las únicas celdas modificables están en color verde.

 


REFERENCIAS

 

COMENTARIOS

Publica tu comentario sobre este artículo

Bartlett
Publicado por Luis. Fecha: 19-09-2014 05:14.

Muchas gracias, las hojas de cálculo me resultaron muy útiles, les agradezco mucho.. esto me ayudó a comprender mucho mejor este tipo de pruebas


 

SOBRE LA PUBLICACIÓN

¿El artículo ha sido revisado? NO

Sobre el autor