PRUEBAS DE DIFERENCIA DE MEDIAS O DE COMPARACIONES MÚLTIPLES




 

AUTORETRATO: CONSTELACIONES
GRAN AURORA BOREAL I  I, 2001.
Técnica mixta sobre lienzo.
Díptico 185 x 290 cm. (185 x 140 c.u.)
 

Gerardo Delgado






Cuando se rechaza la hipótesis nula de no diferencia de más de dos medias (H0: m 1 = m 2 = = m k) en un análisis de varianza surge la pregunta acerca de cuáles pares de medias son diferentes, puesto que el rechazo de una hipótesis nula con cuatro tratamientos (H0: m 1 = m 2 = m 3 = m 4), podría deberse a uno o varios de los seis pares de diferencias que se pueden tener, esto es: m 1 ¹ m 2 o m 1 ¹ m 3 o m 1 ¹ m 4 o m 2 ¹ m 3 o m 2 ¹ m 4 o m 3 ¹ m 4

Existen varios procedimientos para determinar cuáles son los pares de medias que son diferentes. El primero de estos procedimientos, y el más utilizado en el pasado, es el de la Diferencia Significativa Mínima (DSM) de Fisher publicada en 1935 en su libro The Design of Experiments. Este procedimiento es una extensión de la prueba t de Student para el caso de comparación de dos medias con varianza ponderada.

Otros procedimientos más recientemente usados para el mismo propósito son: la prueba de Student-Neuman-Keuls, la prueba de Diferencia Significativa Honesta de Tukey (DSH), la prueba del Rango múltiple de Duncan, la prueba de Dunnett y la prueba de Scheffé, entre otras. Véase Steel and Torrie y Federer.



Para ilustrar mejor las diferentes pruebas se tomará el siguiente ejemplo:



Ejemplo 1: Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno para el control de desechos de fabricación, pero quisiera determinar cuál es la situación de las otras tres. Para el efecto se toman cinco muestras de los líquidos residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente tabla.

Tabla 1 Cantidad de contaminantes para cuatro plantas de una empresa.

Planta

contaminantes

ni

A

1.65

1.72

1.50

1.35

1.60

5

7.84

1.568

B

1.70

1.85

1.46

2.05

1.80

5

8.86

1.772

C

1.40

1.75

1.38

1.65

1.55

5

7.73

1.546

D

2.10

1.95

1.65

1.88

2.00

5

9.58

1.916

Total: N = 20

Antes de realizar el análisis de varianza se debe trazar el diagrama de cajas múltiple para determinar si existen casos extraordinarios y si se cumple el supuesto de varianzas iguales:

Figura 1 Diagrama de caja para los datos del ejemplo 1



Los cálculos se muestran en la siguiente tabla de ANDEVA.

Tabla de ANDEVA para los datos de contaminación.

Fuente

g.l.

Suma de cuadrados

Cuadrados medios

Fcalculada

Ftablas

Trat.

"Plantas"

4- 1=3

Error

 

20- 4=16

 

 

 

 

Total

20- 1=19

¾

   

Conclusión: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa (al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.

La salida de computadora es:

Analysis of variance

Source of variation Sum of Squares d.f. Mean square F-ratio Sig. level

Between groups .4702550 3 .1567517 5.171 .0109

Within groups .4850400 16 .0303150

Total (corrected) .9552950 19

 

 

 

PRUEBA DE DIFERENCIA SIGNIFICATIVA MÍNIMA (DSM).DE FISHER

Cuando el análisis de varianza indica la existencia de una diferencia significativa se desea conocer cuál de los pares de medias causa la diferencia. Cuando las muestras son de igual tamaño la Diferencia Significativa Mínima (DSM) de Fisher nos ayuda a localizar esta fuente.

La Diferencia Significativa Mínima (DSM) se define como la diferencia mínima que podría existir entre dos medias de muestras significativamente diferentes. Para obtener la fórmula para la DSM, se usa la prueba t de Student para la diferencia entre dos medias cuando las varianzas no son diferentes cuyo estadístico de contraste es:

Además, si se considera ni = nj = n, entonces

Si este valor calculado es mayor que el valor teórico (de tablas) decimos que la diferencia entre m 1 y m 2 es significativa. Así, la DSM puede considerarse como la menor de las diferencias , es decir,

donde y , por lo tanto, se tiene:

[13.6]

Ejemplo 2: Calcule la DSM de Fisher para los datos del ejemplo 1

Los valores absolutos de las diferencias entre del ejemplo 1 se muestran en la siguiente tabla.

Tabla Valores absolutos de las diferencias entre del ejemplo 1

 

¾

0.204

0.022

0.348

¾

¾

0.226

0.144

¾

¾

¾

0.370

Como se puede observar, las diferencias que exceden (DSM) están entre las medias, y , por lo tanto, sólo difieren las medias m 4 de m 1 y de m 3.

Es importante tener presente que la prueba DSM sólo se debe emplear cuando el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo tamaño no se debe usar DSM.

 




PRUEBA DE DIFERENCIA SIGNIFICATIVA HONESTA (DSH) DE TUKEY

La prueba de Diferencia Significativa Honesta (DSH) de Tukey, al igual que la DSM, sólo se debe usar después que se ha rechazado la hipótesis nula en el análisis de varianza y cuando todos los tamaños de muestra son iguales; pero a diferencia de la DSM emplea el valor . En lugar de . Este valor q se obtiene de la tabla T-8, para el nivel de significancia a , el número de tratamientos K y los grados de libertad del error, entonces:

[13.7]

Ejemplo 3: Para los datos del ejemplo 1 y a = 0.05,

Los valores absolutos de las diferencias entre del ejemplo 1 se muestran en la siguiente tabla.

Valores absolutos de las diferencias entre del ejemplo 1

 

¾

0.204

0.022

0.348

¾

¾

0.226

0.144

¾

¾

¾

0.370

Como se puede observar, las diferencias que exceden (DSH) están entre las medias, y , por lo tanto, sólo difieren las medias m 4 de m 1 y de m 3.

Es importante tener presente que la prueba DSH sólo se debe emplear cuando el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo tamaño no se debe usar DSH.

 




PRUEBA DEL RANGO MÚLTIPLE DE DUNCAN

La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia entre pares de medias después que se ha rechazado la hipótesis nula en el análisis de varianza.

Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos" (Duncan los llama rangos significativos mínimos) dados por la fórmula:

[13.8]

donde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de la tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.

Ejemplo 4: Se realizó un experimento para determinar la cantidad (en gramos) de grasa absorbida por 48 donas (doughnuts) usando ocho tipos diferentes de grasas (aceites y mantecas). Las medias para los ocho tratamientos se muestran a continuación:

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error de 141.6, los grados de libertad del error son 48 - 8 =40.

Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para a = 0.05, 2 £ p £ 8 y 40 grados de libertad.

El siguiente paso es ordenar las medias en orden creciente para establecer los "rangos".

El rango entre las medias máxima y mínima se compara con D8, esto es, , entonces existe diferencia significativa entre las grasas 4 y 7.

El próximo paso es comparar subconjuntos de siete medias con el rango D7.

, entonces

, entonces

Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos de seis medias.

, entonces

, entonces

, entonces

Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos de cinco medias

, entonces

, entonces

, entonces

, entonces

Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261 que fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con D4; por lo tanto,

, entonces

Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4 porque ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo tanto, el proceso termina.

Los resultados se muestran gráficamente en la siguiente figura, donde las medias que están debajo de una línea no son significativamente diferentes.




El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor que las 8 y 7 y las demás grasas no son significativamente diferentes en relación con la cantidad absorbida.

 




PRUEBA DE DUNNETT

En muchos experimentos uno de los tratamientos es el control, y el investigador está interesado en comparar cada una de las otras K- 1 medias de los tratamientos contra el control, por lo tanto, existen K- 1 comparaciones. Un procedimiento para realizar estas comparaciones es la prueba de Dunnett (desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces se desea probar las hipótesis

El procedimiento de Dunnett es una modificación de la prueba t. Para cada hipótesis se calcula el valor absoluto de la diferencia de medias observadas

El rechazo de la hipótesis nula se realiza con una probabilidad de error tipo I, a si

,

donde la constante se busca en la tabla T-10. Observe que f es el número de grados de libertad del error y a es el nivel de significación asociado con todos las K- 1 pruebas y utilizado en el análisis de varianza.

Ejemplo 5: En el ejemplo 1, la compañía desea comparar todas las otras plantas con la planta A que es la que cumple con los requisitos (control), por lo tanto, la prueba de Dunnett sería más adecuada que la de Fisher o la de Tukey para este caso.

En consecuencia, la única planta que difiere significativamente de la planta A es la D.

 




PRUEBA DE SCHEFFÉ

Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de usar la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de Fisher (T-7) para obtener el factor

donde K es el número de tratamientos y a el nivel de significación.

Este factor se multiplica por el error estándar de la diferencia entre dos medias para obtener la cantidad:

[13.9]

que se comparará con las diferencias entre los pares de medias de los tratamientos.

Ejemplo 6: Usando los datos del ejemplo 4, se tiene:

Si la diferencia entre cualquier par de medias excede este valor se dice que hay diferencia significativa entre las medias comparadas. Las diferencias entre las ocho medias se muestran en la siguiente tabla.

Tabla Valores absolutos de las diferencias entre del ejemplo 4

 

¾

3

7

9

13

20

23

24

¾

¾

4

6

10

17

20

21

¾

¾

¾

2

6

13

16

17

¾

¾

¾

¾

4

11

14

15

¾

¾

¾

¾

¾

7

10

11

¾

¾

¾

¾

¾

¾

3

4

¾

¾

¾

¾

¾

¾

¾

1

¾

¾

¾

¾

¾

¾

¾

¾

En este ejemplo todas las diferencias entre los pares de medias son menores que 27.3, por lo que no hay diferencia significativa entre los pares de grasas.

NOTA: Todas las pruebas estudiadas para comparar pares de medias requieren que todos los tratamientos tengan el mismo número de observaciones n. Algunos autores, entre ellos Snedecor y Cochran, han recomendado usar la media armónica nh entre los tamaños de muestra nj cuando el número de observaciones no es el mismo. Aparentemente esta aproximación no altera el error de Tipo I.

 





(C) 2003 Jose3 Texto: María José Marques Dos Santos

Home Page: José Luis García Cué