Prueba de Shapiro-Wilk

En estadística, la prueba de Shapiro-Wilk se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hipótesis nula que una muestra x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}} proviene de una población normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk.[1]​ Se considera uno de las pruebas más potentes para el contraste de normalidad.

El estadístico de la prueba es:

W = ( i = 1 n a i x ( i ) ) 2 i = 1 n ( x i x ¯ ) 2 {\displaystyle W={\left(\sum \limits _{i=1}^{n}a_{i}x_{(i)}\right)^{2} \over \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}

donde

  • x ( i ) {\displaystyle x_{(i)}} (con el subíndice i {\displaystyle i} entre paréntesis) es el número que ocupa la i {\displaystyle i} -ésima posición en la muestra (con la muestra ordenada de menor a mayor);
  • x ¯ = x 1 + + x n n {\displaystyle {\bar {x}}={\frac {x_{1}+\cdots +x_{n}}{n}}} es la media muestral;
  • las variables a i {\displaystyle a_{i}} se calculan[2]
( a 1 , , a n ) = m V 1 ( m V 1 V 1 m ) 1 / 2 {\displaystyle (a_{1},\dots ,a_{n})={m^{\top }V^{-1} \over (m^{\top }V^{-1}V^{-1}m)^{1/2}}}
donde
m = ( m 1 , , m n ) {\displaystyle m=(m_{1},\dots ,m_{n})^{\top }\,}
siendo m 1 , , m n {\displaystyle m_{1},\dots ,m_{n}} los valores medios del estadístico ordenado, de variables aleatorias independientes e identicamente distribuidas, muestreadas de distribuciones normales y V {\displaystyle V} denota la matriz de covarianzas de ese estadístico de orden.

La hipótesis nula se rechazará si W {\displaystyle W} es demasiado pequeño.[3]​ El valor de W {\displaystyle W} puede oscilar entre 0 y 1.

Interpretación: Siendo la hipótesis nula que la población está distribuida normalmente, si el p-valor es menor a alfa (nivel de significancia) entonces la hipótesis nula es rechazada (se concluye que los datos no vienen de una distribución normal). Si el p-valor es mayor a alfa, se concluye que no se puede rechazar dicha hipótesis.

La normalidad se verifica confrontando dos estimadores alternativos de la varianza σ²:

  • un estimador no paramétrico al numerador, y
  • un estimador paramétrico (varianza muestral), al denominador.

Véase también

Referencias

  1. Shapiro, S. S.; Wilk, M. B. (1965). «An analysis of variance test for normality (complete samples)». Biometrika 52 (3-4): 591-611. doi:10.1093/biomet/52.3-4.591. JSTOR 2333709 MR 205384. 
  2. op cit p. 593
  3. op cit p. 605

Enlaces externos

  • Algorithm AS R94 (Shapiro Wilk) FORTRAN code
  • Shapiro–Wilk Normality Test in CRAN
  • Shapiro–Wilk Normality Test in QtiPlot
  • How do I interpret the Shapiro-Wilk test for normality?
  • Versión en línea de la prueba de Shapiro-Wilk
Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q1396441
  • Wd Datos: Q1396441