Bartlett-Test

Als Bartlett-Test (auch: Bartletts Test) werden zwei verschiedene statistische Tests bezeichnet:

  • der Bartlett-Test auf Gleichheit der Varianzen in k {\displaystyle k} Stichproben und
  • der Bartlett-Test auf Sphärizität zur Durchführung einer Faktorenanalyse.

Beide Tests beruhen auf einem Likelihood-Quotienten-Test und setzen eine Normalverteilung voraus.

Bartlett-Test auf Gleichheit der Varianzen

Dieser Test prüft, ob k {\displaystyle k} Stichproben aus Grundgesamtheiten mit gleichen Varianzen stammen. Eine Reihe von statistischen Tests, z. B. die Varianzanalyse, setzen voraus, dass die Varianzen der k {\displaystyle k} Gruppen in der Grundgesamtheit gleich sind. Der Bartlett-Test wird zur Überprüfung dieser Voraussetzung benutzt. Er wurde 1937 von Maurice Bartlett entwickelt.[1] Dieser Test wird auch Bartletts M-Test oder Neyman-Pearson-Bartlett-Test genannt.[2]

Voraussetzung

Der Bartlett-Test setzt eine Normalverteilung für jede der k {\displaystyle k} Gruppen voraus, wobei die Mittelwerte μ i {\displaystyle \mu _{i}} und die Varianzen σ i 2 {\displaystyle \sigma _{i}^{2}} unbekannt sind, i = 1 , , k {\displaystyle i=1,\ldots ,k} . Der Test reagiert empfindlich auf die Verletzung der Normalverteilungsvoraussetzung. Alternativen sind dann der Levene-Test oder Brown-Forsythe-Test, die weniger sensitiv auf die Verletzung dieser Voraussetzung reagieren.

Hypothesen

Der Bartlett-Test testet die Nullhypothese, dass alle Gruppenvarianzen gleich sind, gegen die Alternativhypothese, dass mindestens zwei Gruppenvarianzen ungleich sind:

H 0 : σ 1 2 = = σ k 2 {\displaystyle H_{0}:\sigma _{1}^{2}=\dots =\sigma _{k}^{2}} gegen H 1 : i , j mit σ i 2 σ j 2 {\displaystyle H_{1}:\exists i,j\quad {\text{mit}}\quad \sigma _{i}^{2}\neq \sigma _{j}^{2}}

Teststatistik

Wenn die k {\displaystyle k} Gruppen die Stichprobenumfänge n i {\displaystyle n_{i}} , die Stichprobenmittel X ¯ i = 1 n i j = 1 n i X i j {\displaystyle {\bar {X}}_{i}={\frac {1}{n_{i}}}\sum _{j=1}^{n_{i}}X_{ij}} und die Stichprobenvarianzen S i 2 = 1 n i 1 j = 1 n i ( X i j X ¯ i ) 2 {\displaystyle S_{i}^{2}={\frac {1}{n_{i}-1}}\sum _{j=1}^{n_{i}}(X_{ij}-{\bar {X}}_{i})^{2}} für i = 1 , , k {\displaystyle i=1,\ldots ,k} haben, dann wird die Teststatistik definiert als

X 2 = ( N k ) ln ( S p 2 ) i = 1 k ( n i 1 ) ln ( S i 2 ) 1 + 1 3 ( k 1 ) ( [ i = 1 k 1 n i 1 ] 1 N k ) {\displaystyle X^{2}={\frac {(N-k)\ln(S_{p}^{2})-\sum \limits _{i=1}^{k}(n_{i}-1)\ln(S_{i}^{2})}{1+{\frac {1}{3(k-1)}}\left(\left[\sum \limits _{i=1}^{k}{\frac {1}{n_{i}-1}}\right]-{\frac {1}{N-k}}\right)}}}

mit N = i = 1 k n i {\displaystyle N=\sum _{i=1}^{k}n_{i}} und S p 2 = 1 N k i = 1 k ( n i 1 ) S i 2 {\displaystyle S_{p}^{2}={\frac {1}{N-k}}\sum _{i=1}^{k}(n_{i}-1)S_{i}^{2}} .

Testverteilung

Die Teststatistik X 2 {\displaystyle X^{2}} ist, bei Richtigkeit der Nullhypothese, approximativ Chi-Quadrat-verteilt mit k 1 {\displaystyle k-1} Freiheitsgraden. Die Nullhypothese wird abgelehnt, wenn die Realisierung der Teststatistik größer als χ k 1 , 1 α 2 {\displaystyle \chi _{k-1,1-\alpha }^{2}} ist. Dabei bezeichnet χ k 1 , 1 α 2 {\displaystyle \chi _{k-1,1-\alpha }^{2}} das ( 1 α ) {\displaystyle (1-\alpha )} -Quantil der Chi-Quadrat-Verteilung mit k 1 {\displaystyle k-1} Freiheitsgraden. Dieser kritische Wert wird manchmal auch als oberer 100 α {\displaystyle 100\alpha } -Prozentpunkt (engl. upper 100 α {\displaystyle 100\alpha } percentage point) der Verteilung bezeichnet und dann auch als χ k 1 , α 2 {\displaystyle \chi _{k-1,\alpha }^{2}} notiert.

Der Bartlett-Test ist eine Modifikation eines entsprechenden Likelihood-Quotienten-Tests.

Bartlett-Test auf Sphärizität

Er prüft im Rahmen der Faktorenanalyse, ob die Korrelationsmatrix der beobachteten Variablen in der Grundgesamtheit gleich der Einheitsmatrix ist. Kann diese Nullhypothese nicht abgelehnt werden, sollte die Faktorenanalyse nicht durchgeführt werden.

Voraussetzung

Der Test setzt eine multivariate Normalverteilung der Daten voraus und reagiert sensitiv auf die Verletzung dieser Voraussetzung.

Hypothesen

Der Test testet die Nullhypothese, dass die Korrelationsmatrix R {\displaystyle R} gleich der Einheitsmatrix E {\displaystyle E} ist, gegen die Alternativhypothese, dass die beiden ungleich sind:

H 0 : R = E {\displaystyle H_{0}:R=E\,} gegen H 1 : R E {\displaystyle H_{1}:R\neq E}

Teststatistik

Wenn p {\displaystyle p} die Anzahl der Variablen ist, für die die Korrelationsmatrix R {\displaystyle R} berechnet wurde, dann wird die Teststatistik definiert als

X 2 = ( n 1 2 p + 5 6 ) log ( | R | ) {\displaystyle X^{2}=-\left(n-1-{\frac {2p+5}{6}}\right)\log(|R|)}

wobei n {\displaystyle n} die Anzahl der Beobachtungen und | R | {\displaystyle |R|} die Determinante von R {\displaystyle R} ist.[3]

Die Teststatistik X 2 {\displaystyle X^{2}} ist approximativ χ p ( p 1 ) / 2 2 {\displaystyle \chi _{p(p-1)/2}^{2}} -verteilt mit p ( p 1 ) / 2 {\displaystyle p(p-1)/2} Freiheitsgraden. D. h. die Nullhypothese wird abgelehnt, wenn die Realisierung der Teststatistik größer ist als χ p ( p 1 ) / 2 , α 2 {\displaystyle \chi _{p(p-1)/2,\alpha }^{2}} .

Einzelnachweise

  1. Maurice Bartlett: Properties of sufficiency and statistical tests. In: Proceedings of the Royal Statistical Society Series A. Band 160, 1937, S. 268–282, doi:10.1098/rspa.1937.0109, JSTOR:96803. 
  2. R.E. Glaser: Bartlett's test for homogeneity of variances. In: Samuel Kotz et al. (Hrsg.): Encyclopedia of Statistical Sciences. 2. Auflage. Wiley, New York 2006, ISBN 978-0-471-15044-2, S. 3211–3213. 
  3. SPSS (2007), SPSS 16.0 Algorithms, SPSS Inc., Chicago, Illinois, S. 293.

Weblinks

  • NIST page on Bartlett's test