Test serii

Wikipedia:Weryfikowalność
Ten artykuł należy dopracować:
od 2023-12 → zweryfikować treść i dodać przypisy,
→ zweryfikować niektóre informacje.

Dokładniejsze informacje o tym, co należy poprawić, być może znajdują się w dyskusji tego artykułu.
Po wyeliminowaniu niedoskonałości należy usunąć szablon {{Dopracować}} z tego artykułu.

Test serii (zwany też testem serii Stevensa lub testem serii Walda-Wolfowitza) – nieparametryczny test losowości próby. Stosuje się go m.in. do sprawdzenia, czy wyniki eksperymentu spełniają postulat losowości próby.

Hipotezę zerową i alternatywną formułujemy w sposób następujący:

  • H0: dobór jednostek do próby jest losowy; model jest liniowy.
  • H1: dobór jednostek do próby nie jest losowy; model jest nieliniowy.

Jedną z metod weryfikacji wyżej zapisanej hipotezy jest test serii.

Pod pojęciem serii rozumiemy każdy ciąg identycznych elementów w zbiorze uporządkowanym według przyjętego kryterium. Na przykład jeżeli odnotujemy płeć studentów podchodzących kolejno do egzaminu, możemy otrzymać ciąg:

M M Ż Ż M Ż Ż Ż M M Ż M Ż Ż Ż.

W tym przykładowym ciągu, uporządkowanym według kolejności pojawiania się elementów dwóch rodzajów (M i Ż), powstało 8 serii składających się z jednakowych elementów występujących obok siebie. Zakładając, że pojawienie się kolejnych elementów jest losowe, ogólna liczba serii w ciągu n-elementowym jest zmienną losową K {\displaystyle K} o znanym i ujętym w tablice rozkładzie. Jest ona statystyką w opisywanym teście losowości próby.

Sposób wyznaczania wartości statystyki z próby:

  1. Kolejno zapisane n {\displaystyle n} obserwacji zmiennej ciągłej tworzy ciąg podstawowy;
  2. Obserwacje porządkujemy rosnąco i wyznaczamy medianę;
  3. W ciągu podstawowym oznaczamy symbolami A {\displaystyle A} i B {\displaystyle B} wartości różniące się od mediany:
    • x i < M e {\displaystyle x_{i}<Me} oznaczamy A , {\displaystyle A,}
    • x i > M e {\displaystyle x_{i}>Me} oznaczamy B , {\displaystyle B,}
    • x i = M e {\displaystyle x_{i}=Me} pomijamy.
  4. Analizując ustawienie symboli A {\displaystyle A} i B , {\displaystyle B,} zliczamy utworzoną liczbę serii k , {\displaystyle k,} która jest wartością statystyki otrzymaną z próby.

Obszar krytyczny testu jest dwustronny.

Jeżeli n A , n B 20 , {\displaystyle n_{A},n_{B}\leqslant 20,} to wartości krytyczne odczytujemy z tablic rozkładu liczby serii (tablica H) jako:

k 1 ( α / 2 ; n A ; n B ) {\displaystyle k_{1}(\alpha /2;n_{A};n_{B})} oraz k 2 ( 1 α / 2 ; n A ; n B ) , {\displaystyle k_{2}(1-\alpha /2;n_{A};n_{B}),}
gdzie n A {\displaystyle n_{A}} i n B {\displaystyle n_{B}} oznaczają odpowiednio liczbę elementów oznaczonych symbolami A {\displaystyle A} i B . {\displaystyle B.}

Zliczoną w próbie liczbę serii k {\displaystyle k} porównujemy z wartościami krytycznymi testu.

Jeżeli wystąpi k k 1 {\displaystyle k\leqslant k_{1}} lub k k 2 , {\displaystyle k\geqslant k_{2},} odrzucamy H0 na rzecz H1, co będzie oznaczało, że próba nie ma charakteru losowego.

Jeżeli n A {\displaystyle n_{A}} i n B 20 , {\displaystyle n_{B}\geqslant 20,} to zmienna losowa K {\displaystyle K} dąży asymptotycznie do rozkładu normalnego N { E ( K ) , D ( K ) } . {\displaystyle \mathrm {N} \{E(K),D(K)\}.} Wartość średnia i wariancja zmiennej są określone wzorami:

E ( K ) = 2 n A n B n + 1 , {\displaystyle \mathbb {E} (K)={\frac {2n_{A}n_{B}}{n}}+1,}
D 2 ( K ) = 2 n A n B ( 2 n A n B n ) ( n 1 ) n 2 . {\displaystyle D^{2}(K)={\frac {2n_{A}n_{B}(2n_{A}n_{B}-n)}{(n-1)n^{2}}}.}

Wykorzystując te parametry, obliczamy statystykę Z , {\displaystyle Z,} która przy założeniu prawdziwości H 0 {\displaystyle H_{0}} ma rozkład N(0,1).

Z = K E ( K ) D ( K ) . {\displaystyle Z={\frac {K-E(K)}{D(K)}}.}

Zobacz też

Zobacz w Wikiźródłach tablicę rozkładu normalnego
  • test statystyczny
  • przegląd zagadnień z zakresu statystyki