
3 Hipotézisvizsgálat
A hipotézis egy populációra vonatkozó állítás vagy feltételezés, aminek a tesztelésére bizonyítékot (adatot) gyűjtünk, amit statisztikai próbával (hipotézisvizsgáló eljárás) elemzünk.
A hipotézisünket nem igazoljuk, hanem a felvett, mért adatokon teszteljük a hihetőségét.
Minden hipotézisvizsgálat során két kijelentést teszünk:
Nullhipotézis (H0): ennek a visszautasításáról döntünk (ti. visszautasítjuk vagy nem)
Alternatív hipotézis (H1): a nullhipotézissel egymást kölcsönösen kizáró állítás.
A hipotézisvizsgálat során egész pontosan azt vizsgáljuk, hogy mennyi a valószínűsége annak, hogy a kapott adatokkal megegyező vagy azoknál szélsőségesebb eredményeket kapunk, ha a nullhipotézist igaznak vesszük. Ezt adja meg nekünk a próba p-értéke (Wasserstein és Lazar, 2016).
Ha például azt vizsgáljuk, hogy a klinikánkon a kliensek depressziószintje azonos-e a szomszéd klinika klienseinek depressziószintjével, akkor az alábbi hipotéziseket állítjuk fel:
- H0: A két minta átlaga egyenlő.
- H1: A két minta átlaga nem egyenlő.
Az alternatív hipotézés megfogalmazható a fenti módon (kétoldalú próbához), ahol szimplán tagadjuk a nullhipotézist, de megfogalmazhatjuk intervallumra vonatkozóan („nagyobb/kisebb, mint…” formában) is. Ez esetben a statisztikai próbánk során egyoldalú p-értéket kapunk.
Kiválasztjuk ennek tesztelésére a statisztikai eljárást, ami a függetlenmintás t-próba lesz.
A hipotézisvizsgálat során azonban elkövethetünk hibákat:
Lehet fals pozitív döntésünk, ez az elsőfajú hiba (Type I error).
Előzetesen (a priori) rögzítjük, hogy mennyi esélyt adunk ennek a hibának: ez lesz a statisztikai próbánk szignifikanciaszintje (α). Pszichológiai kutatásokban ezt 5%-on szoktuk rögzíteni, vagyis α = 0,05 kritériumszintet határozunk meg. Ha a próbánk p-értéke ennél nagyobb, akkor a próba statisztikailag nem szignifikáns, tehát nem utasítjuk el a nullhipotézist. Ha a p-érték ennél kisebb, akkor elutasítjuk a nullhipotézist, a próbánk statisztikailag szignifikáns.
Lehet fals negatív döntésünk, ez a másodfajú hiba (Type II error).
Ennek a kritériumszintjét β-val jelöljük. Ezt a kritériumszintet nem tudjuk előre rögzíteni, mert ez a mintaelemszám, a szignifikanciaszint, és egyéb paraméterek (pl. hatásnagyság, elemszám-illesztettség stb.) függvénye. Előzetes (a priori) mintaelemszám-becslés során azonban 1–β vagy β alakban tudjuk megadni, hogy kiszámoljuk, hogy adott statisztikai erőhöz vagy másodfajú hiba mellett milyen mintaelemszámra van szükségünk adott hatásnagyság mellett.
A helyesen meghozott döntések közül az 1–β a statisztikai próbánk ereje: annak a valószínűsége, hogy helyesen elutsítjuk a nullhipotézist, vagyis annak a valószínűsége, hogy detektálunk egy valós hatást.
| Elutasítom a H0-t | Nem utasítom el a H0-t | |
|---|---|---|
| Valójában H0 hamis | helyes döntés (1 - β) a próba ereje | másodfajú hiba: fals negatív (β) |
| Valójában H0 igaz | elsőfajú hiba: fals pozitív (α) | helyes döntés (1 – α) |
Lefordítva a példánkra:
| Elutasítom a H0-t, miszerint a két átlag egyenlő (tehát van különbség) | Nem utasítom el a H0-t, miszerint a két átlag egyenlő (tehát nincs különbség) | |
|---|---|---|
| Valójában van különbség (a H0 hamis) | helyes döntés (1 - β) | másodfajú hiba: fals negatív (β) |
| Valójában nincs különbség (a H0 igaz) | elsőfajú hiba: fals pozitív (α) | helyes döntés (1 – α) |
A következő ábrán alsó görbe mutatja a nullhipotézishez tartozó eloszlást, ahol a két csoport különbsége nulla köré várható.
A felső két görbe mutatja az alternatív hipotézist, miszerint ténylegesen van különbség a két minta között (jelen esetben -20 és 20 a különbség, amit ábrázoltunk).
Ha kétoldali próbát végzünk, akkor az α szignifikanciánkat kettéosztjuk, a kritériumszint (szaggatott vonal) az α/2-höz (narancssárga terület) igazodik. Vagyis annak az esélye, hogy elutasítjuk a nullhipotézist, miközben az igaz.
A statisztikai erőt (1 - β) mutató kékeszöld terület annak a valószínűsége, hogy helyesen elutasítjuk a nullhipotézist, ha az alternatív hipotézis igaz.
A kutatásunk eredménye alapján mi már valójában tudjuk, hogy pozitív vagy negatív a különbség, de ha kétoldalú próbát tesztelünk, akkor annak az ára, hogy kisebb statisztikai erővel dolgozunk.
Ha egyoldalú próbával dolgozunk, akkor az α érték nem oszlik ketté, a próbánk ereje is nagyobb lesz, de a másik irányra nem tudunk tesztelni:

A példánkra lefordítva, a következőképpen néznek ki az összehasonlítandó minták eloszlásai:

Tudjuk, hogy a mi klinikánk átlaga (M =) 107, szórása (SD =) 27,11, míg a másik klinika átlaga 120, szórása 27,11. Mindkét minta 30-30 fős. Látjuk tehát, hogy a különbség 13 (a mi klinikánkon alacsonyabb a depresszió).
Azonban a kiválasztott kétoldalú statisztikai próba (kétoldalú függetlenmintás t-próba) során kiszámítunk egy t-értéket, ami 1,8572 lesz. A próbához tartozó szabadságfokunk 58 (60 fő összesen - 2), a különbség standard hibája 7,000. Ezt követően kiszámítjuk, hogy egy 58-as szabadságfokú t-eloszláson az x = -1,8572 és x =-∞ közötti függvény alatti terület mekkora (ez adja meg a p/2 értéket), ami 0,03418, majd az x = 1,8572 és x = +∞ közötti függény alatti területet (a másik oldali p/2 érték), ami szintén 0,03418, majd ezeket összeadva megkapjuk a próbánk p-értékét, ami 0,06836. (Nyilvánvalóan elég az egyiket kiszámítani és megszorozni kettővel). Tehát az az eredményünk, hogy statisztikailag nincs szignifikáns különbség a csoportok átlagai között (ennek oka lehet a magas szórás és kis mintaelemszám, valamint kis különbség), ha 5%-on rögzítettük az α szignifikanciát.
Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SEdiff = 7 érték melett α = 5% szignifikanciaszinten, de kétoldalú próba esetén, tehát oldalanként 2,5-2,5%-os elfogadási tartománnyal. Tehát a H0-hoz tartozó görbén a kritériumszint alatti értéket látunk, vagyis nem utasíthatjuk el a H0-t.

Ha egyoldalú próbát végzünk, akkor a p-értékünk:
- vagy 1-hez közelítve 0,96582 (mert nem abban az irányban van az eltérés)
- vagy 0,03418 lenne, ami már szignifikáns eltérés α = 5% szignifikancia mellett.
Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SEdiff = 7 értékkel α = 5% szignifikanciaszinten. Tehát a H0-hoz tartozó ábrán a kritériumszint fölötti értéket mutatunk, vagyis el kell utasítsuk a H0-t.

A t-próbának egyéb feltételei is vannak, amiket vizsgálnunk kellett volna, ezeket a 9-11 fejezetek tartalmazzák majd. Mindenesetre a statisztikai hipotézisvizsgálatnak ez a módja.