3  Hipotézisvizsgálat

Publikálva

2026. január 6.

Módosítva

2026. április 7.

A hipotézis egy populációra vonatkozó állítás vagy feltételezés, aminek a tesztelésére bizonyítékot (adatot) gyűjtünk, amit statisztikai próbával (hipotézisvizsgáló eljárás) elemzünk.

A hipotézisünket nem igazoljuk, hanem a felvett, mért adatokon teszteljük a hihetőségét.

Minden hipotézisvizsgálat során két kijelentést teszünk:

  1. Nullhipotézis (H0): ennek a visszautasításáról döntünk (ti. visszautasítjuk vagy nem)

  2. Alternatív hipotézis (H1): a nullhipotézissel egymást kölcsönösen kizáró állítás.

A hipotézisvizsgálat során egész pontosan azt vizsgáljuk, hogy mennyi a valószínűsége annak, hogy a kapott adatokkal megegyező vagy azoknál szélsőségesebb eredményeket kapunk, ha a nullhipotézist igaznak vesszük. Ezt adja meg nekünk a próba p-értéke (Wasserstein és Lazar, 2016).

Ha például azt vizsgáljuk, hogy a klinikánkon a kliensek depressziószintje azonos-e a szomszéd klinika klienseinek depressziószintjével, akkor az alábbi hipotéziseket állítjuk fel:

Az alternatív hipotézés megfogalmazható a fenti módon (kétoldalú próbához), ahol szimplán tagadjuk a nullhipotézist, de megfogalmazhatjuk intervallumra vonatkozóan („nagyobb/kisebb, mint…” formában) is. Ez esetben a statisztikai próbánk során egyoldalú p-értéket kapunk.

Kiválasztjuk ennek tesztelésére a statisztikai eljárást, ami a függetlenmintás t-próba lesz.

A hipotézisvizsgálat során azonban elkövethetünk hibákat:

A helyesen meghozott döntések közül az 1–β a statisztikai próbánk ereje: annak a valószínűsége, hogy helyesen elutsítjuk a nullhipotézist, vagyis annak a valószínűsége, hogy detektálunk egy valós hatást.

Elutasítom a H0-t Nem utasítom el a H0-t
Valójában H0 hamis helyes döntés (1 - β) a próba ereje másodfajú hiba: fals negatív (β)
Valójában H0 igaz elsőfajú hiba: fals pozitív (α) helyes döntés (1 – α)

Lefordítva a példánkra:

Elutasítom a H0-t, miszerint a két átlag egyenlő (tehát van különbség) Nem utasítom el a H0-t, miszerint a két átlag egyenlő (tehát nincs különbség)
Valójában van különbség (a H0 hamis) helyes döntés (1 - β) másodfajú hiba: fals negatív (β)
Valójában nincs különbség (a H0 igaz) elsőfajú hiba: fals pozitív (α) helyes döntés (1 – α)

A következő ábrán alsó görbe mutatja a nullhipotézishez tartozó eloszlást, ahol a két csoport különbsége nulla köré várható.

A felső két görbe mutatja az alternatív hipotézist, miszerint ténylegesen van különbség a két minta között (jelen esetben -20 és 20 a különbség, amit ábrázoltunk).

Ha kétoldali próbát végzünk, akkor az α szignifikanciánkat kettéosztjuk, a kritériumszint (szaggatott vonal) az α/2-höz (narancssárga terület) igazodik. Vagyis annak az esélye, hogy elutasítjuk a nullhipotézist, miközben az igaz.

A statisztikai erőt (1 - β) mutató kékeszöld terület annak a valószínűsége, hogy helyesen elutasítjuk a nullhipotézist, ha az alternatív hipotézis igaz.

A kutatásunk eredménye alapján mi már valójában tudjuk, hogy pozitív vagy negatív a különbség, de ha kétoldalú próbát tesztelünk, akkor annak az ára, hogy kisebb statisztikai erővel dolgozunk.

Ha egyoldalú próbával dolgozunk, akkor az α érték nem oszlik ketté, a próbánk ereje is nagyobb lesz, de a másik irányra nem tudunk tesztelni:

A példánkra lefordítva, a következőképpen néznek ki az összehasonlítandó minták eloszlásai:

Tudjuk, hogy a mi klinikánk átlaga (M =) 107, szórása (SD =) 27,11, míg a másik klinika átlaga 120, szórása 27,11. Mindkét minta 30-30 fős. Látjuk tehát, hogy a különbség 13 (a mi klinikánkon alacsonyabb a depresszió).

Azonban a kiválasztott kétoldalú statisztikai próba (kétoldalú függetlenmintás t-próba) során kiszámítunk egy t-értéket, ami 1,8572 lesz. A próbához tartozó szabadságfokunk 58 (60 fő összesen - 2), a különbség standard hibája 7,000. Ezt követően kiszámítjuk, hogy egy 58-as szabadságfokú t-eloszláson az x = -1,8572 és x =-∞ közötti függvény alatti terület mekkora (ez adja meg a p/2 értéket), ami 0,03418, majd az x = 1,8572 és x = +∞ közötti függény alatti területet (a másik oldali p/2 érték), ami szintén 0,03418, majd ezeket összeadva megkapjuk a próbánk p-értékét, ami 0,06836. (Nyilvánvalóan elég az egyiket kiszámítani és megszorozni kettővel). Tehát az az eredményünk, hogy statisztikailag nincs szignifikáns különbség a csoportok átlagai között (ennek oka lehet a magas szórás és kis mintaelemszám, valamint kis különbség), ha 5%-on rögzítettük az α szignifikanciát.

Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SEdiff = 7 érték melett α = 5% szignifikanciaszinten, de kétoldalú próba esetén, tehát oldalanként 2,5-2,5%-os elfogadási tartománnyal. Tehát a H0-hoz tartozó görbén a kritériumszint alatti értéket látunk, vagyis nem utasíthatjuk el a H0-t.

Ha egyoldalú próbát végzünk, akkor a p-értékünk:

Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SEdiff = 7 értékkel α = 5% szignifikanciaszinten. Tehát a H0-hoz tartozó ábrán a kritériumszint fölötti értéket mutatunk, vagyis el kell utasítsuk a H0-t.

A t-próbának egyéb feltételei is vannak, amiket vizsgálnunk kellett volna, ezeket a 9-11 fejezetek tartalmazzák majd. Mindenesetre a statisztikai hipotézisvizsgálatnak ez a módja.