3 Hipotézisvizsgálat

Publikálva

2026. január 6.

Módosítva

2026. április 7.

A hipotézis egy populációra vonatkozó állítás vagy feltételezés, aminek a tesztelésére bizonyítékot (adatot) gyűjtünk, amit statisztikai próbával (hipotézisvizsgáló eljárás) elemzünk.

A hipotézisünket nem igazoljuk, hanem a felvett, mért adatokon teszteljük a hihetőségét.

Minden hipotézisvizsgálat során két kijelentést teszünk:

Nullhipotézis (H₀): ennek a visszautasításáról döntünk (ti. visszautasítjuk vagy nem)
Alternatív hipotézis (H₁): a nullhipotézissel egymást kölcsönösen kizáró állítás.

A hipotézisvizsgálat során egész pontosan azt vizsgáljuk, hogy mennyi a valószínűsége annak, hogy a kapott adatokkal megegyező vagy azoknál szélsőségesebb eredményeket kapunk, ha a nullhipotézist igaznak vesszük. Ezt adja meg nekünk a próba p-értéke (Wasserstein és Lazar, 2016).

Ha például azt vizsgáljuk, hogy a klinikánkon a kliensek depressziószintje azonos-e a szomszéd klinika klienseinek depressziószintjével, akkor az alábbi hipotéziseket állítjuk fel:

H₀: A két minta átlaga egyenlő.
H₁: A két minta átlaga nem egyenlő.

Az alternatív hipotézés megfogalmazható a fenti módon (kétoldalú próbához), ahol szimplán tagadjuk a nullhipotézist, de megfogalmazhatjuk intervallumra vonatkozóan („nagyobb/kisebb, mint…” formában) is. Ez esetben a statisztikai próbánk során egyoldalú p-értéket kapunk.

Kiválasztjuk ennek tesztelésére a statisztikai eljárást, ami a függetlenmintás t-próba lesz.

A hipotézisvizsgálat során azonban elkövethetünk hibákat:

Lehet fals pozitív döntésünk, ez az elsőfajú hiba (Type I error).

Előzetesen (a priori) rögzítjük, hogy mennyi esélyt adunk ennek a hibának: ez lesz a statisztikai próbánk szignifikanciaszintje (α). Pszichológiai kutatásokban ezt 5%-on szoktuk rögzíteni, vagyis α = 0,05 kritériumszintet határozunk meg. Ha a próbánk p-értéke ennél nagyobb, akkor a próba statisztikailag nem szignifikáns, tehát nem utasítjuk el a nullhipotézist. Ha a p-érték ennél kisebb, akkor elutasítjuk a nullhipotézist, a próbánk statisztikailag szignifikáns.
Lehet fals negatív döntésünk, ez a másodfajú hiba (Type II error).

Ennek a kritériumszintjét β-val jelöljük. Ezt a kritériumszintet nem tudjuk előre rögzíteni, mert ez a mintaelemszám, a szignifikanciaszint, és egyéb paraméterek (pl. hatásnagyság, elemszám-illesztettség stb.) függvénye. Előzetes (a priori) mintaelemszám-becslés során azonban 1–β vagy β alakban tudjuk megadni, hogy kiszámoljuk, hogy adott statisztikai erőhöz vagy másodfajú hiba mellett milyen mintaelemszámra van szükségünk adott hatásnagyság mellett.

A helyesen meghozott döntések közül az 1–β a statisztikai próbánk ereje: annak a valószínűsége, hogy helyesen elutsítjuk a nullhipotézist, vagyis annak a valószínűsége, hogy detektálunk egy valós hatást.

	Elutasítom a H₀-t	Nem utasítom el a H₀-t
Valójában H₀ hamis	helyes döntés (1 - β) a próba ereje	másodfajú hiba: fals negatív (β)
Valójában H₀ igaz	elsőfajú hiba: fals pozitív (α)	helyes döntés (1 – α)

Lefordítva a példánkra:

	Elutasítom a H₀-t, miszerint a két átlag egyenlő (tehát van különbség)	Nem utasítom el a H₀-t, miszerint a két átlag egyenlő (tehát nincs különbség)
Valójában van különbség (a H₀ hamis)	helyes döntés (1 - β)	másodfajú hiba: fals negatív (β)
Valójában nincs különbség (a H₀ igaz)	elsőfajú hiba: fals pozitív (α)	helyes döntés (1 – α)

A következő ábrán alsó görbe mutatja a nullhipotézishez tartozó eloszlást, ahol a két csoport különbsége nulla köré várható.

A felső két görbe mutatja az alternatív hipotézist, miszerint ténylegesen van különbség a két minta között (jelen esetben -20 és 20 a különbség, amit ábrázoltunk).

Ha kétoldali próbát végzünk, akkor az α szignifikanciánkat kettéosztjuk, a kritériumszint (szaggatott vonal) az α/2-höz (narancssárga terület) igazodik. Vagyis annak az esélye, hogy elutasítjuk a nullhipotézist, miközben az igaz.

A statisztikai erőt (1 - β) mutató kékeszöld terület annak a valószínűsége, hogy helyesen elutasítjuk a nullhipotézist, ha az alternatív hipotézis igaz.

A kutatásunk eredménye alapján mi már valójában tudjuk, hogy pozitív vagy negatív a különbség, de ha kétoldalú próbát tesztelünk, akkor annak az ára, hogy kisebb statisztikai erővel dolgozunk.

Ha egyoldalú próbával dolgozunk, akkor az α érték nem oszlik ketté, a próbánk ereje is nagyobb lesz, de a másik irányra nem tudunk tesztelni:

A példánkra lefordítva, a következőképpen néznek ki az összehasonlítandó minták eloszlásai:

Tudjuk, hogy a mi klinikánk átlaga (M =) 107, szórása (SD =) 27,11, míg a másik klinika átlaga 120, szórása 27,11. Mindkét minta 30-30 fős. Látjuk tehát, hogy a különbség 13 (a mi klinikánkon alacsonyabb a depresszió).

Azonban a kiválasztott kétoldalú statisztikai próba (kétoldalú függetlenmintás t-próba) során kiszámítunk egy t-értéket, ami 1,8572 lesz. A próbához tartozó szabadságfokunk 58 (60 fő összesen - 2), a különbség standard hibája 7,000. Ezt követően kiszámítjuk, hogy egy 58-as szabadságfokú t-eloszláson az x = -1,8572 és x =-∞ közötti függvény alatti terület mekkora (ez adja meg a p/2 értéket), ami 0,03418, majd az x = 1,8572 és x = +∞ közötti függény alatti területet (a másik oldali p/2 érték), ami szintén 0,03418, majd ezeket összeadva megkapjuk a próbánk p-értékét, ami 0,06836. (Nyilvánvalóan elég az egyiket kiszámítani és megszorozni kettővel). Tehát az az eredményünk, hogy statisztikailag nincs szignifikáns különbség a csoportok átlagai között (ennek oka lehet a magas szórás és kis mintaelemszám, valamint kis különbség), ha 5%-on rögzítettük az α szignifikanciát.

Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SE_diff = 7 érték melett α = 5% szignifikanciaszinten, de kétoldalú próba esetén, tehát oldalanként 2,5-2,5%-os elfogadási tartománnyal. Tehát a H₀-hoz tartozó görbén a kritériumszint alatti értéket látunk, vagyis nem utasíthatjuk el a H₀-t.

Ha egyoldalú próbát végzünk, akkor a p-értékünk:

vagy 1-hez közelítve 0,96582 (mert nem abban az irányban van az eltérés)
vagy 0,03418 lenne, ami már szignifikáns eltérés α = 5% szignifikancia mellett.

Az alábbi ábrán a +13-as különbséget látjuk ábrázolva SE_diff = 7 értékkel α = 5% szignifikanciaszinten. Tehát a H₀-hoz tartozó ábrán a kritériumszint fölötti értéket mutatunk, vagyis el kell utasítsuk a H₀-t.

A t-próbának egyéb feltételei is vannak, amiket vizsgálnunk kellett volna, ezeket a 9-11 fejezetek tartalmazzák majd. Mindenesetre a statisztikai hipotézisvizsgálatnak ez a módja.