10  Függetlenmintás elrendezés két minta esetén

Már az egymintás próbák során is megjelent a függetlenség mint előfeltétel. Ebben a fejezetben is független mintákkal dolgozunk.

A fejezetben bemutatott eszközök a következő kérdések megválaszolásában segíthetnek:

Ez az elrendezés az úgynevezett between-subjects elrendezés.

Példa 10.1 Az előző fejezetben megismert kísérlet módosított változatával folytatjuk.

Készítettünk egy kérdőíves vizsgálatot a szociális szorongásról, amelyben a Félelem a negatív megítéléstől kérdőív (Watson & Friend, 1969) legrövidebb, 8 itemes, magyar változatát (Perczel-Forintos & Kresznerits, 2017) használtuk általános és klinikai populáción, mely jó belső konzisztenciával rendelkezik (Cronbach \(\alpha\) = 0,837) és nem, életkor, végzettség és szocioökonómiai státusz tekintetében nem különbözik a hosszú változattól.

A kérdőíves adatainkban jelöltük, ha a válaszadó rendelkezik F32.XX Depressziós epizód BNO kódú diagnózissal vagy F40.10 Szociális fóbia BNO kódú diagnózissal.

A minta főbb mutatói a FÉLNE-8 összpontszámokra vonatkozóan:

Statistic FELNE8
N 118.000
Missing 0.000
Mean 21.881
SE (Mean) 0.497
SD 5.404
SE (SD) 0.353
Variance 29.199
SE (Var) 3.818
Median 22.000
Min 9.000
Max 32.000
IQR 7.000
Q1 (25%) 18.000
Q3 (75%) 25.000
Skewness -0.146
SE (Skew) 0.223
Kurtosis -0.515
SE (Kurt) 0.442
Shapiro W 0.984
Shapiro p 0.166

F32.XX kódú diagnózissal rendelkezők gyakorisági táblája:

BNO N Relatív gyakoriság
Igen 27 22.9%
Nem 91 77.1%

F4010 kódú diagnózissal rendelkezők gyakorisági táblája:

BNO N Relatív gyakoriság
Igen 35 29.7%
Nem 83 70.3%

Az adatfájl letölthető: FELNE8_pelda.sav

Megoldás 10.1. A vizsgálatban (N =) 118 fő vett részt, közülük 68 nő (57,6%) és 50 férfi (42,4%). A vizsgált személyek átlagéletkora (M =) 35,16 év (SD = 2,99). A mintában a szociális szorongás (FÉLNE-8) átlagpontszáma (M =) 21,88 (SD = 5,40). A változó normál eloszlást követ (W(118) = 0,984, p = 0,166). A mintában 35 fő szociális fóbiával, és 27 fő major depresszióval diagnosztizált személy; kettős diagnózissal 10 fő rendelkezik.

10.1 Függetlenmintás t-próbák: Student-féle t-próba

A különbségek vizsgálatára t-próbát végezhetünk a független csoportok/helyzetek között. Student-féle t-próba vagy Welch-féle t-próba közül válaszhatunk, ezek közül a Student-féle t-próbának szigorúbb feltételei vannak.

A Student-féle t-próba feltételei:

  • A függő változó skála típusú
  • A csoportok/minták függetlenek egymástól
  • A függő változó megközelítőleg normál eloszlású csoportonként
  • A csoportok varianciája közel azonos (fennáll a szóráshomogenitás)

Definíció 10.1 (szóráshomogenitás) (equality of variances, homogeneity of variance)

A vizsgált függő változó szórása (varianciájának négyzetgyöke) megegyezik az összehasonlítandó két csoportban.

A szóráshomogenitás fogalma a regressziós modellek esetén a homoszkedaszticitás, hiánya, vagyis nem teljesülése a heteroszkedaszticitás.

A Welch-féle t-próbát alkalmazzuk abban az esetben, ha a szóráshomogenitás feltétele nem teljesül.

A t-próba feltételeinek ellenőrzését a következőképpen végezzük:

  • A függő változó skála típusú

    Erről meggyőződünk.

  • A csoportok/minták függetlenek egymástól

    Erről a kísérleti elrendezés biztosít minket.

  • A függő változó megközelítőleg normál eloszlású csoportonként

    Itt nem lesz elegendő, hogy egyszerű Shapiro-Wilk próbát futtatunk a vizsgált változó egészére, hanem csoportonkénti bontásban (JASP-ban: split) kell elvégeznünk a vizsgálatot.

    Erre lehetőségünk van a már jól ismert Descriptive Statistics modulban, vagy a függetlenmintás t-próba modulban (Independent Samples T-Test). Ez utóbbit javaslom, mert a szóráshomogenitás vizsgálatát is itt végezzük el.

    A függetlenmintás t-próba modulban elegendő az Assumption Checks rovatban a Normality vizsgálat kipipálása, hogy a JASP kiszámolja a csoportonkénti normalitás kombinált mutatóját.

  • A csoportok varianciája közel azonos (fennáll a szóráshomogenitás)

    A feltétel ellenőrzését a Levene-próbával vagy a Brown-Forsythe-próbával végezzük JASP-ban.

    A Levene-próba feltétele, hogy az összehasonlítandó csoportok közel azonos méretűek legyenek (ti. illesztettek) és a vizsgált változó normál eloszlású legyen. Ha ezen feltétel közül legalább az egyik nem áll fenn, akkor egy robusztus próbát, a Brown-Forsythe-próbát kell alkalmaznunk, mely esetben nem kell a csoportok illesztettek legyenek és/vagy a vizsgált változó nem kell normál eloszlást kövessen.

    A függetlenmintás t-próba modulban Assumption Checks rovatában az Equality of variances vizsgálatot pipáljuk be, és választunk a két próba közül.

    Ha a próbák eredménye szignifikáns (p < 0,05), akkor a szóráshomogenitás feltétele nem teljesül. Ha a próbák eredménye nem szignifikáns (p > 0,05), akkor a szóráshomogenitás feltétele teljesül.

Példa 10.2 (Példa Student-féle t-próbára nem illesztett minta esetén) Szeretnénk megtudni, hogy az általunk mért félelem a negatív megítéléstől átlagpontszám (FÉLNE-8) különbözik-e a major depresszióval (F32.XX) diagnosztizáltak és nem diagnosztizáltak között.

  1. Állítsuk fel a hipotézisünket!

    Nullhipotézis (H0): A depresszióval diagnosztizáltak és depresszióval nem diagnosztizáltak FÉLNE-8 pontszámon mért csoportátlaga megegyezik. Alternatív hipotézis (H1): A depresszióval diagnosztizáltak és depresszióval nem diagnosztizáltak FÉLNE-8 pontszámon mért csoportátlaga eltér.

  2. Vizsgáljuk meg az előfeltételeket!

    1. A függő változó skála típusú?

      Igen, Likert skálával mért itemek összpontszámáról van szó, így intervallumskálaként kezelhető változó.

    2. A csoportok függetlenek egymástól?

      Igen, nem lehet valaki egyszerre depresszióval diagnosztizált és nem diagnosztizált.

    3. A függő változó megközelítőleg normál eloszlású csoportonként?

      Ezt a JASP-ban ellenőrizzük a függetlenmintás t-próba modul Assumption Checks rovatában a Normality vizsgálat kipipálásával.

    4. A csoportok varianciája közel azonos (fennáll a szóráshomogenitás)?

      Ezt is a JASP-ban ellenőrizzük a függetlenmintás t-próba modul Assumption Checks rovatában az Equality of variances vizsgálat bepipálásával. Azonban el kell döntenünk, hogy az összehasonlítandó minták (csoportok) közel azonos nagyságúak-e.

      Szemrevételezzük újra az adatsorunk megismerésekor létrehozott gyakorisági táblát (amit magunk is létre tudunk hozni a JASP-ban a már ismert módon).

      Láthatjuk, hogy a százalékos megoszlás messze elmarad az 50-50%-tól, tehát a minták nem illesztettek, ezért a Levene-próba helyett a Brown-Forsythe-próbát választjuk ki.

  3. Állítsuk be a vizsgálatot JASP-ban!

  1. Olvassuk le és értelmezzük az eredményeket!

    1. Normalitásvizsgálat eredménye

      Láthatjuk, hogy a Shapiro-Wilk próba eredménye nem szignifikáns (p > 0,05), tehát a változó csoportonként követi a normál eloszlást.

    2. Szóráshomogenitás-vizsgálat eredménye

      A Brown-Forsythe-próba eredménye nem szignifikáns (p > 0,05), tehát a csoportok varianciája és szórása közel azonos, a Student-féle t-próba elvégezhető.

    3. A Student-féle t-próba eredménye.

      A JASP a megjegyzések között jelzi nekünk, hogy a lehetséges t-próbák közül a Student-féle t-próbát végezzük („Student’s t-test”).

      • A t-próba t-statiszikája: -2,391. Hogyan jött ki?

      • A szabadságfok: 116. Ez a két csoport elemszámánál kettővel kisebb érték: n1 + n2 - 2.

      • A p-érték: 0,018. A próba szignifikáns, mert \(p < 0,05\). Hogyan jött ki?

      • Cohen-d hatásnagyság: -0,524. Ez Cohen (1988) alapján közepes hatásnagyság.

Az összehasonlítandó csoportátlagokat és mögöttes eloszlásokat az alábbi ábra szemlélteti:

Egy boxplotpár és sűrűségfüggvény-pár kombinációját tartalmazó ábrát magunk is készíthetünk a JASP segítségével a modulon belül a Raincloud plots funkció kipipálásával. Az alapértelmezett ábra így fog kinézni:

Ha szeretnénk, „horizontális” formát is válaszhatunk, ez esetben egymás alatt jelennek meg a sűrűségfüggvények, a boxplotok pedig vízszintesen:

A csoportok átlagát és szórását az eredmények közlésekor le kell írni. Ehhez nem szükséges elnavigálni, a t-próbáknál a Descriptives kipipálásával a szükséges leíró statisztikák előállnak:

Megoldás 10.2. A depresszióval diagnosztizáltak és nem diagnosztizáltak FÉLNE-8 pontszámainak összehasonlítására kétoldalú függetlenmintás t-próbát végeztünk. Az adatok csoportonként normál eloszlást követtek (W(118) = 0,992, p = 0,719), számuk nem illesztett, de a szóráshomogenitás feltétele fennáll (Brown-Forsythe F(1, 116) = 0,434, p = 0,511), így a Student-féle t-próbát végeztük el. A depresszióval diagnosztizáltak FÉLNE-8 pontszáma (M = 19,74, SD = 5,63) statisztikailag szignifikánsan különbözik a depresszióval nem diagnosztizáltak pontszámától (M = 22,52, SD = 5,20), a különbség közepes hatásnagyságú: t(116) = -2,391, p = 0,018, d = -0,524.

Kiegészítés 10.1 (A Student-féle t-próba t-értékének kiszámítása). \[ t = \frac{\bar{x}_1-\bar{x}_2}{s_p \times \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}}} \]

\[ s^2_p = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2} \]

ahol: - \(\bar{x}_1\) és \(\bar{x}_2\) az 1. és 2. csoport mintaátlaga - n1 és n2 az 1. és 2. csoport mintaelemszáma - az s2p pedig a két csoport egyesített szórásnégyzete (mert azt feltételezzük, hogy a két csoport varianciája és ezáltal szórása egyenlő)

Kiegészítés 10.2 (A t-próba p-értékének kiszámítása). A kiszámított t-próba értékének a valószínűségét kiszámítjuk adott szabadságfokú (df) t-eloszláson.

Kétoldalú próba esetén

\[ p = 2 \times P(T > |t|) \]

Egyoldalú próba esetén \[ p = P(T > |t|) \]

VAGY

\[ p = P(T < |t|) \]

10.2 Függetlenmintás t-próbák: Welch-féle t-próba

A Welch-féle t-próba feltételei:

  • A függő változó skála típusú
  • A csoportok/minták függetlenek egymástól
  • A függő változó megközelítőleg normál eloszlású csoportonként

A Welch-féle t-próbához nem szükséges feltétel a szóráshomogenitás. Így ezt a próbát alkalmazzuk, amikor a Levene- vagy Brown-Forsythe-próbánk szignifikáns (p < 0,05) eredményt ad.

Ehhez JASP-ban elegendő a függetlemintás t-próbák modulban kipiálni a Welch tesztet. (És saját magunk összezavarásának elkerülésére kivenni a pipát a Student teszt elől.)

Egy adatsor elemzése pontosan ugyanolyan elven történik, ahogy a Student-féle t-próba esetén láttuk, és az eredmények közlése is megegyezik (értelemszerűen a Student-féle próba helyett Welch-féle t-próbát hivatkozunk).

Kiegészítés 10.3 (A Welch-féle t-próba t-értékének kiszámítása). \[ t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2}}} \]

ahol:

  • \(\bar{x}_1\) és \(\bar{x}_2\) az 1. és 2. csoport mintaátlaga
  • n1 és n2 az 1. és 2. csoport mintaelemszáma
  • s1 és s2 az 1. és 2. csoport szórása

A próba szabadságfokát Welch–Satterthwaite-féle közelítéssel számítjuk.

\[ df \approx \frac{\left( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \right)^2}{\frac{\left( \frac{s_1^2}{n_1} \right)^2}{n_1 - 1} + \frac{\left( \frac{s_2^2}{n_2} \right)^2}{n_2 - 1}} \]

10.3 Függetlenmintás próba non-parametrikus változata: Mann-Whitney rangpróba

A Mann-Whitney-féle U próbát abban az esetben használjuk, ha az adataink nem követik a normál eloszlást vagy ordinális szintűek. Ebben az esetben teljesen mindegy, hogy a csoportok illesztettek-e és a szorásuk homogén-e. Azonban nagyon fontos, hogy a csoportok továbbra is függetlenek legyenek. A próba a két független minta mediánjának egyenlőségét teszteli.

A próbát hívhatjuk még függetlenmintás Wilcoxon rangösszeg próbának1.

A Mann-Whitney-féle rangpróba feltételei:

  • A függő változó legalább ordinális mérési szintű
  • A csoportok/minták függetlenek egymástól

A próbához kapcsolódó hipotézisek:

  • Nullhipotézis (H0): A két csoport mediánja azonos. \(med(x-y)=0\)
  • Alternatív hipotézis (H1): A két csoport mediánja eltér. \(med(x-y)≠0\)

A próba hatásnagyságát rang-biszeriális korrelációval számoljuk. Ehhez elegendő az Effect size Cohen’s d pontját kipipálnunk, a JASP a megfelelő mutatót automatikusan kiszámolja. Azonban itt nem a távolság-alapú Cohen-d értelmezést használjuk a hatás nagyságának eldöntésére, hanem a korrelációs együttható alapú megközelítést.

Példa 10.3 (Példa nem normál eloszlású adatok függetlenmintás próbájára) Szeretnénk megtudni, hogy az általunk mért félelem a negatív megítéléstől átlagpontszám (FÉLNE-8) különbözik-e a major depresszióval (F32.XX) diagnosztizáltak és nem diagnosztizáltak között.

Ezúttal az alábbi adatsort használjuk a személtetésre:

BNO N Relatív gyakoriság
Igen 68 50.0%
Nem 68 50.0%

A minta fő mutatói a FÉLNE-8 összpontszámokra vonatkozóan:

Statistic FELNE8
N 136.000
Missing 0.000
Mean 19.243
SE (Mean) 0.399
SD 4.656
SE (SD) 0.283
Variance 21.681
SE (Var) 2.639
Median 18.500
Min 5.000
Max 31.000
IQR 5.000
Q1 (25%) 17.000
Q3 (75%) 22.000
Skewness 0.176
SE (Skew) 0.208
Kurtosis 0.534
SE (Kurt) 0.413
Shapiro W 0.966
Shapiro p 0.002

Az adatsor itt letölthető: FELNE8_nonnormal.sav

  1. Vizsgáljuk meg az előfeltételeket!

    1. A függő változó legalább ordinális típusú?

      Igen, Likert skálával mért itemek összpontszámáról van szó, így intervallumskálaként kezelhető változó.

    2. A csoportok függetlenek egymástól?

      Igen, nem lehet valaki egyszerre depresszióval diagnosztizált és nem diagnosztizált.

  2. Állítsuk be a vizsgálatot JASP-ban!

  3. Olvassuk le és értelmezzük az eredményeket!

    1. Normalitásvizsgálat eredménye

      Láthatjuk, hogy a Shapiro-Wilk próba eredménye szignifikáns (p < 0,05), tehát a változó csoportonként nem követi a normál eloszlást, ezért parametrikus próbát nem végezhetünk.

    2. Szóráshomogenitás-vizsgálat eredménye

      Bár a Mann-Whitney rangpróbához nem szükséges feltétel, olvassuk le az eredményét.

      A Brown-Forsythe-próba eredménye is szignifikáns (p < 0,05), tehát a csoportok varianciája és szórása közel sem azonos. (Ugyan illesztettek az elemszámok a csoportok között, de nem normál az eloszlásuk, ezért Levene próba nem végezhető így sem.)

    3. A Mann-Whitney rangpróba eredménye.

      A JASP a megjegyzések között jelzi nekünk, hogy a lehetséges t-próbák közül a Mann-Whitney-féle rangpróbát végezzük („Mann-Whitney U test”).

      • A próba W-statiszikája: 1058.

      • A p-érték: 4e-08, vagyis helyesen hivatkozva p < 0,001. A próba szignifikáns, mert \(p < 0,05\).

      • Rang-biszeriális hatásnagyság: -0,542. Ez Cohen (1988) alapján nagy hatásnagyság. Figyeljünk, hogy itt a korrelációs együttható értelmezési táblázatát nézzük!

Az összehasonlítandó csoportátlagokat és mögöttes eloszlásokat az alábbi ábra szemlélteti:

Egy boxplotpár és sűrűségfüggvény-pár kombinációját tartalmazó ábrát magunk is készíthetünk a JASP segítségével a modulon belül a Raincloud plots funkció kipipálásával. Az alapértelmezett ábra így fog kinézni:

Ha szeretnénk, „horizontális” formát is válaszhatunk, ez esetben egymás alatt jelennek meg a sűrűségfüggvények, a boxplotok pedig vízszintesen:

A csoportok átlagát és szórását az eredmények közlésekor le kell írni. Ehhez nem szükséges elnavigálni, a t-próbáknál a Descriptives kipipálásával a szükséges leíró statisztikák előállnak:

Megoldás 10.3. A depresszióval diagnosztizáltak és nem diagnosztizáltak FÉLNE-8 pontszámainak összehasonlítására kétoldalú függetlenmintás t-próbát végeztünk. Az adatok csoportonként nem követték a normál eloszlást (W(136) = 0,946, p < 0,001), számuk illesztett, és a szóráshomogenitás feltétele is sérül (Brown-Forsythe F(1, 134) = 37,222, p < 0,001), így Mann-Whitney-féle rangpróbát / függetlenmintás Wilcoxon rangösszeg próbát végeztünk, ami a t-próba nemparametrikus alternatívája.

A depresszióval diagnosztizáltak FÉLNE-8 pontszáma (M = 17,32, SD = 2,11) statisztikailag szignifikánsan különbözik a depresszióval nem diagnosztizáltak pontszámától (M = 21,16, SD = 5,64), a különbség nagy hatásnagyságú: W = 1058, p < 0,001, rrb = -0,542.


  1. Nem összekeverendő a Wilcoxon előjeles rang próbával!↩︎