15 Kovarianciaanalízis (ANCOVA)

Publikálva

2026. január 6.

Módosítva

2026. április 25.

A varianciaanalízis során diszkrét változók szintjei közötti különbségeket vizsgáltunk. A kovarianciaanalízis során figyelembe vesszük más skála típusú változók hatását is (kovariáló tényező).

Például egészségügyi mutatókbeli (függő változó) különbséget vizsgálunk terápiás és kontroll csoportok között (független változó), de figyelembe vesszük az életkort mint kovariáló tényező hatását egészségügyi mutatókra (kovariáló tényező).

Az ANCOVA előnye, hogy a normál ANOVA maradványértékekben fellelhető reziduális varianciát is megpróbáljuk magyarázni, kontrolláljuk, ezáltal megnövekszik az F-próbánk ereje. Illetve ha a kísérletünk során nem tudtuk a kovariáló tényezőt kontrollálni, akkor statisztikailag megtehetjük az ANCOVA segítségével (feltéve, ha mérni tudtuk).

A számítás alapja egy korrigált átlag (adjusted mean), amely a kovariáló tényező hatását semlegesítette (partialled out).

\[ \bar{Y^{'}}_{j} = \bar{Y}_{j} + B_{1}(\bar{X}_T - \bar{X}_j) \]

ahol az \(\bar{Y^{'}}_{j}\) a korrigált átlag, \(\bar{Y}_{j}\) a csoportok átlagai, \(B_{1}\) a nem sztenderdizált regressziós koefficiense a kovariáló tényezőnek, \(\bar{X}_T\) a kovariáló tényező grand átlaga, \(\bar{X}_j\) pedig a kovariáló tényező csoportátlaga.

15.1 A kovarianciaanalízis feltételei

A kovarianciaanalízis feltételei megegyeznek az ANOVA feltételeivel az alábbi kiegészítésekkel:

A kovariáló tényező skála típusú változó
A kovariáló tényező pontosan mért változó kevés hibával, zajjal

Ha a például a kovariáló tényezőt alkotó kérdőív / alskála belső reliabilitása (McDonald ω vagy Cronbach α) alacsony, növekszik az elsőfajú hiba esélye.
A kovariáló tényező és a diszkrét változók függetlenek egymástól

A feltétel sérülése azzal jár, hogy nem megbízható az elemzés.
A kovariáló tényező és a függő változó közötti kapcsolat lineáris

A kapcsolat fennállását és a linearitását korrelációs elemzéssel és scatterplot ábrával ellenőrizzük előzetesen. Ha nem korrelál a kovariáló tényező a függő változóval, akkor a használatára sincs szükség.

Nemlineáris kapcsolat esetén polinomiális kovarianciaanalízist kell végezni.

Utólagosan a kovariáló tényező szignifikanciája igazolja az erős lineáris kapcsolatot.
A kovariáló tényező regressziós meredekségének homogenitása a diszkrét változók minden szintjén

Ha a kovariáló tényező és a kategóriaváltozó interakciója szignifikáns, az azt jelenti, hogy a kovariáló tényező és a függő változó közötti kapcsolat mértéke (a regressziós egyenes meredeksége) eltér a kategóriaváltozó különböző szintjein, tehát az ANCOVA egyik alapfeltétele sérül.

Hogy ezt ellenőrizni tudjuk, JASP-ban az ANCOVA modell megépítésénél nekünk kell specifikálnunk a kategóriaváltozó és kovariáló tényező interakcióját és hozzáadni a modellhez:
- A Model szekcióban kiválasztjuk a két változót (Ctrl vagy Cmd + kijelölés segítségével), aminek az interakcióját szeretnénk hozzáadni a modellhez
- majd hozzáadjuk a Model Terms rovathoz
- és leolvassuk az ANCOVA eredmények között a nevesített interakció p értékét.
Ha ez a feltétel nem teljesül, akkor Moderált Regressziót vagy Johnson-Neyman procedúrát kell alkalmazni.
Nincs multikollinearitás a kovariáló tényezők között (ha több van)

Ha több kovariáló tényezőt viszünk be a modellbe, akkor ellenőrizni kell a tolerancia vagy a VIF értéket. Ezt viszont jelenleg csak a lineáris regressziós modulban tudjuk megtenni a Tolerance and VIF elemzés segítségével, miután beállítottuk a vizsgált változót függő változóként és a kovariáló tényezőket a Covariates rovatban.

15.2 Példa kovarianciaanalízisre

Példa 15.1 (Példa 2x3 faktoros kovarianciaanalízisre) Kutatásunkban azt vizsgáltuk, hogy melyik terápiás módozatnak (CBT, sématerápia, kontroll) nagyobb az azonnali terápiás hatása a szorongás csökkentésére (intervenció utáni szorongás). Másodlagosan azt vizsgáltuk, hogy ugyanúgy hatnak-e az egyes módozatok a nemekre. A vizsgálatban csoportonként 20-20 férfi és nő vett részt, összesen (N = ) 120 fő. A második elemzésünkben megvizsgáltuk, hogy változnak-e a feltárt eredmények, ha figyelembe vesszük az egyes csoportok kezdeti összetételét (kezdeti szorongás).

Az adatsor itt letölthető: Terapia_nem_prepost.sav

1. ANOVA kovariáns nélkül

A minták illesztettek, a függetlenség nem sérül, a vizsgált változó skála típusú, a szóráshomogenitás feltétele Levene-próba alapján fennáll (F(5, 114) = 0,738, p = 0,596), a maradványértékek normalitása nem sérül (W(120) = 0,986 p = 0,328).

A táblából látható, hogy

A terápiás modalitás (Intervencio) és a nem interakciója nem szignifikáns (p = 0,696), tehát nem függ a terápiás hatékonyság a nemtől. Leolvashatjuk a főhatásokat.
Az intervenció főhatása szignifikáns nagy hatásnagysággal: F(2,114) = 43,009, p < 0,001, ω²_p = 0,412. Tukey-korrigált post-hoc teszt alapján láthatjuk, hogy minden módozatt között szignifikáns a különbség a nagy hatásnagysággal.
A nem főhatása szignifikáns kis hatásnagysággal: F(1,114) = 4,563, p = 0,035, ω²_p = 0,029. Tukey-korrigált post-hoc teszten (bár ez nem kötelező kétszintű diszkrét változó esetén) láthatjuk ugyanazt az eredményt kis hatásnagysággal (ezúttal Cohen d mutatóval).

2. ANCOVA

Ez mind szép és jó, de mi van akkor, ha a kezdeti összetételben van valamilyen különbség (ti. a programba kerüléskor ki mennyire szorongott)? A kovariancaanalízis erre adja meg a választ.

Állítsuk be a vizsgálatot JASP-ban:

Ellenőrizzük a feltételek teljesülését:

Láthatjuk, hogy a szóráshomogenitás és a maradványértékek normál eloszlása teljesül (mind a Levene-, mind a Shapiro-Wilk próba nem szignifikáns).
A kovariáló tényező skála típusú és kevés zajjal mér (vagy legalábbis ugyanannyi zajjal, mint a vizsgált változó, mert ugyanazt a kérdőívet vettük fel előtte és utána)
A kovariáló tényező és a függő változó közötti kapcsolat lineáris. Ezt egy egyszerű korrelációs vizsgálattal előzetesen tudjuk ellenőrizni. Utólagosan majd a kovariáló tényező szignifikanciája igazolja a végső modellben.
A kovariáló tényező regressziós meredekségének homogenitása a diszkrét változók minden szintjén: ehhez kézzel hozzáadtuk a Szorongas_pre és Nem változónkat (Ctr/Cmd billentyűk segítségével) és a Szorongas_pre és Intervencio változónkat a Model Terms rovathoz. Csupán ezeket az interakciókat olvassuk le, majd vegyük ki a változónkat a modellből, hogy ne zavarjon meg az értelmezésben.

Láthatjuk, hogy egyik interakció sem szignifikáns a kettőből, így teljesülnek a feltételek.
Mivel nincs egynél több kovariáló tényezőnk, multikollinearitást nem vizsgálunk.

Olvassuk le az eredményt:

Először az interakciót kell ellenőriznünk most is. Ez nem szignifikáns (p = 0,089). Tehát az intervenció és a nem főhatása nem tér el egymás szintjei között. A p-érték viszonylag alacsony, tehát nem lesznek tökéletesen párhuzamosak az értékek, ha vizualizáljuk majd.
Az intervenció főhatása továbbra is szignifikáns nagy hatásnagysággal: F(2,113) = 63,203, p < 0,001, ω²_p = 0,509.
A nem főhatása viszont már nem szignifikáns, ha kontrollálunk a kezdeti szorongással: F(1,113) = 3,394, p = 0,068, ω²_p = 0,020. Vagyis a nemek között nincs már különbség, ha a kezdeti szorongást mint zajt, kiszűrtük.
A kovariáns tényező hatása szintén szignifikáns, mégpedig nagy hatásnagysággal: F(1,113) = 81,700, p < 0,001, ω²_p = 0,402. Ez azt jelenti, hogy a kovariáló tényező és a függő változó között erős lineáris kapcsolat áll fenn, zajszűrőként történő használata statisztikailag indokolt.

Ezt követően egy Marginal Means elemzést végzünk Šidák-korrekcióval (nem pedig Simple Main Effects vizsgálatot, sem pedig Post-hoc tesztet).

A szöveges elemzésünkben ezeket a korrigált átlagokat fogjuk jelenteni, nem pedig a nyers átlagokat mindegyik szempontban (függetlenül a szignifikanciától). Értelmezni viszont csak a szignifikáns szempontot (jelen esetben az intervenció típusát) fogjuk.

(Ha a diszkrét változó és a kovariáló tényező közötti interakció szignifikáns lenne, ezt a táblázatot egyáltalán nem értelmezhetnénk, mert az ANCOVA alapfeltétele sérülne.)

Saját magunk kedvéért vagy akár a publikációnkba szerkeszthetünk egy ábrát arról, hogy hogyan viszonyulnak egymáshoz az eredeti átlagaink és a kovariáló tényezővel korrigált átlagaink. Ezt megtehetjük táblakezelő szoftverben is, vagy kézzel egy új JASP fájlban. Íme ennek a menete:

Eredménye:

Ennek az ábrának az áttekintésével az értelmezés is könnyebbé válik.

Megoldás 15.1. Többszempontos kovarianciaanalízissel vizsgáltuk, hogy mely terápiás módozat hatékonyabb a intervenció utáni közvetlen szorongás mértékére, valamint van-e különbség a nemek között a hatékonyságban. Mind a maradványértékek normalitásának feltétele (Shapiro-Wilk p = 0,241), mind a szóráshomogenitás teljesül (Levene F(5,114) = 1,172, p = 0,327). A kovariáns regressziós egyenesének meredeksége homogén a diszkrét változók minden szintjén (p~kovariáns × nem~ = 0,488, p~kovariáns × intervencio~ = 0,461).

Nem találtunk szignifikáns interakciót az intervenció típusa és a nem szempontok között: F(2,113) = 42,173, p = 0,089, ω²_p = 0,024. A kovariáló tényező hatása szignifikáns nagy hatásnagysággal (F(1,113) = 81,700, p < 0,001, ω²_p = 0,402), vagyis a kezdeti szorongás mértéke erős prediktora a kimeneti szorongás mértékének.

Az intervenció típusa mint főhatás szignifikáns nagy hatásnagysággal a kezdeti szorongás figyelembe vételével: F(2,113) = 63,203, p < 0,001, ω²_p = 0,509. A nem főhatása ellenben nem szignifikáns, ha kontrollálunk a kezdeti szorongással: F(1,113) = 3,394, p = 0,068, ω²_p = 0,020.

A Šidák-korrigált becsült mintaátlag-elemzés (Marginal Means) alapján a sématerápiás intervenció utáni szorongás mértéke volt a legalacsonyabb (M_MM = 42,66, SE = 0,656), ezt követte a kognitív viselkedésterápia (M_MM = 49,89, SE = 0,696), és várakozásunknak megfelelően legmagasabb szorongást a kontrollcsoportban (M_MM = 52,72, SE = 0,677) találtunk.

A nyersátlagok és becsült átlagok közötti különbséget a … ábra szemlélteti:

Láthatjuk, hogy sorrendváltozás ugyan nem történt, de a különbségek „meredeksége” változott. A kontroll és CBT csoport közötti különbség (Δ M_MM = 2,82) kisebb a becsült átlagok alapján, mint a nyersátlagok (Δ M_nyers = 6,65) alapján. Tehát a csoport kezdeti összetétele nem volt teljesen azonos szorongáspontszámot tekintve a két csoport között, így a kovariáló tényező figyelembe vétele nélkül a CBT hatékonysága felülreprezentált lett volna. Mindeközben a sématerápia esetén a becsült átlag a nyers átlagnál alacsonyabb (Δ M_MM-nyers = -0,59), tehát hatékonyabbnak bizonyult figyelembe véve a kezdeti pontszámokat is.