Készenléti táblázatok
Érzék és az asztal elrendezése. A kontingencia vagy kereszttábla két (vagy több) frekvenciatábla kombinációja, így minden egyes belső cella a kereszttáblázatos változók specifikus értékeinek (más néven kategóriáknak) egyedi kombinációját képviseli. Így lehetővé teszi a válaszadók gyakoriságának, számának meghatározását, amelyek egynél több változó esetében meghatározott kategóriába tartoznak. Ezeknek a frekvenciáknak a vizsgálata lehetővé teszi a kereszttáblázott változók közötti kapcsolat, kapcsolat meghatározását. A kontingenciatábla csak névleges változók vagy numerikus változók számára alkalmas, amelyek viszonylag kis számú értéket érnek el. Ha nagyobb számú megszerzett értéket kell használni egy numerikus változóhoz, akkor először át kell kódolni, ahol a változó értékei egyértelműen egy kategóriához lesznek rendelve (pl. Alacsony, közepes, magas).
2x2 asztal. A kontingenciatábla legegyszerűbb formája egy 2x2-es tábla, ahol mindkét változó bináris, és csak két lehetséges értéket szerez be. Például a nem és az adott ital népszerűségének kapcsolatának meghatározásához az A vagy a B gyártótól a következő adatokat használjuk:
Az így létrejövő készenléti táblázat úgy nézhet ki, mint pl. alábbiak szerint:
Mindegyik tábla cella két kereszttáblázott változó értékének egyedi kombinációját képviseli. A cellában lévő szám az a válaszadók száma, akik a sor és az oszlop fejlécében megszerzik a változók értékeit. Ez a táblázat azt mutatja, hogy több nő, mint férfi, az A gyártót választja, és több férfi, mint a B. gyártót. Így a nem és a gyártó olyan kapcsolatban állhat, amelyet bizonyítani vagy cáfolni kell.
Marginális számok. A marginális vagy egyéb módon marginális számok a táblázat jobb oszlopában és alsó sorában találhatók, és megegyeznek a vizsgált változók gyakorisági táblázataival, amelyeket a leíró statisztikák írnak le. A marginális számok hasznosak annak becslésében, hogy van-e összefüggés a vizsgált változók között. Mivel az A termelőben a férfiak és a nők aránya 40:60, ha ugyanaz az arány lenne az egész csoportban, akkor arra a következtetésre juthatnánk, hogy az A gyártó népszerűsége nem kapcsolódik a nemhez. Ebben az esetben az „A” oszlopban szereplő arány csak a férfiak és a nők teljes arányát tükrözné.
Sor, oszlop és összes százalék. Az előző példa megmutatta, hogy a kereszttáblázott változók közötti kapcsolat megbecsüléséhez hasznos összehasonlítani a belső cellák értékeit a marginálisokkal. Az egyszerűség kedvéért kényelmesebb a százalékban kifejezett frekvenciákkal dolgozni.
Kontingencia táblázatok grafikus bemutatása. Lehetőség van a táblázat sorainak és oszlopainak oszlopdiagramként történő bemutatására, vagy az egész tábla egyetlen grafikonral, háromdimenziós hisztogrammal. Egy másik lehetőség egy kategorizált hisztogram használata, ahol az egyik változót külön hisztogramok mutatják be a másik értékéhez.
Stub-and-banner táblák. Ha csak két változót kell értékelni egy kereszttáblában, akkor kétirányú tábláról beszélünk. Ha azonban több változó áll rendelkezésre, és ezeknek a változóknak több párjáról szóló kétirányú táblázatok érdekesek, akkor sűrített formában egy, ún. csonk és szalag táblák.
Többutas táblák vezérlő változóval. Ha két kategóriánál több változó kapcsolatának értékelésére van szükség, akkor többutas tábláról beszélünk. Elméletileg a többirányú táblázatban a változók száma korlátlan, de a gyakorlati eredményt már nagyon nehéz leolvasni az 5-ös változók számára. Az ilyen táblázatokban lévő kapcsolatok elemzéséhez jó olyan modelltechnikákat alkalmazni, mint a log-lineáris elemzés vagy a levelezési elemzés.
Statisztika a készenléti táblákban. Az alábbi táblázat nagyon szoros kapcsolatot mutat be a válaszadók életkora (felnőtt vagy gyermek) és egy adott típusú desszert (A vagy B) népszerűsége között.
Összességében a felnőttek az A, míg a gyerekek a B desszertet részesítik előnyben. Kétségtelen a vizsgált változók közötti kapcsolat. A gyakorlatban azonban az ülés nem olyan erős, és az a kérdés, hogy miként értékelhető a megbízhatósága, azaz a statisztikai szignifikancia. Az alábbi áttekintés két kategorikus változó kapcsolatának legáltalánosabb mérőszámait tartalmazza. Ezért kétirányú táblázatok statisztikai elemzése.
Pearson khi-négyzet tesztje. A két kategorikus változó közötti kapcsolat megbízhatóságának ezt a mértékét használják a leggyakrabban. A teszt a kontingenciatábla celláiban a tényleges frekvenciák különbségeinek mérésén alapul, a vártakkal ellentétben, ahol a várható cella frekvenciát az adott sor és oszlop határfrekvenciájának szorzatának és a teljes szám. A khi-négyzet teszt jelentősége a mért különbségek növekedésével nő, a bevezetővel összhangban a khi-négyzet teszt értéke és jelentősége a válaszadók teljes számától is függ. Nagy számukkal a megszerzett frekvenciáknak a vártaktól való kis eltérései is statisztikai szignifikanciához vezethetnek.
A chi-négyzet teszt alkalmazásának egyetlen előfeltétele (a minta kiválasztására vonatkozó szabályokon kívül) az a szabály, hogy a várható frekvenciák nem lehetnek nagyon kicsiek, 5-nél kisebbek.
A legnagyobb valószínűségű khi-négyzet teszt. Ez a teszt ugyanazt a hipotézist teszteli, mint az előző, de a maximális valószínűség elméletén alapszik. A gyakorlatban az eredmény nagyon közel áll Pearson khi-négyzet tesztjéhez.
Yates korrekció. Ez egy továbbfejlesztett chi-square teszt a típusú táblákhoz 2x2. Alkalmas arra az esetre, ha a táblázat kis tényleges frekvenciákat tartalmaz, így a várható frekvenciák is kisebbek, mint 10.
Fisher pontos tesztje. Csak táblázatokra alkalmazható 2x2 pri malom n. Ezen az elven alapul: A táblázatban a határfrekvenciák meg vannak adva, és tegyük fel, hogy a teljes populációra nézve igaz, hogy a táblázatban vizsgált két változó nincs összefüggésben. Mennyi a valószínűsége annak, hogy ezekben a feltételezésekben egyenlőtlen vagy rosszabb sejtfrekvenciákat fogunk elérni, mint nálunk? Kis n esetén ez a valószínűség pontosan számszerűsíthető az összes lehetséges táblázat elemzésével adott határfrekvenciák alapján.
McNemarov khi-négyzet teszt. A teszt alkalmazható 2x2 táblázatok és független mérések. Például a kísérlet előtti és utáni mérés, ahol a félév elején és végén megmérjük a teszten elbukott hallgatók számát. Két chi-négyzet tesztet kapunk. Az A/D teszt azt a hipotézist teszteli, hogy az A (bal felső) és a D (jobb alsó) cellák száma megegyezik. A B/C teszteli azt a hipotézist, hogy a B (jobb felső) és a C (bal alsó) cellák száma megegyezik.
Együttható Phi. Ez a két kategorikus változó közötti korreláció mértéke 2x2 táblázatok. A phi együttható értéke -1 és 1 között lehet, 0 azt jelenti, hogy a változók nem korrelálnak, -1 vagy 1, hogy teljesen függenek.
Tetrachorikus összefüggés. Ezek a statisztikák csak a következőkre vonatkoznak 2x2 táblázatok, ahol mindkét változó az eredetileg folytonos változók mesterséges kategorizálásával jött létre.
Eshetőség együttható - C . Két változó kapcsolatának mértéke a Pearson khi-négyzet tesztje alapján. Az eredeti chi-kvadráthoz képest könnyebb értelmezni, mert értékei kívül esnek, 0 jelentése abszolút függetlenség. Ennek a statisztikának a hátránya, hogy C csak akkor érheti el az 1 felső határt, ha a kategóriák száma korlátlan. Ez a reláció mértéke általában nem olyan elfogadható, a valószínűség szempontjából nem túl egyértelmű értelmezés miatt, mint Pearson r-je.
Rangalapú statisztikák. Sok esetben a kontingenciatábla változók kategóriái sorrendben vannak (pl. Nagyon gyenge, gyenge, közepes, erős, nagyon erős). Tehát a változók sorosak. Amíg a kategóriák kódolása logikai sorrendet követ, a következő statisztikák használhatók a változók közötti kapcsolat kifejezésére:
Spermanovo R . Spearman R-jét Pearson termékkorrelációs együtthatójának (Pearson r) tekinthetjük, vagyis a variabilitás arányát tekintve, azzal a különbséggel, hogy Spearman-t a sorrendből számoljuk. A változóknak ezért legalább a rendes skálán mérhetőknek kell lenniük.
Kendall tau . Kendall tau-ja megegyezik Spearman R.-jével. A számítás és az eredmény azonban eltér az értelmezéstől. Érvényes: -1
Sommer d: d (X | Y), d (Y | X). (Siegel, Castellan, 1988, 303-310. O.)
Gamma. A gamma statisztikák akkor hasznosak, ha az adatok sok kötött mérést tartalmaznak. Feltételezések szempontjából a gamma statisztika egyenértékű Spearman R vagy Kendall tau-jával, értelmezési szempontból hasonló Kendall tau-jához.
Bizonytalansági együtthatók . Ezek a sztochasztikus függőség mutatói. S (Y, X) szimmetrikus függőségre, S (X | Y), S (Y | X) aszimmetrikus függőségre utal.