mi a T-teszt?

a t-teszt egyfajta inferenciális statisztika annak meghatározására, hogy van-e jelentős különbség a két csoport eszközei között, amelyek bizonyos jellemzőkben összefügghetnek. Leginkább akkor használják, amikor az adathalmazok, mint például a 100-szoros érme átfordításából származó eredményként rögzített adathalmaz normál eloszlást követne, és ismeretlen eltérések lehetnek. A T-tesztet hipotézis-tesztelő eszközként használják, amely lehetővé teszi egy populációra vonatkozó feltételezés tesztelését.,

a t-teszt a T-statisztikát, a t-eloszlási értékeket, valamint a statisztikai szignifikancia meghatározására szolgáló szabadságfokokat vizsgálja. Három vagy több eszközzel végzett vizsgálat elvégzéséhez a variancia elemzését kell használni.

1:38

T-Test

A T-teszt magyarázata lényegében lehetővé teszi számunkra, hogy összehasonlítsuk a két adatkészlet átlagos értékeit, és meghatározzuk, hogy ugyanabból a tesztből származnak-e népesség., A fenti példákban, ha mintát vennénk az A osztályból és a B osztályból származó diákok egy másik mintájából, nem várnánk, hogy pontosan ugyanaz legyen az átlag és a szórás. Hasonlóképpen, a placebóval táplált kontrollcsoportból és az előírt gyógyszercsoportból vett mintáknak kissé eltérő átlaggal és szórással kell rendelkezniük.

matematikailag a t-teszt mind a két készletből mintát vesz, és nullhipotézis feltételezésével állapítja meg a problémamegállapítást, miszerint a két eszköz egyenlő., Az alkalmazandó képletek alapján bizonyos értékeket kiszámítanak és összehasonlítanak a standard értékekkel, és a feltételezett nullhipotézist ennek megfelelően elfogadják vagy elutasítják.

Ha a null-hipotézis elutasítottnak minősül, az azt jelzi, hogy az adatértékek erősek, és valószínűleg nem véletlenszerűek. A t-teszt csak egy az erre a célra használt számos teszt közül. A statisztikusoknak a t-teszten kívül más teszteket is alkalmazniuk kell, hogy több változót és nagyobb mintaméretű tesztet vizsgáljanak. Nagy mintaméret esetén a statisztikusok z-tesztet használnak., További tesztelési lehetőségek közé tartozik a chi-square teszt, valamint az f-teszt.

háromféle T-teszt létezik, és ezek függő és független t-teszteknek minősülnek.

Key Takeaways

  • A T-teszt egyfajta inferenciális statisztika annak meghatározására, hogy van-e jelentős különbség a két csoport eszközei között, amelyek bizonyos funkciókban kapcsolódhatnak.
  • a T-teszt egyike annak a sok tesztnek, amelyet a hipotézis tesztelésére használnak a statisztikákban.
  • A t-teszt kiszámítása három kulcsfontosságú adatértéket igényel., Ezek közé tartozik az egyes adatkészletekből származó átlagértékek (az átlagos különbség), az egyes csoportok szórása, valamint az egyes csoportok adatértékeinek száma közötti különbség.
  • többféle t-teszt létezik, amelyek a szükséges adatok és elemzések típusától függően elvégezhetők.

kétértelmű vizsgálati eredmények

úgy vélik, hogy egy gyógyszergyártó egy újonnan feltalált gyógyszert akar tesztelni. A szokásos eljárást követi a gyógyszer kipróbálására egy betegcsoporton, placebót adva egy másik csoportnak, az úgynevezett kontrollcsoportnak., A kontrollcsoportnak adott placebo olyan anyag, amelynek nincs tervezett terápiás értéke, és referenciaértékként szolgál annak mérésére, hogy a másik csoport, amely a tényleges gyógyszert kapja, hogyan reagál.

a kábítószer-vizsgálat után a placebo-táplált kontrollcsoport tagjai három év átlagos várható élettartamának növekedéséről számoltak be, míg az új gyógyszert felíró csoport tagjai négy év átlagos várható élettartamának növekedését jelentették. Az azonnali megfigyelés azt jelezheti, hogy a gyógyszer valóban működik, mivel az eredmények jobbak a kábítószert használó csoport számára., Az is lehetséges azonban, hogy a megfigyelés véletlen előfordulásnak tudható be, különösen meglepő szerencse. A t-teszt hasznos arra a következtetésre jutni, hogy az eredmények valóban helyesek-e és alkalmazhatók-e a teljes populációra.

egy iskolában az A osztályú 100 diák átlagosan 85% – ot ért el, 3% – os szórással. A B osztályba tartozó további 100 diák átlagosan 87% – ot ért el, 4% – os szórással., Míg a B osztály átlaga jobb, mint az a osztályé, lehet, hogy nem helyes arra a következtetésre jutni, hogy a B osztályú hallgatók általános teljesítménye jobb, mint az A osztályú hallgatóké.ez azért van, mert mindkét osztályban természetes változékonyság van a teszteredményekben, így a különbség csak a véletlennek tudható be. A t-teszt segíthet meghatározni, hogy az egyik osztály jobban teljesített-e, mint a másik.

t-vizsgálati feltételezések

  1. A t-tesztekkel kapcsolatos első feltételezés a mérési skálára vonatkozik., A T-teszt feltételezése az, hogy az összegyűjtött adatokra alkalmazott mérési skála folyamatos vagy ordinális skálát követ, például az IQ-teszt pontszámait.
  2. a második feltételezés egy egyszerű véletlenszerű minta, hogy az adatokat a teljes populáció reprezentatív, véletlenszerűen kiválasztott részéből gyűjtik.
  3. a harmadik feltételezés az adatok, ha ábrázoljuk, normális eloszlást eredményez, harang alakú eloszlási görbe.
  4. a végső feltételezés a variancia homogenitása., Homogén vagy egyenlő variancia létezik, ha a minták szórása megközelítőleg azonos.

A T-tesztek kiszámítása

A t-teszt kiszámítása három kulcsfontosságú adatértéket igényel. Ezek közé tartozik az egyes adatkészletekből származó átlagértékek (az átlagos különbség), az egyes csoportok szórása, valamint az egyes csoportok adatértékeinek száma közötti különbség.

a T-teszt eredménye a t-értéket adja. Ezt a kiszámított t-értéket ezután összehasonlítjuk egy kritikus érték táblázatból (az úgynevezett T-elosztási táblázatból) kapott értékkel., Ez az összehasonlítás segít meghatározni a véletlennek a különbségre gyakorolt hatását, valamint azt, hogy a különbség kívül esik-e az adott esélytartományon. A T-teszt megkérdőjelezi, hogy a csoportok közötti különbség valódi különbséget jelent-e a vizsgálatban, vagy esetleg értelmetlen véletlenszerű különbség.

t-eloszlási táblázatok

a T-eloszlási táblázat egy-és Kétfarkú formátumban érhető el. Az előbbit olyan esetek értékelésére használják, amelyek rögzített értékűek vagy világos irányúak (pozitív vagy negatív)., Például, mi a valószínűsége annak, hogy a kimeneti érték -3 alatt marad, vagy több mint hét lesz, amikor egy pár kockát gördít? Ez utóbbit a tartományhoz kötött elemzéshez használják, például arra a kérdésre, hogy a koordináták -2 és +2 közé esnek-e.

a számításokat szabványos szoftverprogramokkal lehet elvégezni, amelyek támogatják a szükséges statisztikai funkciókat, mint például az MS Excel programban.

t-értékek és szabadságfokok

a T-teszt kimenetként két értéket állít elő: t-értéket és szabadságfokokat., A t-érték a két mintakészlet átlaga és a mintakészleteken belüli eltérés közötti különbség aránya. Míg a számláló értéke (a két mintakészlet átlaga közötti különbség) egyszerűen kiszámítható, a nevező (a mintakészletekben létező variáció) kissé bonyolult lehet az érintett adatértékek típusától függően. Az arány nevezője a diszperzió vagy variabilitás mérése. A T-érték magasabb értékei, más néven t-pontszám, azt jelzik, hogy nagy különbség van a két mintakészlet között., Minél kisebb a t-érték, annál nagyobb a hasonlóság a két mintakészlet között.

  • egy nagy T-pontszám azt jelzi, hogy a csoportok eltérőek.
  • egy kis T-pontszám azt jelzi, hogy a csoportok hasonlóak.

a szabadságfok egy olyan tanulmány értékeire utal, amelyek szabadon változhatnak, és nélkülözhetetlenek a null hipotézis fontosságának és érvényességének értékeléséhez. Ezeknek az értékeknek a kiszámítása általában a mintakészletben rendelkezésre álló adatrekordok számától függ.,

Korrelált (vagy párosított) T-teszt

a korrelált t-tesztet akkor hajtják végre, ha a minták általában hasonló egységek párosított párjaiból állnak, vagy ha ismételt intézkedések vannak. Például előfordulhatnak olyan esetek, amikor ugyanazokat a betegeket ismételten tesztelik—egy adott kezelés előtt vagy után. Ilyen esetekben minden beteget kontrollmintaként használnak maguk ellen.,

Ez a módszer azokra az esetekre is vonatkozik, amikor a minták valamilyen módon kapcsolódnak egymáshoz, vagy megfelelő tulajdonságokkal rendelkeznek, mint például a gyermekeket, szülőket vagy testvéreket érintő összehasonlító elemzés. A korrelált vagy párosított t-tesztek függő típusúak, mivel ezek olyan eseteket foglalnak magukban, amikor a két mintakészlet kapcsolódik.

A képlet kiszámításához a t-érték szabadságfok a párosított t-próba:

A fennmaradó két típusba tartozik a független t-próba., Az ilyen típusú minták egymástól függetlenül kerülnek kiválasztásra—vagyis a két csoport adatkészletei nem ugyanazon értékekre vonatkoznak. Ezek közé tartoznak az olyan esetek, mint egy 100 betegből álló csoport, amelyet egyenként 50 betegből álló két csoportra osztanak. Az egyik csoport kontrollcsoport lesz, placebót kap, míg a másik csoport az előírt kezelést kapja. Ez két független mintacsoportot képez, amelyek párosítatlanok egymással.,

egyenlő variancia (vagy összevont) T-Test

az egyenlő variancia t-teszt akkor használatos, ha az egyes csoportokban lévő minták száma azonos, vagy a két adatkészlet varianciája hasonló. A következő képlet kiszámításához használt t-érték szabadságfok az egyenlő variancia t-teszt:

illetve

nem Egyenlő Variancia T-Próba

Az egyenlőtlen variancia t-teszt használható, ha a minták száma, minden csoport más, a különbség a két adatsor is különböző. Ezt a tesztet Welch t-tesztjének is nevezik., A következő képlet kiszámításához használt t-érték szabadságfok egy egyenlőtlen variancia t-teszt:

s,

Meghatározó a Megfelelő T-Teszt Használata

A következő folyamatábra lehet meghatározni, amely a t-tesztet kell használni, tulajdonságai alapján a minta határozza meg. A figyelembe veendő kulcsfontosságú elemek közé tartozik, hogy a mintarekordok hasonlóak-e, az egyes mintakészletekben szereplő adatrekordok száma, valamint az egyes mintakészletek varianciája.,

kép: Julie Bang © Investopedia 2019

t-teszt példa

feltételezzük, hogy egy művészeti galériában kapott festmények átlós mérését végezzük. A minták egyik csoportja 10 festményt tartalmaz, míg a másik 20 festményt tartalmaz., The data sets, with the corresponding mean and variance values, are as follows:

Set 1 Set 2
19.7 28.3
20.4 26.7
19.6 20.1
17.8 23.3
18.5 25.2
18.9 22.1
18.3 17.,7
18.9 27.6
19.5 20.6
21.95 13.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.,9
13.3
Mármint 19.4 21.6
Variancia 1.4 17.1

Bár úgy Set 2 magasabb, mint a Set 1, nem tudunk következtetni, hogy a lakosság megfelelő Set 2 nagyobb gonosz, mint a lakosság megfelelő Beállítása 1. A különbség 19.4-től 21.6-ig csak a véletlen miatt van-e különbség, vagy valóban léteznek-e különbségek a művészeti galériában kapott összes festmény teljes populációjában?, A problémát úgy állapítjuk meg, hogy feltételezzük A null hipotézist, miszerint az átlag megegyezik a két mintakészlet között, és T-tesztet végzünk annak tesztelésére, hogy a hipotézis elfogadható-e.

Mivel ez a szám az adatok más (n1 = 10 n2 = 20), valamint a variancia is különböző, a t-érték szabadságfok számítása a fenti adathalmaz felhasználásával a képlet szerepel az Egyenlőtlen Variancia T-Próba szakaszt.

A t-érték -2.24787. Mivel a mínusz jel figyelmen kívül hagyható a két t-érték összehasonlításakor, a számított érték 2,24787.,

a szabadságfok értéke 24,38, és 24-re csökken, mivel a képletdefiníció az értéknek a lehető legkisebb egész értékre történő kerekítését igényli.

az elfogadás kritériumaként meghatározható a valószínűség szintje (alfa szint, szignifikancia szint, p). A legtöbb esetben 5% – os érték feltételezhető.

a szabadságérték 24-es fokát és 5% – os szignifikanciaszintjét használva a t-érték eloszlási táblázat 2,064-es értéket ad. Összehasonlítva ezt az értéket a számított érték 2.,A 247 azt jelzi, hogy a kiszámított t-érték nagyobb, mint az 5% – os szignifikancia szint. Ezért biztonságos elutasítani a null hipotézist, hogy nincs különbség az eszközök között. A népességcsoportnak belső különbségei vannak, és nem véletlenül.,

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük