Hva Er en T-Test?
En t-test er en type slutnings-statistikk brukes til å finne ut om det er en signifikant forskjell mellom gjennomsnittene av to grupper, noe som kan være relatert til visse funksjoner. Det er for det meste brukt når datasett, for eksempel data set registrert som resultat fra å snu en mynt 100 ganger, ville følge en normal distribusjon, og kan ha ukjente avvik. En t-test er brukt som hypotese-testing verktøy, som gjør det mulig testing av en antakelse som gjelder for en befolkning.,
En t-test ser på t-statistikk, t-fordeling verdier, og grader av frihet til å bestemme statistisk signifikans. For å gjennomføre en test med tre eller mer betyr, må man bruke en analyse av varians.
T-Test
Forklare T-Test
Egentlig, en t-test gir oss muligheten til å sammenligne den gjennomsnittlige verdiene av de to datasettene, og finne ut om de kom fra den samme populasjonen., I eksemplene ovenfor, hvis vi skulle ta en prøve av elevene fra klasse En og annen eksempel av elevene fra klasse B, ville vi ikke forvente at de har nøyaktig samme middelverdi og standardavvik. Tilsvarende prøver tatt fra placebo-matet kontrollgruppen og de som er tatt fra stoffet foreskrevet konsernet skal ha en litt annen middelverdi og standardavvik.
Matematisk, t-test tar en prøve fra hver av de to settene og etablerer problemet uttalelse av hvis vi antar en null-hypotesen om at to midler er like., Basert på gjeldende formler, visse verdier er beregnet og sammenlignet med standard verdier, og antatt nullhypotesen er akseptert eller avvist i henhold til dette.
Hvis nullhypotesen kvalifiserer til å bli avvist, det indikerer at data målingene er sterk og er sannsynligvis ikke skyldes tilfeldigheter. T-test er bare en av mange tester som brukes for dette formålet. Statistikere må i tillegg bruke tester annet enn t-test for å undersøke flere variabler og tester med større utvalg i størrelser. For en stor utvalgsstørrelse, statistikere bruker en z-test., Andre tester alternativer inkluderer chi-kvadrat-test, f-test.
Det er tre typer t-tester, og de er kategorisert som avhengig og uavhengig t-tester.
– Tasten Takeaways
- En t-test er en type slutnings-statistikk brukes til å finne ut om det er en signifikant forskjell mellom gjennomsnittene av to grupper, noe som kan være relatert til visse funksjoner.
- t-test er en av mange tester som brukes for det formål å hypotesetesting i statistikken.
- Beregner en t-test krever tre viktige data verdier., De inkluderer forskjell mellom gjennomsnittsverdiene fra hvert datasett (kalt bety forskjellen), standardavvik i hver gruppe, og antall data-verdier i hver gruppe.
- Det er flere forskjellige typer t-test som kan utføres avhengig av data og type analyse er nødvendig.
Tvetydig testresultater
Tenk at et stoff som produsenten ønsker å teste en nylig oppfunnet medisin. Det følger standard prosedyre for å prøve stoffet på en gruppe av pasienter og gi en placebo til en annen gruppe, kalt kontrollgruppen., De som fikk placebo gitt til kontrollgruppen er et stoff av ikke hadde til hensikt å terapeutisk verdi og fungerer som en målestokk for å måle hvordan den andre gruppen, som er gitt selve stoffet, reagerer.
Etter at stoffet trial, medlemmer av placebo-matet kontrollgruppen rapporterte en økning i gjennomsnittlig forventet levetid på tre år, mens medlemmer av gruppen som er foreskrevet den nye stoffet rapporterer om en økning i gjennomsnittlig levealder for fire år. Instant observasjonen kan tyde på at stoffet er faktisk jobber som resultatene er bedre for gruppen ved å bruke stoffet., Det er imidlertid også mulig at observasjon kan være på grunn av en sjanse forekomst, spesielt en overraskende bit av lykken. En t-test er nyttig for å konkludere om resultatene er faktisk riktig og gjelder for hele befolkningen.
I en skole med 100 elever i En klasse som scores i gjennomsnitt 85% med et standard avvik på 3%. 100 andre studenter som tilhører klasse B, som scores i gjennomsnitt 87% med et standard avvik på 4%., Mens gjennomsnittet av klasse B er bedre enn klasse A, kan det ikke være riktig å hoppe til konklusjonen at den generelle ytelsen av studenter i klasse B er bedre enn elevene i klasse A. Dette er fordi det er naturlige variasjoner i test score i begge klasser, slik at forskjellen kan skyldes tilfeldigheter alene. En t-test kan bidra til å fastslå om en klasse klart seg bedre enn de andre.
T-Test Forutsetninger
– >
- første antakelsen om t-tester gjelder omfanget av målingen., Forutsetningen for en t-test er at omfanget av målingen brukes til dataene som samles inn, følger en kontinuerlig eller ordenstallet skala, for eksempel score for en IQ-test.
- Den andre forutsetningen som er gjort er at av et enkelt tilfeldig utvalg, at data er samlet inn fra en representant, tilfeldig utvalgt del av den totale befolkningen.
- Den tredje forutsetningen er data, når plottet, resulterer i en normal distribusjon, bell-formet distribusjon kurve.
- Den siste forutsetningen er homogenitet i variansen., Homogen, eller lik, varians foreligger når standard avvik av prøvene er tilnærmet lik.
Beregning av T-Tester
Beregner en t-test krever tre viktige data verdier. De inkluderer forskjell mellom gjennomsnittsverdiene fra hvert datasett (kalt bety forskjellen), standardavvik i hver gruppe, og antall data-verdier i hver gruppe.
utfallet av t-test produserer t-verdi. Dette beregnet t-verdi er deretter sammenlignet med en verdi som er innhentet fra en kritisk verdi tabell (kalt T-Fordelingen i Tabellen)., Denne sammenligningen bidrar til å avgjøre effekten av sjanse alene på forskjellen, og om forskjellen er utenfor den sjansen utvalg. T-test spørsmål om forskjellen mellom gruppene representerer en sann forskjell i studiet eller hvis det er muligens en meningsløs, tilfeldig forskjell.
T-Distribusjon Tabeller
T-Distribusjon Bord er tilgjengelig i én hale og to haler formater. Tidligere er brukt for å vurdere saker som har en fast verdi eller rekkevidde, med en klar retning (positiv eller negativ)., For eksempel, hva er sannsynligheten for utgang gjenværende nedenfor -3, eller få mer enn syv når rulle et par terninger? Sistnevnte brukes for utvalg bundet analyse, for eksempel spør om koordinatene falle mellom -2 og +2.
beregningene kan utføres med standard programvare som støtter de nødvendige statistiske funksjoner, som de som finnes i MS Excel.
T-Verdier og Grader av Frihet
t-test produserer to verdier som dens utgang: t-verdi og grader av frihet., T-verdien er et forhold av forskjellen mellom gjennomsnittet av de to eksempel på sett og den variasjonen som finnes i prøven sett. Mens telleren verdi (forskjellen mellom gjennomsnittet av de to eksempel sett) er grei å beregne, nevneren (den variasjonen som finnes i prøven sett) kan bli litt komplisert, avhengig av typen data verdier involvert. Nevneren av ratio er et mål på spredning eller variasjon. Høyere verdier av t-verdi, også kalt t-score, tyder på at en stor forskjell mellom de to eksempel sett., Jo mindre t-verdi, jo mer likhet mellom de to eksempel sett.
- En stor t-score indikerer at gruppene er forskjellige.
- En liten t-score indikerer at gruppene er like.
Grader av frihet refererer til verdier i en studie som har frihet til å variere og er avgjørende for å vurdere betydningen og gyldigheten av nullhypotesen. Beregning av disse verdiene vanligvis avhengig av antallet av data oppføringer tilgjengelige i prøvesettet.,
Korrelert (eller Sammenkoblet) T-Test
korrelert t-test utføres når prøvene som vanligvis består av matchende par av lignende enheter, eller når det er tilfeller av gjentatt tiltak. For eksempel kan det være tilfeller av samme pasienter som ble testet flere ganger—før og etter mottak av en bestemt behandling. I slike tilfeller er hver pasient blir brukt som en kontrollprøve mot seg selv.,
Denne metoden gjelder også i tilfeller der prøvene er relatert på noen måte eller har tilsvarende egenskaper, som en komparativ analyse involverer barn, foreldre eller søsken. Korrelert eller parede t-testene er av en avhengig av type, som disse dreier seg om tilfeller hvor to sett av prøvene er i slekt.
formelen for beregning av t-verdi og grader av frihet for en paret t-test er:
De resterende to typer tilhører uavhengig t-tester., Prøvene av disse typene er valgt uavhengig av hverandre—som er, datasettene i de to gruppene ikke se de samme verdiene. De inkluderer tilfeller som en gruppe av 100 pasienter som ble delt inn i to sett av 50 pasienter hver. En av gruppene blir kontrollgruppen og er gitt et placebo, mens den andre gruppen får den foreskrevne behandling. Dette utgjør to uavhengige eksempel grupper som er gruppert med hverandre.,
Lik Varians (eller Pooled) T-Test
lik varians t-test er brukt når antall prøver i hver gruppe er den samme, eller variansen av de to datasettene er lik. Følgende formel brukes for å beregne t-verdi og grader av frihet for lik varians t-test:
og
Ulik Varians T-Test
ulik varians t-test er brukt når antall prøver i hver gruppe er forskjellig, og variansen av de to datasettene er også forskjellige. Denne testen er også kalt Welch ‘ s t-test., Følgende formel brukes for å beregne t-verdi og grader av frihet for en ulik varians t-test:
og,
å Bestemme Riktig T-Test for å Bruke
følgende flytskjema kan brukes til å bestemme hvilken t-test skal brukes basert på egenskapene til utvalget sett. Den sentrale elementer for å bli betraktet som omfatter om prøven poster er lik antall av data poster i hver prøve som er satt, og variansen av hver prøve som er satt.,
Ulik Varians T-Test for Eksempel
Anta at vi tar en diagonal måling av malerier mottatt i et kunstgalleri. En gruppe av prøvene inneholder 10 malerier, mens den andre omfatter 20 malerier., The data sets, with the corresponding mean and variance values, are as follows:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.,7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.,9 | ||
13.3 | ||
Mean | 19.4 | 21.6 |
Varians | 1.4 | 17.1 |
selv Om det betyr på Sett 2 er høyere enn det som er Satt av 1, kan vi ikke konkludere med at befolkningen tilsvarende for å Angi 2 har en bety høyere enn befolkningen som tilsvarer Sett 1. Er det forskjell fra 19.4 å 21.6 skyldes tilfeldigheter alene, eller gjøre forskjellene egentlig eksisterer i den generelle populasjoner av alle maleriene mottatt i art gallery?, Vi etablerer problemet ved å forutsatt at null-hypotesen om at gjennomsnittet er det samme mellom de to eksempel på sett og gjennomføre en t-test for å teste om hypotesen er plausibel.
Siden antallet av data poster er forskjellige (n1 = 10 og n2 = 20) og variansen er også forskjellige, t-verdi og grader av frihet er beregnet for de ovennevnte data angis ved å bruke formelen nevnt i Ulik Varians T-Test delen.
Den t-verdien er -2.24787. Siden minustegnet kan bli ignorert når man sammenligner de to t-verdier, beregnede verdi er 2.24787.,
Det grader av frihet verdi er 24.38 og er redusert til 24, på grunn av formelen definisjonen krever avrunding ned av verdien til det minst mulige heltall.
Man kan angi en grad av sannsynlighet (alpha-nivå, nivå av betydning, p) som et kriterium for aksept. I de fleste tilfeller, en 5% – verdien kan bli antatt.
ved Hjelp av graden av frihet verdi som 24 og en 5% nivå av betydning, en titt på t-verdi distribusjon tabellen gir en verdi av 2.064. Å sammenligne denne verdien mot den beregnede verdi av 2.,247 viser at den beregnede t-verdien er større enn tabellen verdi ved en betydning nivå på 5%. Derfor er det trygt å avvise nullhypotesen at det ikke er noen forskjell mellom midler. Befolkningen sett har iboende forskjeller, og de er ikke ved en tilfeldighet.,
– >
– >
– >
– >
– >