Hvad er en T-Test?

en t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en signifikant forskel mellem midlerne til to grupper, som kan være relateret til visse funktioner. Det bruges mest, når datasættene, som det datasæt, der er registreret som resultatet af at vende en mønt 100 gange, ville følge en normal fordeling og kan have ukendte afvigelser. En t-test bruges som et hypotesetestværktøj, som tillader test af en antagelse, der gælder for en population.,

en t-test ser på T-statistikken, t-fordelingsværdierne og frihedsgraderne til at bestemme den statistiske betydning. For at gennemføre en test med tre eller flere midler skal man bruge en variansanalyse.

1:38

T-Test

Forklare T-Test

det Væsentlige, en t-test giver os mulighed for at sammenligne de gennemsnitlige værdier af de to data sæt, og afgøre, om de kom fra den samme population., I ovenstående eksempler, hvis vi skulle tage en prøve af studerende fra klasse A og en anden prøve af studerende fra klasse B, ville vi ikke forvente, at de havde nøjagtig samme middel-og standardafvigelse. Tilsvarende bør prøver taget fra den placebofodrede kontrolgruppe og prøver taget fra den lægemiddelforeskrevne gruppe have en lidt anden middel-og standardafvigelse.

matematisk tager T-testen en prøve fra hvert af de to sæt og fastlægger problemformuleringen ved at antage en nulhypotese om, at de to midler er ens., Baseret på de gældende formler beregnes og sammenlignes visse værdier med standardværdierne, og den antagede nulhypotese accepteres eller afvises i overensstemmelse hermed.

hvis nulhypotesen kvalificerer til at blive afvist, indikerer den, at dataflæsninger er stærke og sandsynligvis ikke skyldes tilfældigheder. T-testen er blot en af mange tests, der anvendes til dette formål. Statistikere skal desuden bruge andre test end t-testen til at undersøge flere variabler og test med større stikprøvestørrelser. For en stor prøvestørrelse bruger statistikere en test-test., Andre test muligheder omfatter CHI-s .uare test og F-test.

Der er tre typer af t-test, og de er kategoriseret som afhængige og uafhængige t-test.

Key Takeaways

  • t-test er en type af empiriske statistik bruges til at afgøre, om der er en signifikant forskel mellem de to grupper, som kan være relateret til visse funktioner.
  • t-testen er en af mange tests, der anvendes til hypotesetest i statistikker.
  • beregning af en t-test kræver tre nøgledataværdier., De omfatter forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier for hver gruppe.
  • Der er flere forskellige typer t-test, der kan udføres afhængigt af de krævede data og type analyse.

tvetydige testresultater

overvej, at en lægemiddelproducent ønsker at teste en nyopfundet medicin. Det følger standardproceduren for at prøve lægemidlet på en gruppe patienter og give placebo til en anden gruppe, kaldet kontrolgruppen., Placebo, der gives til kontrolgruppen, er et stof uden nogen bestemt terapeutisk værdi og tjener som benchmark til at måle, hvordan den anden gruppe, der får det faktiske lægemiddel, reagerer.

efter lægemiddelforsøget rapporterede medlemmerne af placebofodret kontrolgruppe en stigning i den gennemsnitlige forventede levetid på tre år, mens medlemmerne af gruppen, der er ordineret det nye lægemiddel, rapporterer en stigning i den gennemsnitlige forventede levetid på fire år. Øjeblikkelig observation kan indikere, at stoffet faktisk fungerer, da resultaterne er bedre for gruppen, der bruger stoffet., Det er dog også muligt, at observationen kan skyldes en tilfældig forekomst, især et overraskende held. En t-test er nyttig til at konkludere, om resultaterne faktisk er korrekte og gældende for hele befolkningen.

i en skole scorede 100 elever i klasse A i gennemsnit 85% med en standardafvigelse på 3%. En anden 100 studerende i klasse B scorede i gennemsnit 87% med en standardafvigelse på 4%., Mens gennemsnittet af klasse B er bedre end klasse A, det kan ikke være rigtigt at springe til den konklusion, at de samlede resultater af elever i klasse B er bedre end studerende i klasse A. Dette er fordi der er en naturlig variation i testen scorer i begge klasser, så forskellen kan skyldes tilfældigheder alene. En T-test kan hjælpe med at afgøre, om den ene klasse klarede sig bedre end den anden.

T-Test antagelser

  1. den første antagelse vedrørende t-test vedrører måleskalaen., Antagelsen for en t-test er, at måleskalaen, der anvendes på de indsamlede data, følger en kontinuerlig eller ordinær skala, såsom scoringerne for en i. – test.
  2. den anden antagelse er en simpel tilfældig prøve, at dataene indsamles fra en repræsentativ, tilfældigt udvalgt del af den samlede befolkning.
  3. den tredje antagelse er, at dataene, når de afbildes, resulterer i en normal fordeling, klokkeformet fordelingskurve.
  4. den endelige antagelse er homogeniteten af variansen., Homogen eller lige varians eksisterer, når standardafvigelserne af prøver er omtrent ens.

beregning af T-Test

beregning af en t-test kræver tre nøgledataværdier. De omfatter forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier for hver gruppe.

resultatet af t-testen giver t-værdien. Denne beregnede t-værdi sammenlignes derefter med en værdi opnået fra en kritisk værdi tabel (kaldet T-fordeling tabel)., Denne sammenligning hjælper med at bestemme effekten af chance alene på forskellen, og om forskellen ligger uden for det tilfældighedsområde. T-testen stiller spørgsmålstegn ved, om forskellen mellem grupperne repræsenterer en sand forskel i undersøgelsen, eller om det muligvis er en meningsløs tilfældig forskel.

t-Distributionstabeller

t-Distributionstabellen er tilgængelig i formater med en hale og to haler. Førstnævnte bruges til at vurdere sager, der har en fast værdi eller rækkevidde med en klar retning (positiv eller negativ)., For eksempel, Hvad er sandsynligheden for output værdi forbliver under -3, eller få mere end syv, når rullende et par terninger? Sidstnævnte bruges til intervalbundet analyse, såsom at spørge, om koordinaterne falder mellem -2 og +2.

De beregninger kan udføres med standard software-programmer, der understøtter de nødvendige statistiske funktioner, som dem der findes i MS Excel.

t-værdier og frihedsgrader

T-testen giver to værdier som output: t-værdi og frihedsgrader., T-værdien er et forhold mellem forskellen mellem gennemsnittet af de to prøvesæt og den variation, der findes inden for prøvesætene. Mens tællerværdien (forskellen mellem gennemsnittet af de to prøvesæt) er ligetil at beregne, kan nævneren (den variation, der findes inden for prøvesætene) blive lidt kompliceret afhængigt af typen af involverede dataværdier. Nævneren af forholdet er en måling af dispersionen eller variabiliteten. Højere værdier af t-værdien, også kaldet t-score, indikerer, at der er en stor forskel mellem de to prøvesæt., Jo mindre t-værdien er, desto mere lighed findes der mellem de to prøvesæt.

  • en stor T-score indikerer, at grupperne er forskellige.
  • en lille T-score indikerer, at grupperne er ens.

frihedsgrader henviser til værdierne i en undersøgelse, der har friheden til at variere og er afgørende for at vurdere betydningen og gyldigheden af nullhypotesen. Beregning af disse værdier normalt afhænger af antallet af dataposter til rådighed i prøven sæt.,

korreleret (eller parret) T-Test

den korrelerede t-test udføres, når prøverne typisk består af matchede par af lignende enheder, eller når der er tilfælde af gentagne mål. For eksempel kan der være tilfælde af, at de samme patienter testes gentagne gange—før og efter at have modtaget en bestemt behandling. I sådanne tilfælde anvendes hver patient som en kontrolprøve mod sig selv.,

denne metode gælder også for tilfælde, hvor prøverne er relateret på en eller anden måde eller har matchende egenskaber, såsom en sammenlignende analyse, der involverer børn, forældre eller søskende. Korrelerede eller parrede t-test er af en afhængig type, da disse involverer tilfælde, hvor de to sæt prøver er relaterede.

formlen for beregning af t-værdi, og grader af frihed til en parret t-test er:

De resterende to typer hører til den uafhængige t-tests., Prøverne af disse typer vælges uafhængigt af hinanden-det vil sige, at datasættene i de to grupper ikke henviser til de samme værdier. De omfatter tilfælde som en gruppe på 100 patienter, der opdeles i to sæt på 50 patienter hver. En af grupperne bliver kontrolgruppen og får placebo, mens den anden gruppe modtager den foreskrevne behandling. Dette udgør to uafhængige stikprøvegrupper, der er uparret med hinanden.,

Lig Variansen (eller fælles) T-Test

Den samme varians t-test anvendes, når antallet af prøver i hver gruppe er de samme, eller variansen af de to datasæt er ens. Følgende formel bruges til beregning af t-værdi, og grader af frihed for samme varians t-test:

og

forskellig Varians T-Test

Den ulige varians t-test anvendes, når antallet af prøver i hver gruppe er forskellig, og variansen af de to datasæt er også forskellige. Denne test kaldes også Welelchs t-test., Følgende formel bruges til beregning af t-værdi, og grader af frihed for en ulige varians t-test:

og,

Fastlæggelsen af den Korrekte T-Test for at Bruge

følgende flowchart kan bruges til at bestemme, hvor t-testen bør anvendes baseret på egenskaberne af den prøve sæt. De vigtigste elementer, der skal overvejes, omfatter, om prøveposterne er ens, antallet af dataposter i hvert prøvesæt og variansen for hvert prøvesæt.,

Billede af Julie Bang © Investopedia 2019

forskellig Varians T-Test-Eksempel

Antag, at vi er ved at tage diagonalmål af malerier, der er modtaget i et kunstgalleri. En gruppe af prøver omfatter 10 malerier, mens den anden omfatter 20 malerier., The data sets, with the corresponding mean and variance values, are as follows:

Set 1 Set 2
19.7 28.3
20.4 26.7
19.6 20.1
17.8 23.3
18.5 25.2
18.9 22.1
18.3 17.,7
18.9 27.6
19.5 20.6
21.95 13.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.,9
13.3
Betyde 19.4 21.6
Varians 1.4 17.1

Selv om gennemsnittet af Sæt 2 er større end 1, kan vi ikke konkludere, at den befolkning, der svarer til Sæt 2 har en højere middelværdi end den befolkning, der svarer til Sæt 1. Skyldes forskellen fra 19, 4 til 21, 6 tilfældigheder alene, eller eksisterer der virkelig forskelle i den samlede befolkning af alle de malerier, der er modtaget i kunstgalleriet?, Vi etablerer problemet ved at antage nulhypotesen om, at gennemsnittet er det samme mellem de to prøvesæt og udfører en t-test for at teste, om hypotesen er plausibel.

da antallet af dataposter er forskelligt (n1 = 10 og n2 = 20), og variansen også er forskellig, beregnes t-værdien og frihedsgraderne for ovenstående datasæt ved hjælp af formlen nævnt i afsnittet ulige varians T-Test.

t-værdien er -2.24787. Da minustegnet kan ignoreres, når man sammenligner de to t-værdier, er den beregnede værdi 2.24787.,

frihedsgraderne er 24,38 og reduceres til 24 på grund af formeldefinitionen, der kræver afrunding af værdien til den mindst mulige heltalsværdi.

man kan angive et sandsynlighedsniveau (alfa-niveau, signifikansniveau, p) som kriterium for accept. I de fleste tilfælde kan en 5% Værdi antages.

anvendelse af graden af frihed værdi som 24 og en 5% niveau af betydning, et kig på T-værdi fordeling tabel giver en værdi på 2,064. Sammenligning af denne værdi med den beregnede værdi af 2.,247 angiver, at den beregnede t-værdi er større end tabelværdien på et signifikansniveau på 5%. Derfor er det sikkert at afvise nulhypotesen om, at der ikke er nogen forskel mellem midler. Befolkningen sæt har iboende forskelle, og de er ikke tilfældigt.,

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *