Vad är ett T-Test?

ett T-test är en typ av inferentiell statistik som används för att avgöra om det finns en signifikant skillnad mellan två gruppers medel, vilket kan vara relaterat till vissa funktioner. Det används oftast när datauppsättningarna, som datauppsättningen som registrerats som resultatet från att vända ett mynt 100 gånger, skulle följa en normal fördelning och kan ha okända variationer. Ett T-test används som ett hypotesprovningsverktyg, vilket möjliggör testning av ett antagande som är tillämpligt på en population.,

ett T-test tittar på t-statistiken, t-distributionsvärdena och graden av frihet att bestämma den statistiska betydelsen. För att genomföra ett test med tre eller flera medel måste man använda en variansanalys.

1:38

T-Test

förklara T-testet

i huvudsak tillåter ett T-test oss att jämföra medelvärdena för de två datauppsättningarna och bestämma om de kom från samma population., I ovanstående exempel, om vi skulle ta ett urval av studenter från klass A och ett annat prov av studenter från klass B, skulle vi inte förvänta oss att de skulle ha exakt samma medelvärde och standardavvikelse. På samma sätt bör prover som tas från den placebomatade kontrollgruppen och de som tas från den förskrivna gruppen ha en något annorlunda medel-och standardavvikelse.

matematiskt tar t-testet ett prov från var och en av de två uppsättningarna och etablerar problemmeddelandet genom att anta en nollhypotes att de två sätten är lika., Baserat på de tillämpliga formlerna beräknas vissa värden och jämförs mot standardvärdena, och den antagna nollhypotesen accepteras eller avvisas i enlighet därmed.

om nollhypotesen kvalificerar sig för att avvisas, indikerar den att dataavläsningar är starka och förmodligen inte beror på slumpen. T-testet är bara en av många tester som används för detta ändamål. Statistiker måste dessutom använda andra tester än t-testet för att undersöka fler variabler och tester med större provstorlekar. För en stor provstorlek använder statistiker ett z-test., Andra testalternativ inkluderar chi-square-testet och f-testet.

det finns tre typer av T-test, och de kategoriseras som beroende och oberoende t-test.

viktiga Takeaways

  • ett T-test är en typ av inferentiell statistik som används för att avgöra om det finns en signifikant skillnad mellan medlen för två grupper, som kan vara relaterade till vissa funktioner.
  • t-testet är ett av många tester som används för hypotesprovning i statistik.
  • för att beräkna ett T-test krävs tre nyckeldatavärden., De inkluderar skillnaden mellan medelvärdena från varje datamängd (kallad medelskillnaden), standardavvikelsen för varje grupp och antalet datavärden för varje grupp.
  • Det finns flera olika typer av T-test som kan utföras beroende på data och typ av analys som krävs.

tvetydiga Testresultat

anser att en läkemedelstillverkare vill testa ett nyfunnet läkemedel. Det följer standardförfarandet för att prova läkemedlet på en grupp patienter och ge en placebo till en annan grupp, kallad kontrollgruppen., Den placebo som ges till kontrollgruppen är ett ämne utan avsett terapeutiskt värde och tjänar som ett riktmärke för att mäta hur den andra gruppen, som ges det faktiska läkemedlet, svarar.

efter läkemedelsstudien rapporterade medlemmarna i placebofed-kontrollgruppen en ökning av medellivslängden på tre år, medan medlemmarna i gruppen som ordineras den nya läkemedelsrapporten en ökning av medellivslängden på fyra år. Omedelbar observation kan indikera att läkemedlet verkligen fungerar eftersom resultaten är bättre för gruppen som använder drogen., Det är dock också möjligt att observationen kan bero på en slumphändelse, särskilt en överraskande lycka. Ett T-test är användbart för att avgöra om resultaten faktiskt är korrekta och tillämpliga på hela befolkningen.

i en skola gjorde 100 elever i klass A i genomsnitt 85% med en standardavvikelse på 3%. Ytterligare 100 studenter som tillhör klass B gjorde i genomsnitt 87% med en standardavvikelse på 4%., Medan medelvärdet av klass B är bättre än klass A, kan det inte vara korrekt att hoppa till slutsatsen att den totala prestandan hos studenter i klass B är bättre än för studenter i klass A. Detta beror på att det finns naturlig variabilitet i testresultatet i båda klasserna, så skillnaden kan bero på slumpen ensam. Ett T-test kan hjälpa till att avgöra om en klass klarade sig bättre än den andra.

t-Testantaganden

  1. det första antagandet om t-test gäller mätskalan., Antagandet för ett T-test är att mätskalan för de insamlade uppgifterna följer en kontinuerlig eller ordinär skala, t.ex. poängen för ett IQ-test.
  2. det andra antagandet är att ett enkelt slumpmässigt urval, att data samlas in från en representativ, slumpmässigt vald del av den totala befolkningen.
  3. det tredje antagandet är data, när plottas, resulterar i en normal fördelning, klockformad fördelningskurva.
  4. det slutliga antagandet är variansens homogenitet., Homogen, eller lika, varians existerar när standardavvikelserna för prover är ungefär lika.

beräkning av T-tester

beräkning av ett T-test kräver tre nyckeldatavärden. De inkluderar skillnaden mellan medelvärdena från varje datamängd (kallad medelskillnaden), standardavvikelsen för varje grupp och antalet datavärden för varje grupp.

resultatet av T-testet ger t-värdet. Detta beräknade t-värde jämförs sedan mot ett värde som erhålls från en kritisk värdetabell (kallad T-Distributionstabellen)., Denna jämförelse hjälper till att bestämma effekten av chans ensam på skillnaden, och om skillnaden ligger utanför det chansintervallet. T-testfrågorna om skillnaden mellan grupperna representerar en sann skillnad i studien eller om det möjligen är en meningslös slumpmässig skillnad.

t-Distributionstabeller

t-Distributionstabellen finns i en svans och två-tails format. Den förstnämnda används för att bedöma fall som har ett fast värde eller intervall med en tydlig riktning (positiv eller negativ)., Till exempel, Vad är sannolikheten för utgångsvärdet kvar under -3, eller få mer än sju när du rullar ett par tärningar? Den senare används för intervallbunden analys, till exempel fråga om koordinaterna faller mellan -2 och +2.

beräkningarna kan utföras med standardprogramvaruprogram som stöder de nödvändiga statistiska funktionerna, som de som finns i MS Excel.

t-värden och frihetsgrader

t-testet ger två värden som utdata: t-värde och frihetsgrader., T-värdet är ett förhållande mellan skillnaden mellan medelvärdet för de två provuppsättningarna och variationen som finns inom provuppsättningarna. Medan täljarvärdet (skillnaden mellan medelvärdet för de två provuppsättningarna) är enkelt att beräkna, kan nämnaren (variationen som finns inom provuppsättningarna) bli lite komplicerad beroende på vilken typ av datavärden som är inblandade. Nämnaren för förhållandet är en mätning av dispersionen eller variabiliteten. Högre värden för t-värdet, även kallat T-poäng, indikerar att det finns en stor skillnad mellan de två provuppsättningarna., Ju mindre t-värde desto mer likhet finns mellan de två provuppsättningarna.

  • en stor T-poäng indikerar att grupperna är olika.
  • en liten T-poäng indikerar att grupperna är likartade.

frihetsgrader hänvisar till värdena i en studie som har frihet att variera och är avgörande för att bedöma betydelsen och giltigheten av nollhypotesen. Beräkningen av dessa värden beror vanligtvis på antalet dataposter som är tillgängliga i provuppsättningen.,

korrelerade (eller Parade) T-Test

det korrelerade t-testet utförs när proverna typiskt består av matchade par av liknande enheter, eller när det finns fall av upprepade åtgärder. Till exempel kan det finnas fall av samma patienter som testas upprepade gånger—före och efter att ha fått en viss behandling. I sådana fall används varje patient som ett kontrollprov mot sig själva.,

denna metod gäller även fall där proverna är relaterade på något sätt eller har matchande egenskaper, som en jämförande analys som involverar barn, föräldrar eller syskon. Korrelerade eller parade t-test är av en beroende Typ, eftersom dessa involverar fall där de två uppsättningarna av prover är relaterade.

formeln för beräkning av T-värde och frihetsgrader för ett parat t-test är:

de återstående två typerna tillhör de oberoende t-testerna., Proverna av dessa typer väljs oberoende av varandra – det vill säga datauppsättningarna i de två grupperna hänvisar inte till samma värden. De inkluderar fall som en grupp av 100 patienter som delas upp i två uppsättningar av 50 patienter vardera. En av grupperna blir kontrollgruppen och ges placebo, medan den andra gruppen får den föreskrivna behandlingen. Detta utgör två oberoende provgrupper som är oparade med varandra.,

Equal Variance (eller Pooled) t-Test

equal variance t-test används när antalet prover i varje grupp är detsamma, eller variansen hos de två datauppsättningarna är likartad. Följande formel används för att beräkna t-värde och frihetsgrader för lika varians t-test:

och

ojämn varians T-Test

den ojämna variansen t-test används när antalet prover i varje grupp är olika, och variansen hos de två datauppsättningarna är också annorlunda. Detta test kallas också Welchs t-test., Följande formel används för att beräkna t-värde och frihetsgrader för en ojämn varians t-test:

och

för att bestämma rätt T-Test att använda

följande flödesschema kan användas för att bestämma vilken t-test som ska användas baserat på provmängdernas egenskaper. De nyckelposter som ska beaktas inkluderar om provposterna är likartade, antalet dataposter i varje provmängd och variansen för varje provmängd.,

bild av Julie Bang © Investopedia 2019

ojämn varians t-Testexempel

anta att vi tar ett diagonalt mått på målningarna som tagits emot i bilden.ett konstgalleri. En grupp prover innehåller 10 målningar, medan den andra innehåller 20 målningar., The data sets, with the corresponding mean and variance values, are as follows:

även om medelvärdet för set 2 är högre än för set 1, kan vi inte dra slutsatsen att den population som motsvarar set 2 har ett högre medelvärde än den population som motsvarar set 1. Är skillnaden från 19.4 till 21.6 på grund av slumpen ensam, eller finns skillnader verkligen i de övergripande populationerna av alla målningar som tas emot i konstgalleriet?, Vi etablerar problemet genom att anta nollhypotesen att medelvärdet är detsamma mellan de två provuppsättningarna och utför ett T-test för att testa om hypotesen är trovärdig.

eftersom antalet dataposter är olika (N1 = 10 och N2 = 20) och variansen är också annorlunda beräknas t-värdet och frihetsgraderna för ovanstående datauppsättning med hjälp av formeln som nämns i den ojämna variansen T-testsektionen.

t-värdet är -2.24787. Eftersom minustecknet kan ignoreras vid jämförelse av de två t-värdena är det beräknade värdet 2,24787.,

frihetsvärdet är 24,38 och reduceras till 24, på grund av formeldefinitionen som kräver avrundning av värdet till det minsta möjliga heltalvärdet.

man kan ange en sannolikhetsnivå (alfanivå, signifikansnivå, p) som ett kriterium för acceptans. I de flesta fall kan ett 5% – Värde antas.

med hjälp av graden av frihet värde som 24 och en 5% nivå av betydelse, en titt på t-värdefördelningstabellen ger ett värde på 2.064. Jämföra detta värde mot det beräknade värdet av 2.,247 indikerar att det beräknade t-värdet är större än tabellvärdet vid en signifikansnivå på 5%. Därför är det säkert att avvisa nollhypotesen att det inte finns någon skillnad mellan medel. Befolkningen har inneboende skillnader, och de är inte av en slump.,

Set 1 Set 2
19.7 28.3
20.4 26.7
19.6 20.1
17.8 23.3
18.5 25.2
18.9 22.1
18.3 17.,7
18.9 27.6
19.5 20.6
21.95 13.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.,9
13,3
medel 19,4 21,6
varians 1,4 17,1

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *