Wat Is een T-Test?

een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die in bepaalde kenmerken met elkaar in verband kunnen worden gebracht. Het wordt meestal gebruikt wanneer de datasets, zoals de dataset die als resultaat van het omgooien van een munt 100 keer wordt geregistreerd, een normale verdeling zouden volgen en onbekende varianties kunnen hebben. Een T-test wordt gebruikt als een hypothese testing tool, die het testen van een aanname van toepassing op een populatie mogelijk maakt.,

een t-test kijkt naar de T-statistiek, de T-verdelingswaarden en de vrijheidsgraden om de statistische significantie te bepalen. Om een test met drie of meer middelen uit te voeren, moet een variantieanalyse worden gebruikt.

1:38

T-Test

uitleg van de T-Test

een T-test stelt ons in wezen in staat om de gemiddelde waarden van de twee gegevensverzamelingen te vergelijken en te bepalen of ze uit dezelfde populatie kwamen., In de bovenstaande voorbeelden, als we een steekproef van studenten uit Klasse A en een andere steekproef van studenten uit klasse B zouden nemen, zouden we niet verwachten dat ze precies dezelfde gemiddelde en standaardafwijking hebben. Evenzo moeten monsters uit de placebogevoede controlegroep en monsters uit de voorgeschreven groep een iets andere gemiddelde en standaardafwijking hebben.

wiskundig neemt de T-test een monster van elk van de twee verzamelingen en stelt de probleemstelling vast door een nulhypothese aan te nemen dat de twee gemiddelden gelijk zijn., Op basis van de toepasselijke formules worden bepaalde waarden berekend en vergeleken met de standaardwaarden, en wordt de veronderstelde nulhypothese dienovereenkomstig aanvaard of afgewezen.

als de nulhypothese in aanmerking komt om te worden afgewezen, geeft dit aan dat de gegevenswaarden sterk zijn en waarschijnlijk niet aan toeval te wijten zijn. De t-test is slechts een van de vele tests die hiervoor worden gebruikt. Statistici moeten bovendien andere tests dan de t-test gebruiken om meer variabelen en tests met grotere steekproefgrootte te onderzoeken. Voor een grote steekproefgrootte gebruiken statistici een z-test., Andere testopties zijn de chi-kwadraattest en de f-test.

er zijn drie soorten t-tests, en ze worden gecategoriseerd als afhankelijke en onafhankelijke t-tests.

Key Takeaways

  • een t-test is een type inferentiële statistiek die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen, die in bepaalde kenmerken gerelateerd kunnen zijn.
  • de t-test is een van de vele tests die worden gebruikt voor het testen van hypothesen in statistieken.
  • Voor het berekenen van een t-test zijn drie belangrijke gegevenswaarden nodig., Zij omvatten het verschil tussen de gemiddelde waarden van elke gegevensverzameling (het gemiddelde verschil genoemd), de standaardafwijking van elke groep, en het aantal gegevenswaarden van elke groep.
  • Er zijn verschillende soorten t-test die kunnen worden uitgevoerd, afhankelijk van de vereiste gegevens en het type analyse.

dubbelzinnige testresultaten

stel vast dat een geneesmiddelfabrikant een nieuw uitgevonden geneesmiddel wil testen. Het volgt de standaardprocedure van het proberen van het medicijn op een groep patiënten en het geven van een placebo aan een andere groep, de controlegroep genaamd., De placebo die aan de controlegroep wordt gegeven is een stof zonder beoogde therapeutische waarde en dient als benchmark om te meten hoe de andere groep, die het eigenlijke geneesmiddel krijgt, reageert.

na het geneesmiddelonderzoek meldden de leden van de placebo-gevoede controlegroep een toename van de gemiddelde levensverwachting met drie jaar, terwijl de leden van de groep die het nieuwe geneesmiddel kregen voorgeschreven een toename van de gemiddelde levensverwachting met vier jaar meldden. Onmiddellijke observatie kan erop wijzen dat het medicijn inderdaad werkt, omdat de resultaten beter zijn voor de groep die het medicijn gebruikt., Het is echter ook mogelijk dat de waarneming te wijten is aan een toevallige gebeurtenis, vooral een verrassend stukje geluk. Een t-test is nuttig om te concluderen of de resultaten correct zijn en van toepassing zijn op de gehele populatie.

in een school scoorden 100 leerlingen in Klasse A gemiddeld 85% met een standaardafwijking van 3%. Nog eens 100 studenten uit klasse B scoorden gemiddeld 87% met een standaardafwijking van 4%., Hoewel het gemiddelde van klasse B beter is dan dat van Klasse A, is het misschien niet juist om te concluderen dat de algemene prestaties van studenten in klasse B beter zijn dan die van studenten in klasse A. Dit komt omdat er een natuurlijke variabiliteit is in de testscores in beide klassen, dus het verschil kan alleen te wijten zijn aan toeval. Een t-test kan helpen om te bepalen of de ene klasse het beter deed dan de andere.

T-Testaannamen

  1. De eerste aanname met betrekking tot t-tests betreft de meetschaal., De aanname voor een t-test is dat de schaal van meting toegepast op de verzamelde gegevens volgt een continue of ordinale schaal, zoals de scores voor een IQ-test.
  2. de tweede veronderstelling is die van een eenvoudige aselecte steekproef, dat de gegevens worden verzameld uit een representatief, aselecte deel van de totale populatie.
  3. de derde aanname is dat de gegevens, wanneer ze worden uitgezet, resulteren in een normale distributie, klokvormige distributiecurve.
  4. de uiteindelijke aanname is de homogeniteit van de variantie., Er bestaat een homogene of gelijke variantie wanneer de standaardafwijkingen van de monsters ongeveer gelijk zijn.

het berekenen van T-Tests

Het berekenen van een t-test vereist drie belangrijke gegevenswaarden. Zij omvatten het verschil tussen de gemiddelde waarden van elke gegevensverzameling (het gemiddelde verschil genoemd), de standaardafwijking van elke groep, en het aantal gegevenswaarden van elke groep.

het resultaat van de t-test geeft de t-waarde aan. Deze berekende t-waarde wordt dan vergeleken met een waarde verkregen uit een kritische waardetabel (de zogenaamde T-Distributietabel)., Deze vergelijking helpt om het effect van toeval alleen op het verschil te bepalen, en of het verschil buiten dat kansbereik ligt. De t-test vraagt zich af of het verschil tussen de groepen een echt verschil in de studie vertegenwoordigt of dat het mogelijk een betekenisloos willekeurig verschil is.

T-Distributietabellen

De T-Distributietabel is beschikbaar in de formaten one-tail en two-tails. De eerste wordt gebruikt voor het beoordelen van gevallen met een vaste waarde of een bereik met een duidelijke richting (positief of negatief)., Bijvoorbeeld, Wat is de kans dat de outputwaarde onder -3 blijft, of meer dan zeven krijgt bij het rollen van een paar dobbelstenen? Dit laatste wordt gebruikt voor bereikgebonden analyse, zoals de vraag of de coördinaten tussen -2 en +2 vallen.

de berekeningen kunnen worden uitgevoerd met standaard softwareprogramma ‘ s die de benodigde statistische functies ondersteunen, zoals die in MS Excel.

T-waarden en vrijheidsgraden

De T-test levert als output twee waarden op: t-waarde en vrijheidsgraden., De t-waarde is een verhouding van het verschil tussen het gemiddelde van de twee monstersets en de variatie die binnen de monstersets bestaat. Terwijl de teller waarde (het verschil tussen het gemiddelde van de twee sample sets) is eenvoudig te berekenen, de noemer (de variatie die bestaat binnen de sample sets) kan een beetje ingewikkeld worden afhankelijk van het type gegevens waarden betrokken. De noemer van de verhouding is een meting van de dispersie of variabiliteit. Hogere waarden van de T-waarde, ook wel t-score genoemd, geven aan dat er een groot verschil bestaat tussen de twee sample sets., Hoe kleiner de t-waarde, hoe meer Overeenkomst er bestaat tussen de twee sample sets.

  • een grote T-score geeft aan dat de groepen verschillend zijn.
  • een kleine T-score geeft aan dat de groepen vergelijkbaar zijn.

vrijheidsgraden verwijst naar de waarden in een studie die de vrijheid heeft om te variëren en essentieel zijn voor het beoordelen van het belang en de validiteit van de nulhypothese. De berekening van deze waarden hangt gewoonlijk af van het aantal beschikbare gegevensrecords in de steekproefreeks.,

gecorreleerde (of gepaarde) T-Test

de gecorreleerde t-test wordt uitgevoerd wanneer de monsters doorgaans uit overeenkomende paren van vergelijkbare eenheden bestaan of wanneer er gevallen van herhaalde metingen zijn. Er kunnen bijvoorbeeld gevallen zijn van dezelfde patiënten die herhaaldelijk worden getest-voor en na het ontvangen van een bepaalde behandeling. In dergelijke gevallen wordt elke patiënt gebruikt als controlesteekproef tegen zichzelf.,

deze methode is ook van toepassing op gevallen waarin de monsters op een of andere manier verwant zijn of overeenkomende kenmerken hebben, zoals een vergelijkende analyse waarbij kinderen, ouders of broers en zussen betrokken zijn. Gecorreleerde of gepaarde t-tests zijn van een afhankelijk type, aangezien deze gevallen waarbij de twee reeksen monsters zijn gerelateerd.

De formule voor het berekenen van de T-waarde en vrijheidsgraden voor een gepaarde t-test is:

de overige twee typen behoren tot de onafhankelijke t-tests., De steekproeven van deze types worden onafhankelijk van elkaar geselecteerd—dat wil zeggen, de datasets in de twee groepen verwijzen niet naar dezelfde waarden. Ze omvatten gevallen zoals een groep van 100 patiënten die worden opgesplitst in twee sets van 50 patiënten elk. Een van de groepen wordt de controlegroep en krijgt een placebo, terwijl de andere groep de voorgeschreven behandeling krijgt. Dit zijn twee onafhankelijke steekproefgroepen die niet met elkaar verbonden zijn.,

gelijke variantie (of samengevoegd) T-Test

de gelijke variantie t-test wordt gebruikt wanneer het aantal monsters in elke groep gelijk is of de variantie van de twee gegevensverzamelingen gelijk is. De volgende formule wordt gebruikt voor de berekening van T-waarde en vrijheidsgraden voor Gelijke variantie t-test:

en

ongelijke variantie T-Test

de ongelijke variantie t-test wordt gebruikt wanneer het aantal monsters in elke groep verschillend is en de variantie van de twee gegevensverzamelingen ook verschillend is. Deze test wordt ook wel de T-test van Welch genoemd., De volgende formule wordt gebruikt voor het berekenen van de t-waarde en vrijheidsgraden voor een ongelijke variantie t-test:

en

bepalen van de juiste t-Test die

moet worden gebruikt het volgende stroomschema kan worden gebruikt om te bepalen welke t-test moet worden gebruikt op basis van de kenmerken van de monstersets. De belangrijkste elementen die in aanmerking moeten worden genomen, zijn onder meer of de steekproefrecords vergelijkbaar zijn, het aantal gegevensrecords in elke steekproefset en de variantie van elke steekproefset.,

Image by Julie Bang © Investopedia 2019

ongelijke variantie T-Test voorbeeld

stel dat we een diagonaal meten van schilderijen die in een kunstgalerie zijn ontvangen. Een groep monsters bevat 10 schilderijen, terwijl de andere 20 schilderijen bevat., The data sets, with the corresponding mean and variance values, are as follows:

Set 1 Set 2
19.7 28.3
20.4 26.7
19.6 20.1
17.8 23.3
18.5 25.2
18.9 22.1
18.3 17.,7
18.9 27.6
19.5 20.6
21.95 13.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.,9
13.3
Bedoel 19.4 21.6
Variantie 1.4 17.1

Hoewel het gemiddelde van Set 2 is hoger dan die van Set 1, kunnen we niet concluderen dat de bevolking overeenkomt met Set 2 heeft een hoger gemiddelde dan de bevolking overeenkomstige Instellen 1. Is het verschil van 19,4 naar 21,6 alleen te wijten aan toeval, of bestaan er echt verschillen in de totale bevolking van alle in de kunstgalerie ontvangen schilderijen?, We stellen het probleem vast door de nulhypothese aan te nemen dat het gemiddelde hetzelfde is tussen de twee samplesets en voeren een t-test uit om te testen of de hypothese aannemelijk is.

omdat het aantal gegevensrecords verschillend is (n1 = 10 en n2 = 20) en de variantie ook verschillend is, worden de T-waarde en vrijheidsgraden berekend voor de bovenstaande gegevensverzameling met behulp van de formule die wordt vermeld in de sectie ongelijke variantie T-Test.

De T-waarde is -2.24787. Aangezien het minteken kan worden genegeerd bij het vergelijken van de twee t-waarden, is de berekende waarde 2.24787.,

de waarde van de vrijheidsgraden is 24,38 en wordt teruggebracht tot 24, omdat de formule definitie vereist afronding van de waarde naar beneden naar de minst mogelijke gehele waarde.

men kan een waarschijnlijkheidsniveau (alfaniveau, significantieniveau, p) als acceptatiecriterium specificeren. In de meeste gevallen kan een waarde van 5% worden aangenomen.

gebruikmakend van de waarde van de vrijheidsgraad als 24 en een significantieniveau van 5%, geeft een blik op de distributietabel van de t-waarde een waarde van 2.064. Deze waarde vergelijken met de berekende waarde van 2.,247 geeft aan dat de berekende t-waarde groter is dan de tabelwaarde bij een significantieniveau van 5%. Daarom is het veilig om de nulhypothese dat er geen verschil tussen middelen te verwerpen. De bevolkingsset heeft intrinsieke verschillen, en ze zijn niet toevallig.,

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *