Was Ist ein T-Test?

Ein T-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob zwischen den Mitteln zweier Gruppen ein signifikanter Unterschied besteht, der in bestimmten Merkmalen zusammenhängen kann. Es wird hauptsächlich verwendet, wenn die Datensätze, wie der Datensatz, der als Ergebnis des 100-fachen Umdrehens einer Münze aufgezeichnet wurde, einer Normalverteilung folgen und unbekannte Varianzen aufweisen würden. Ein t-Test wird als Hypothesentestwerkzeug verwendet, das das Testen einer für eine Population geltenden Annahme ermöglicht.,

Ein T-Test betrachtet die T-Statistik, die T-Verteilungswerte und die Freiheitsgrade zur Bestimmung der statistischen Signifikanz. Um einen Test mit drei oder mehr Mitteln durchzuführen, muss eine Varianzanalyse durchgeführt werden.

1: 38

T-Test

Erläuterung des T-Tests

Mit einem t-Test können wir im Wesentlichen die Durchschnittswerte der beiden Datensätze vergleichen und feststellen, ob sie aus derselben Population stammen., Wenn wir in den obigen Beispielen eine Stichprobe von Schülern der Klasse A und eine andere Stichprobe von Schülern der Klasse B entnehmen würden, würden wir nicht erwarten, dass sie genau den gleichen Mittelwert und die gleiche Standardabweichung haben. In ähnlicher Weise sollten Proben aus der mit Placebo gefütterten Kontrollgruppe und solche aus der mit dem Arzneimittel verschriebenen Gruppe eine etwas andere mittlere und Standardabweichung aufweisen.

Mathematisch nimmt der t-Test eine Stichprobe aus jeder der beiden Mengen und erstellt die Problemanweisung, indem er eine Nullhypothese annimmt, dass die beiden Mittelwerte gleich sind., Basierend auf den anwendbaren Formeln werden bestimmte Werte berechnet und mit den Standardwerten verglichen, und die angenommene Nullhypothese wird entsprechend akzeptiert oder abgelehnt.

Wenn die Nullhypothese als abgelehnt gilt, zeigt dies an, dass die Datenwerte stark sind und wahrscheinlich nicht auf Zufall zurückzuführen sind. Der t-Test ist nur einer von vielen Tests, die für diesen Zweck verwendet werden. Statistiker müssen zusätzlich andere Tests als den t-Test verwenden, um mehr Variablen und Tests mit größeren Stichprobengrößen zu untersuchen. Für eine große Stichprobengröße verwenden Statistiker einen Z-Test., Weitere Testoptionen sind der Chi-Square-Test und der f-Test.

Es gibt drei Arten von T-Tests, die als abhängige und unabhängige T-Tests kategorisiert werden.

Key Takeaways

  • Ein T-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen zusammenhängen können.
  • Der t-Test ist einer von vielen Tests, die für Hypothesentests in der Statistik verwendet werden.
  • Die Berechnung eines T-Tests erfordert drei wichtige Datenwerte., Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als mittlere Differenz bezeichnet), der Standardabweichung jeder Gruppe und der Anzahl der Datenwerte jeder Gruppe.
  • Es gibt verschiedene Arten von T-Tests, die je nach Daten und Art der erforderlichen Analyse durchgeführt werden können.

Mehrdeutige Testergebnisse

Bedenken Sie, dass ein Arzneimittelhersteller ein neu erfundenes Arzneimittel testen möchte. Es folgt dem Standardverfahren, das Medikament an einer Gruppe von Patienten auszuprobieren und einer anderen Gruppe, der sogenannten Kontrollgruppe, ein Placebo zu verabreichen., Das Placebo, das der Kontrollgruppe verabreicht wird, ist eine Substanz ohne beabsichtigten therapeutischen Wert und dient als Benchmark, um zu messen, wie die andere Gruppe, der das eigentliche Medikament verabreicht wird, reagiert.

Nach der Medikamentenstudie berichteten die Mitglieder der mit Placebo gefütterten Kontrollgruppe von einem Anstieg der durchschnittlichen Lebenserwartung von drei Jahren, während die Mitglieder der Gruppe, denen das neue Medikament verschrieben wurde, einen Anstieg der durchschnittlichen Lebenserwartung von vier Jahren berichteten. Sofortige Beobachtung kann darauf hindeuten, dass das Medikament tatsächlich wirkt, da die Ergebnisse für die Gruppe, die das Medikament verwendet, besser sind., Es ist jedoch auch möglich, dass die Beobachtung auf ein zufälliges Ereignis zurückzuführen ist, insbesondere auf ein überraschendes Glücksstück. Ein T-Test ist nützlich, um festzustellen, ob die Ergebnisse tatsächlich korrekt und für die gesamte Population anwendbar sind.

In einer Schule erzielten 100 Schüler der Klasse A durchschnittlich 85% bei einer Standardabweichung von 3%. Weitere 100 Schüler der Klasse B erzielten durchschnittlich 87% bei einer Standardabweichung von 4%., Während der Durchschnitt der Klasse B besser ist als der der Klasse A, ist es möglicherweise nicht richtig, zu dem Schluss zu kommen, dass die Gesamtleistung der Schüler der Klasse B besser ist als die der Schüler der Klasse A. Dies liegt daran, dass die Testergebnisse in beiden Klassen natürlich unterschiedlich sind, sodass der Unterschied allein auf den Zufall zurückzuführen sein kann. Ein T-Test kann helfen, festzustellen, ob eine Klasse besser erging als die andere.

T-Testannahmen

  1. Die erste Annahme bezüglich T-Tests betrifft den Messmaßstab., Die Annahme für einen T-Test besteht darin, dass der auf die gesammelten Daten angewendete Maßstabsskala einer kontinuierlichen oder ordinalen Skala folgt, z. B. den Werten für einen IQ-Test.
  2. Die zweite Annahme ist die einer einfachen Zufallsstichprobe, dass die Daten von einem repräsentativen, zufällig ausgewählten Teil der Gesamtbevölkerung gesammelt werden.
  3. Die dritte Annahme ist, dass die Daten, wenn sie aufgetragen werden, zu einer Normalverteilung führen, glockenförmige Verteilungskurve.
  4. Die endgültige Annahme ist die Homogenität der Varianz., Homogene oder gleiche Varianz besteht, wenn die Standardabweichungen von Stichproben ungefähr gleich sind.

Berechnung von T-Tests

Die Berechnung eines T-Tests erfordert drei wichtige Datenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als mittlere Differenz bezeichnet), der Standardabweichung jeder Gruppe und der Anzahl der Datenwerte jeder Gruppe.

Das Ergebnis des T-Tests erzeugt den t-Wert. Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer kritischen Wertetabelle (T-Verteilertabelle genannt) erhalten wird., Dieser Vergleich hilft, den Effekt des Zufalls allein auf die Differenz zu bestimmen und ob der Unterschied außerhalb dieses Zufallsbereichs liegt. Der t-test Fragen, ob der Unterschied zwischen den Gruppen ist eine wahre Unterschied in der Studie oder ob es möglicherweise eine sinnlose zufällige Unterschied.

T-Verteilertabellen

Die T-Verteilertabelle ist in den Formaten One-tail und two-Tails verfügbar. Ersteres dient zur Beurteilung von Fällen, die einen festen Wert oder Bereich mit einer klaren Richtung (positiv oder negativ) haben., Wie hoch ist beispielsweise die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder beim Würfeln eines Würfels mehr als sieben erhält? Letzteres wird für die bereichsgebundene Analyse verwendet, z. B. um zu fragen, ob die Koordinaten zwischen -2 und +2 liegen.

Die Berechnungen können mit Standard-Softwareprogrammen durchgeführt werden, die die erforderlichen statistischen Funktionen unterstützen, wie sie in MS Excel zu finden sind.

T-Werte und Freiheitsgrade

Der t-Test erzeugt als Ausgabe zwei Werte: t-Wert und Freiheitsgrade., Der t-Wert ist ein Verhältnis der Differenz zwischen dem Mittelwert der beiden Stichprobensätze und der Variation innerhalb der Stichprobensätze. Während der Zählerwert (die Differenz zwischen dem Mittelwert der beiden Abtastsätze) einfach zu berechnen ist, kann der Nenner (die Variation, die innerhalb der Abtastsätze vorhanden ist) je nach Art der beteiligten Datenwerte etwas kompliziert werden. Der Nenner des Verhältnisses ist eine Messung der Dispersion oder Variabilität. Höhere Werte des t-Werts, auch t-Score genannt, deuten darauf hin, dass zwischen den beiden Abtastsätzen ein großer Unterschied besteht., Je kleiner der t-Wert ist, desto mehr Ähnlichkeit besteht zwischen den beiden Stichprobensätzen.

  • Ein großer T-Score zeigt an, dass die Gruppen unterschiedlich sind.
  • Ein kleiner T-Score zeigt an, dass die Gruppen ähnlich sind.

Freiheitsgrade beziehen sich auf die Werte in einer Studie, die frei variieren können und für die Beurteilung der Wichtigkeit und Gültigkeit der Nullhypothese unerlässlich sind. Die Berechnung dieser Werte hängt normalerweise von der Anzahl der Datensätze ab, die im Beispielsatz verfügbar sind.,

Korrelierter (oder gepaarter) T-Test

Der korrelierte t-Test wird durchgeführt, wenn die Proben typischerweise aus übereinstimmenden Paaren ähnlicher Einheiten bestehen oder wenn es Fälle von wiederholten Messungen gibt. Beispielsweise kann es vorkommen, dass dieselben Patienten wiederholt getestet werden—vor und nach einer bestimmten Behandlung. In solchen Fällen wird jeder Patient als Kontrollprobe gegen sich selbst verwendet.,

Diese Methode gilt auch für Fälle, in denen die Proben in irgendeiner Weise verwandt sind oder übereinstimmende Merkmale aufweisen, wie z. B. eine vergleichende Analyse mit Kindern, Eltern oder Geschwistern. Korrelierte oder gepaarte t-Tests sind von einem abhängigen Typ, da diese Fälle betreffen, in denen die beiden Stichprobensätze verwandt sind.

Die Formel zur Berechnung des T-Wertes und der Freiheitsgrade für einen gepaarten t-Test lautet:

Die verbleibenden zwei Typen gehören zu den unabhängigen t-Tests., Die Stichproben dieser Typen werden unabhängig voneinander ausgewählt—das heißt, die Datensätze in den beiden Gruppen beziehen sich nicht auf dieselben Werte. Dazu gehören Fälle wie eine Gruppe von 100 Patienten, die in zwei Gruppen von jeweils 50 Patienten aufgeteilt werden. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe die vorgeschriebene Behandlung erhält. Dies stellt zwei unabhängige Stichprobengruppen dar, die ungepaart miteinander sind.,

Gleicher Varianz – (oder gepoolter) T-Test

Der gleiche Varianz-t-Test wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für den gleichen Varianz-t-Test verwendet:

und

Ungleiche Varianz T-Test

Der ungleiche Varianz-t-Test wird verwendet, wenn die Anzahl der Proben in jeder Gruppe unterschiedlich ist und die Varianz der beiden Datensätze ebenfalls unterschiedlich ist. Dieser Test wird auch als Welch ‚ s t-Test bezeichnet., Die folgende Formel wird zur Berechnung des T-Wertes und der Freiheitsgrade für einen T-Test mit ungleicher Varianz verwendet:

und

Bestimmen des richtigen T-Tests für die Verwendung

Anhand des folgenden Flussdiagramms kann anhand der Merkmale der Probensätze bestimmt werden, welcher t-Test verwendet werden soll. Die zu berücksichtigenden Schlüsselelemente umfassen, ob die Stichprobendatensätze ähnlich sind, die Anzahl der Datensätze in jedem Stichprobensatz und die Varianz jedes Stichprobensatzes.,

Bild von Julie Bang © Investopedia 2019

Ungleiche Varianz T-Testbeispiel

Nehmen wir an, dass wir eine diagonale Messung von Gemälden durchführen, die in einer Kunst erhalten wurden galerie. Eine Gruppe von Proben umfasst 10 Gemälde, während die andere 20 Gemälde umfasst., The data sets, with the corresponding mean and variance values, are as follows:

Set 1 Set 2
19.7 28.3
20.4 26.7
19.6 20.1
17.8 23.3
18.5 25.2
18.9 22.1
18.3 17.,7
18.9 27.6
19.5 20.6
21.95 13.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.,9
13.3
Mittelwert 19.4 21.6
Varianz 1.4 17.1

Obwohl der Mittelwert von Satz 2 höher ist als der von Satz 1, können wir nicht schließen, dass die Grundgesamtheit, die Satz 2 entspricht, einen höheren Mittelwert hat als die Grundgesamtheit, die Satz 1 entspricht. Ist der Unterschied von 19,4 zu 21,6 allein auf den Zufall zurückzuführen, oder gibt es wirklich Unterschiede in der Gesamtbevölkerung aller in der Kunstgalerie erhaltenen Gemälde?, Wir stellen das Problem her, indem wir die Nullhypothese annehmen, dass der Mittelwert zwischen den beiden Stichprobensätzen gleich ist, und führen einen t-Test durch, um zu testen, ob die Hypothese plausibel ist.

Da die Anzahl der Datensätze unterschiedlich ist (n1 = 10 und n2 = 20) und die Varianz ebenfalls unterschiedlich ist, werden der t-Wert und die Freiheitsgrade für den obigen Datensatz unter Verwendung der im Abschnitt Ungleiche Varianz T-Test genannten Formel berechnet.

Der t-Wert ist -2.24787. Da das Minuszeichen beim Vergleich der beiden t-Werte ignoriert werden kann, beträgt der berechnete Wert 2.24787.,

Der Wert der Freiheitsgrade beträgt 24,38 und wird auf 24 reduziert, da die Formeldefinition eine Abrundung des Werts auf den geringstmöglichen ganzzahligen Wert erfordert.

Als Akzeptanzkriterium kann ein Wahrscheinlichkeitsniveau (Alpha-Level, Signifikanzniveau, p) angegeben werden. In den meisten Fällen kann ein Wert von 5% angenommen werden.

Unter Verwendung des Freiheitsgrades als 24 und einer Signifikanzstufe von 5% ergibt ein Blick auf die T-Wert-Verteilertabelle einen Wert von 2.064. Vergleicht man diesen Wert mit dem berechneten Wert von 2.,247 gibt an, dass der berechnete t-Wert bei einem Signifikanzniveau von 5% größer als der Tabellenwert ist. Daher ist es sicher, die Nullhypothese abzulehnen, dass es keinen Unterschied zwischen den Mitteln gibt. Die Population hat intrinsische Unterschiede, und sie sind kein Zufall.,

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.