Co To jest t-Test?
t-test jest rodzajem wnioskowania statystyki używane do określenia, czy istnieje znacząca różnica między środkami dwóch grup, które mogą być związane w niektórych cechach. Jest on najczęściej używany, gdy zbiory danych, jak zestaw danych zapisanych jako wynik z rzutu monetą 100 razy, będzie po rozkładzie normalnym i może mieć nieznane wariancji. Test t jest używany jako narzędzie do testowania hipotez, które umożliwia testowanie założeń mających zastosowanie do populacji.,
test t sprawdza statystykę t, wartości rozkładu t i stopnie swobody w celu określenia istotności statystycznej. Aby przeprowadzić test z trzech lub więcej środków, należy użyć analizy wariancji.
Test T
wyjaśniając test T
zasadniczo, test t pozwala nam porównać średnie wartości z dwóch zestawów danych i określić, czy pochodzą one z tego samego mieszkańców., W powyższych przykładach, gdybyśmy mieli pobrać próbkę uczniów z klasy A i inną próbkę uczniów z klasy B, nie spodziewalibyśmy się, że będą mieli dokładnie taką samą średnią i odchylenie standardowe. Podobnie, próbki pobrane z grupy kontrolnej karmionej placebo oraz próbki pobrane z grupy przepisanej lekiem powinny mieć nieco inne średnie i standardowe odchylenie.
matematycznie, t-test pobiera próbkę z każdego z dwóch zestawów i ustanawia stwierdzenie problemu, zakładając hipotezę zerową, że dwa środki są równe., W oparciu o obowiązujące wzory, niektóre wartości są obliczane i porównywane z wartościami standardowymi, a przyjęta hipoteza zerowa jest odpowiednio akceptowana lub odrzucana.
Jeśli hipoteza zerowa kwalifikuje się do odrzucenia, oznacza to, że odczyty danych są silne i prawdopodobnie nie są ze względu na przypadek. T-test jest tylko jednym z wielu testów stosowanych w tym celu. Statystycy muszą dodatkowo używać testów innych niż test t do badania większej liczby zmiennych i testów z większymi rozmiarami próbek. W przypadku dużej próby statystycy używają testu Z., Inne opcje testowania obejmują test chi-square i test F.
istnieją trzy rodzaje t-testów i są one klasyfikowane jako zależne i niezależne t-testy.
Key Takeaways
- a t-test jest rodzajem wnioskowania statystyki używane do określenia, czy istnieje znacząca różnica między środkami dwóch grup, które mogą być związane w niektórych cechach.
- test t jest jednym z wielu testów używanych do celów testowania hipotez w statystyce.
- Obliczanie testu t wymaga trzech kluczowych wartości danych., Obejmują one różnicę między wartościami średnimi z każdego zestawu danych (zwany średnią różnicą), odchylenie standardowe każdej grupy, a liczba wartości danych z każdej grupy.
- istnieje kilka różnych typów testu t, które można wykonać w zależności od wymaganych danych i rodzaju analizy.
Postępuje zgodnie ze standardową procedurą wypróbowania leku na jednej grupie pacjentów i podania placebo innej grupie, zwanej grupą kontrolną., Placebo podawane grupie kontrolnej jest substancją nie mającą zamierzonej wartości terapeutycznej i służy jako punkt odniesienia do pomiaru reakcji drugiej grupy, której podano rzeczywisty lek.
po badaniu leku członkowie grupy kontrolnej karmionej placebo zgłaszali wzrost średniej średniej długości życia o trzy lata, podczas gdy członkowie grupy, którym przepisano nowy lek, zgłaszają wzrost średniej średniej długości życia o cztery lata. Natychmiastowa obserwacja może wskazywać, że lek rzeczywiście działa, ponieważ wyniki są lepsze dla grupy używającej leku., Jednak możliwe jest również, że obserwacja może być spowodowana przypadkowym zdarzeniem, szczególnie zaskakującym szczęściem. Test t jest przydatny do stwierdzenia, czy wyniki są rzeczywiście poprawne i mają zastosowanie do całej populacji.
w szkole 100 uczniów w klasie A uzyskało średnią ocenę 85% z odchyleniem standardowym 3%. Kolejne 100 uczniów należących do klasy B uzyskało średnią 87% z odchyleniem standardowym 4%., Podczas gdy średnia w klasie B jest lepsza niż w klasie A, może nie być poprawne, aby przejść do wniosku, że ogólna wydajność uczniów w Klasie B jest lepsza niż uczniów w klasie A. dzieje się tak dlatego, że istnieje naturalna zmienność w wynikach testów w obu klasach, więc różnica może być spowodowana samym przypadkiem. Test t może pomóc w ustaleniu, czy jedna klasa radziła sobie lepiej niż druga.
założenia testu T
- pierwsze założenie dotyczące testów t dotyczy skali pomiaru., Zakłada się, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ.
- drugim założeniem jest prosta próba losowa, że dane są zbierane od reprezentatywnej, losowo wybranej części całkowitej populacji.
- trzecie założenie to DANE, gdy wykreślone, dają rozkład normalny, krzywa rozkładu W kształcie dzwonu.
- ostatecznym założeniem jest jednorodność wariancji., Jednorodne, lub równe, wariancja istnieje, gdy odchylenia standardowe próbek są w przybliżeniu równe.
Obliczanie T-testów
Obliczanie t-testu wymaga trzech kluczowych wartości danych. Obejmują one różnicę między wartościami średnimi z każdego zestawu danych (zwany średnią różnicą), odchylenie standardowe każdej grupy, a liczba wartości danych z każdej grupy.
wynik testu t daje wartość t. Obliczona wartość T jest następnie porównywana z wartością uzyskaną z tabeli wartości krytycznych (zwanej tabelą rozkładu t)., Porównanie to pomaga określić wpływ samego przypadku na różnicę i czy różnica znajduje się poza tym zakresem szansy. T-test stawia pytanie, czy różnica między grupami stanowi prawdziwą różnicę w badaniu, czy też jest to prawdopodobnie bezsensowna różnica losowa.
tabele dystrybucji T
tabela dystrybucji T jest dostępna w formatach jedno-i dwu-ogonowych. Pierwszy z nich służy do oceny przypadków, które mają stałą wartość lub zakres z wyraźnym kierunkiem (dodatnim lub ujemnym)., Na przykład, Jakie jest prawdopodobieństwo, że wartość wyjściowa pozostanie poniżej -3 lub uzyskanie więcej niż siedmiu podczas rzucania parą kości? Ten ostatni jest używany do analizy zakresu, np. pytając, czy Współrzędne mieszczą się w przedziale od -2 do +2.
obliczenia mogą być wykonywane za pomocą standardowych programów, które obsługują niezbędne funkcje statystyczne, takie jak te Znalezione w MS Excel.
T-wartości i stopnie swobody
t-test daje dwie wartości jako wynik: t-wartość i stopnie swobody., Wartość t jest stosunek różnicy między średnią z dwóch zestawów próbek i zmiany, która istnieje w zestawach próbek. Podczas gdy wartość licznika (różnica między średnią z dwóch zestawów próbek) jest prosta do obliczenia, mianownik (zmiana, która istnieje w zestawach próbek) może stać się nieco skomplikowane w zależności od rodzaju danych wartości zaangażowanych. Mianownik stosunku jest miarą dyspersji lub zmienności. Wyższe wartości wartości t, zwane również t-score, wskazują, że istnieje duża różnica między dwoma zestawami próbek., Im mniejsza wartość t, tym większe podobieństwo istnieje między dwoma zestawami próbek.
- duży wynik t wskazuje, że grupy są różne.
- mały wynik t wskazuje, że grupy są podobne.
stopnie swobody odnosi się do wartości w badaniu, które ma swobodę zmieniać i są niezbędne do oceny znaczenia i ważności hipotezy zerowej. Obliczanie tych wartości zwykle zależy od liczby rekordów danych dostępnych w zestawie próbek.,
skorelowany (lub sparowany) Test T
skorelowany test t jest wykonywany, gdy próbki zazwyczaj składają się z dopasowanych par podobnych jednostek lub gdy występują przypadki powtarzających się pomiarów. Na przykład mogą wystąpić przypadki wielokrotnego testowania tych samych pacjentów-przed i po otrzymaniu określonego leczenia. W takich przypadkach każdy pacjent jest używany jako próbka kontrolna przeciwko sobie.,
ta metoda ma również zastosowanie do przypadków, w których próbki są w jakiś sposób powiązane lub mają podobne cechy, takie jak analiza porównawcza z udziałem dzieci, rodziców lub rodzeństwa. Skorelowane lub sparowane testy t są zależne od typu, ponieważ obejmują one przypadki, w których oba zestawy próbek są ze sobą powiązane.
wzór obliczania wartości T i stopni swobody dla sparowanego testu t jest następujący:
pozostałe dwa typy należą do niezależnych testów T., Próbki tych typów są wybierane niezależnie od siebie—oznacza to, że zbiory danych w dwóch grupach nie odnoszą się do tych samych wartości. Obejmują one przypadki, takie jak grupa 100 pacjentów podzielona na dwa zestawy po 50 pacjentów każdy. Jedna z grup staje się grupą kontrolną i otrzymuje placebo, podczas gdy druga grupa otrzymuje przepisane leczenie. Stanowi to dwie niezależne grupy próbne, które nie są ze sobą powiązane.,
Equal Variance (or Pooled) t-Test
equal variance t-test jest używany, gdy liczba próbek w każdej grupie jest taka sama lub wariancja dwóch zestawów danych jest podobna. Poniższy wzór jest używany do obliczania wartości t i stopni swobody dla równej wariancji t-test:
i
nierówna wariancja t-Test
nierówna wariancja t-test jest używany, gdy liczba próbek w każdej grupie jest inna, a wariancja dwóch zestawów danych jest również inna. Test ten nazywany jest również testem t Welcha., Poniższy wzór jest używany do obliczania wartości t i stopni swobody dla nierównomiernej wariancji testu t:
oraz
określanie prawidłowego testu T, którego należy użyć
poniższy schemat blokowy może być użyty do określenia, który test t należy zastosować na podstawie charakterystyki zestawów próbek. Kluczowe elementy, które należy wziąć pod uwagę to, czy rekordy próbki są podobne, liczba rekordów danych w każdym zestawie próbek i wariancji każdego zestawu próbek.,
nierówna wariancja t-Test przykład
załóżmy, że bierzemy diagonalny pomiar obrazów otrzymanych w Galerii Sztuki. Jedna grupa próbek obejmuje 10 obrazów, podczas gdy druga obejmuje 20 obrazów., The data sets, with the corresponding mean and variance values, are as follows:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.,7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.,9 | ||
13, 3 | ||
Średnia | 19, 4 | 21, 6 |
1, 4 | 17, 1 |
chociaż średnia z zestawu 2 jest wyższa niż średnia z zestawu 1, nie możemy stwierdzić, że populacja odpowiadająca zestawowi 2 ma wyższą średnią niż populacja odpowiadająca zestawowi 1. Czy różnica z 19,4 do 21,6 wynika z samego przypadku, czy też różnice istnieją naprawdę w ogólnej populacji wszystkich obrazów otrzymanych w Galerii Sztuki?, Ustalamy problem, zakładając hipotezę zerową, że średnia jest taka sama między dwoma zestawami próbek i przeprowadzić test t, aby sprawdzić, czy hipoteza jest wiarygodna.
ponieważ liczba rekordów danych jest różna (n1 = 10 i n2 = 20) i wariancja jest również różna, wartość t i stopnie swobody są obliczane dla powyższego zbioru danych przy użyciu wzoru wymienionego w sekcji Test T nierównej wariancji.
wartość t wynosi -2.24787. Ponieważ znak minus może być ignorowany podczas porównywania dwóch wartości t, obliczona wartość wynosi 2.24787.,
wartość stopni swobody wynosi 24,38 i jest zmniejszona do 24, ze względu na definicję formuły wymagającą zaokrąglenia w dół wartości do najmniejszej możliwej wartości całkowitej.
jako kryterium akceptacji można określić poziom prawdopodobieństwa (poziom alfa, poziom istotności, p). W większości przypadków można przyjąć wartość 5%.
wykorzystując wartość stopnia swobody jako 24 i 5% poziomu istotności, spojrzenie na tabelę rozkładu wartości t daje wartość 2.064. Porównując tę wartość z obliczoną wartością 2.,247 wskazuje, że obliczona wartość t jest większa niż wartość tabelaryczna przy poziomie istotności 5%. Dlatego bezpiecznie jest odrzucić hipotezę zerową, że nie ma różnicy między środkami. Zestaw populacji ma wewnętrzne różnice i nie są one przypadkowe.,
/div>