ce este un T-Test?

un test t este un tip de Statistică inferențială utilizată pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate în anumite caracteristici. Este folosit mai ales atunci când seturile de date, cum ar fi setul de date înregistrate ca rezultat al răsturnării unei monede de 100 de ori, ar urma o distribuție normală și ar putea avea variații necunoscute. Un test t este utilizat ca instrument de testare a ipotezelor, care permite testarea unei ipoteze aplicabile unei populații.,

un test t analizează statistica t, valorile distribuției t și gradele de libertate pentru a determina semnificația statistică. Pentru a efectua un test cu trei sau mai multe mijloace, trebuie să utilizați o analiză a varianței.

1:38

T-Test

Explicarea T-Test

în Esență, un t-test ne permite de a compara valorile medii ale celor două seturi de date și de a determina dacă au venit din aceeași populație., În exemplele de mai sus, dacă ar fi să luăm un eșantion de elevi din clasa A și un alt eșantion de studenți din clasa B, nu ne-am aștepta ca aceștia să aibă exact aceeași medie și aceeași abatere standard. În mod similar, probele prelevate din grupul de control alimentat cu placebo și cele prelevate din grupul prescris cu medicamente ar trebui să aibă o medie ușor diferită și o abatere standard.din punct de vedere matematic, testul t ia un eșantion din fiecare dintre cele două seturi și stabilește afirmația problemei presupunând o ipoteză nulă că cele două mijloace sunt egale., Pe baza formulelor aplicabile, anumite valori sunt calculate și comparate cu valorile standard, iar ipoteza nulă presupusă este acceptată sau respinsă în consecință.dacă ipoteza nulă se califică a fi respinsă, aceasta indică faptul că citirile de date sunt puternice și probabil nu se datorează întâmplării. Testul t este doar unul dintre numeroasele teste utilizate în acest scop. Statisticienii trebuie să utilizeze în plus alte teste decât testul t pentru a examina mai multe variabile și teste cu dimensiuni mai mari ale eșantionului. Pentru o dimensiune mare a eșantionului, statisticienii folosesc un test Z., Alte opțiuni de testare includ testul chi-pătrat și testul F.există trei tipuri de teste t și sunt clasificate ca teste t dependente și independente.

Takeaways cheie

  • un test t este un tip de Statistică inferențială utilizată pentru a determina dacă există o diferență semnificativă între mijloacele a două grupuri, care pot fi legate în anumite caracteristici.
  • testul t este unul dintre numeroasele teste utilizate în scopul testării ipotezelor în statistici.
  • calcularea unui test t necesită trei valori cheie ale datelor., Acestea includ diferența dintre valorile medii din fiecare set de date (numită diferența medie), abaterea standard a fiecărui grup și numărul de valori de date ale fiecărui grup.
  • există mai multe tipuri diferite de t-test care pot fi efectuate în funcție de datele și tipul de analiză necesare.

rezultatele ambigue ale testelor

luați în considerare faptul că un producător de medicamente dorește să testeze un medicament nou inventat. Urmează procedura standard de a încerca medicamentul pe un grup de pacienți și de a da un placebo unui alt grup, numit grupul de control., Placebo administrat grupului de control este o substanță fără valoare terapeutică intenționată și servește ca punct de referință pentru a măsura modul în care celălalt grup, căruia i se administrează medicamentul real, răspunde.

După procesul de droguri, membrii placebo-fed grupul de control au raportat o creștere în medie speranța de viață de trei ani, în timp ce membrii grupului care sunt prescrise droguri noi, raportează o creștere în medie speranța de viață de patru ani. Observarea instantanee poate indica faptul că medicamentul funcționează într-adevăr, deoarece rezultatele sunt mai bune pentru grupul care utilizează medicamentul., Cu toate acestea, este de asemenea posibil ca observația să se datoreze unei întâmplări întâmplătoare, în special unei norocuri surprinzătoare. Un test t este util pentru a concluziona dacă rezultatele sunt de fapt corecte și aplicabile întregii populații.într-o școală, 100 de elevi din clasa A au obținut o medie de 85%, cu o abatere standard de 3%. Alți 100 de studenți aparținând clasei B au obținut o medie de 87%, cu o abatere standard de 4%., În timp ce media din clasa B este mai bună decât cea de clasa a, ea nu poate fi corect pentru a sări la concluzia că performanța de ansamblu a elevilor din clasa B este mai bună decât cea a elevilor din clasa A. Acest lucru este pentru că există variabilitatea naturală în rezultatele testelor în ambele clase, deci diferenta ar putea fi la voia întâmplării. Un t-test poate ajuta pentru a determina dacă o clasă s-au descurcat mai bine decât celălalt.

T-Test ipoteze

  1. prima ipoteză făcută cu privire la t-teste se referă la scara de măsurare., Presupunerea pentru un test t este că scara de măsurare aplicată datelor colectate urmează o scară continuă sau ordinală, cum ar fi scorurile pentru un test IQ.
  2. a doua presupunere făcută este aceea a unui eșantion aleatoriu simplu, că datele sunt colectate dintr-o parte reprezentativă, selectată aleatoriu din populația totală.
  3. a treia ipoteză este că datele, atunci când sunt reprezentate grafic, au ca rezultat o distribuție normală, curba de distribuție în formă de clopot.
  4. ipoteza finală este omogenitatea varianței., Varianța omogenă sau egală există atunci când abaterile standard ale eșantioanelor sunt aproximativ egale.

calcularea testelor t

calcularea unui test t necesită trei valori cheie ale datelor. Acestea includ diferența dintre valorile medii din fiecare set de date (numită diferența medie), abaterea standard a fiecărui grup și numărul de valori de date ale fiecărui grup.

rezultatul testului t produce valoarea T. Această valoare t calculată este apoi comparată cu o valoare obținută dintr-un tabel de valori critice (numit tabelul de distribuție T)., Această comparație ajută la determinarea efectului de șansă singur pe diferența, și dacă diferența este în afara acestui interval șansă. Testul t pune la îndoială dacă diferența dintre grupuri reprezintă o diferență reală în studiu sau dacă este posibil o diferență aleatorie fără sens.

tabele de distribuție t

tabelul de distribuție T este disponibil în formate cu o coadă și două cozi. Primul este utilizat pentru evaluarea cazurilor care au o valoare fixă sau un interval cu o direcție clară (pozitivă sau negativă)., De exemplu, care este probabilitatea ca valoarea de ieșire să rămână sub -3 sau să obțină mai mult de șapte la rularea unei perechi de zaruri? Acesta din urmă este utilizat pentru analiza intervalului legat, cum ar fi întrebarea dacă coordonatele se încadrează între -2 și +2.calculele pot fi efectuate cu programe software standard care acceptă funcțiile statistice necesare, cum ar fi cele găsite în MS Excel.

valorile T și gradele de libertate

testul t produce două valori ca ieșire: valoarea t și gradele de libertate., Valoarea t este un raport între diferența dintre media celor două seturi de eșantioane și variația care există în cadrul seturilor de eșantioane. În timp ce valoarea numărătorului (diferența dintre media celor două seturi de eșantioane) este simplu de calculat, numitorul (variația care există în seturile de eșantioane) poate deveni un pic complicat în funcție de tipul de valori de date implicate. Numitorul raportului este o măsurare a dispersiei sau a variabilității. Valorile mai mari ale valorii t, numite și Scorul t, indică faptul că există o diferență mare între cele două seturi de eșantioane., Cu cât valoarea t este mai mică, cu atât există mai multă asemănare între cele două seturi de eșantioane.

  • un scor mare t indică faptul că grupurile sunt diferite.
  • un mic scor t indică faptul că grupurile sunt similare.gradele de libertate se referă la valorile dintr-un studiu care are libertatea de a varia și sunt esențiale pentru evaluarea importanței și validității ipotezei nule. Calculul acestor valori depinde, de obicei, de numărul de înregistrări de date disponibile în setul de eșantioane.,

    testul T corelat (sau asociat)

    testul t corelat se efectuează atunci când eșantioanele constau de obicei din perechi potrivite de unități similare sau când există cazuri de măsuri repetate. De exemplu, pot exista cazuri în care aceiași pacienți sunt testați în mod repetat—înainte și după ce au primit un anumit tratament. În astfel de cazuri, fiecare pacient este utilizat ca probă de control împotriva lor.,această metodă se aplică, de asemenea, cazurilor în care eșantioanele sunt legate într-o anumită manieră sau au caracteristici de potrivire, cum ar fi o analiză comparativă care implică copii, părinți sau frați. Testele t corelate sau asociate sunt de tip dependent, deoarece acestea implică cazuri în care cele două seturi de probe sunt legate.

    formula pentru calcularea valorii t și a gradelor de libertate pentru un test t asociat este:

    celelalte două tipuri aparțin testelor t independente., Eșantioanele acestor tipuri sunt selectate independent unul de celălalt—adică seturile de date din cele două grupuri nu se referă la aceleași valori. Acestea includ cazuri ca un grup de 100 de pacienți fiind împărțit în două seturi de 50 de pacienți fiecare. Unul dintre grupuri devine grupul de control și i se administrează un placebo, în timp ce celălalt grup primește tratamentul prescris. Aceasta constituie două grupuri de eșantioane independente care nu sunt asociate între ele.,

    varianța egală (sau cumulată) t-Test

    varianța egală t-test este utilizat atunci când numărul de eșantioane din fiecare grup este același sau varianța celor două seturi de date este similară. Următoarea formulă este utilizată pentru calcularea valorii t și a gradelor de libertate pentru varianța egală t-test:

    și,

    varianța inegală T-Test

    varianța inegală t-test este utilizată atunci când numărul de probe din fiecare grup este diferit, iar variația celor două seturi de date este, de asemenea, diferită. Acest test este, de asemenea, numit Welch ‘ s T-test., Următoarea formulă este utilizată pentru calcularea valorii t și a gradelor de libertate pentru o variație inegală a testului t:

    și

    determinarea testului t corect de utilizat

    următoarea diagramă poate fi utilizată pentru a determina care test t trebuie utilizat pe baza caracteristicilor seturilor de eșantioane. Elementele cheie care trebuie luate în considerare includ dacă înregistrările eșantionului sunt similare, numărul de înregistrări de date din fiecare set de eșantioane și variația fiecărui set de eșantioane.,

    Imagine de Julie Bang © Investopedia 2019

    Inegale de Variație T-Test Exemplu

    Să presupunem că luăm o diagonală de tablouri primite într-o galerie de artă. Un grup de eșantioane include 10 picturi, în timp ce celălalt include 20 de picturi., The data sets, with the corresponding mean and variance values, are as follows:

    Set 1 Set 2
    19.7 28.3
    20.4 26.7
    19.6 20.1
    17.8 23.3
    18.5 25.2
    18.9 22.1
    18.3 17.,7
    18.9 27.6
    19.5 20.6
    21.95 13.7
    23.2
    17.5
    20.6
    18
    23.9
    21.6
    24.3
    20.4
    23.,9
    13.3
    Înseamnă 19.4 21.6
    Varianța 1.4 17.1

    Deși medie Set 2 este mai mare decât 1, nu se poate concluziona că populația corespunzătoare pentru Set 2 are o mai mare înseamnă decât populația corespunzătoare pentru a Seta 1. Diferența de la 19, 4 la 21, 6 se datorează doar întâmplării sau există diferențe cu adevărat în populațiile generale ale tuturor picturilor primite în galeria de artă?, Stabilim problema presupunând ipoteza nulă că media este aceeași între cele două seturi de eșantioane și efectuăm un test t pentru a testa dacă ipoteza este plauzibilă.deoarece numărul de înregistrări de date este diferit (n1 = 10 și n2 = 20) și varianța este de asemenea diferită, valoarea t și gradele de libertate sunt calculate pentru setul de date de mai sus folosind formula menționată în secțiunea inegală de variație T-Test.

    valoarea t este -2.24787. Deoarece semnul minus poate fi ignorat atunci când se compară cele două valori t, valoarea calculată este 2.24787.,valoarea gradelor de libertate este 24.38 și este redusă la 24, datorită definiției formulei care necesită rotunjirea valorii la cea mai mică valoare întreagă posibilă.se poate specifica un nivel de probabilitate (nivel alfa, nivel de semnificație, p) ca criteriu de acceptare. În cele mai multe cazuri, se poate presupune o valoare de 5%.folosind valoarea gradului de libertate ca 24 și un nivel de semnificație de 5%, o privire la tabelul de distribuție a valorii t dă o valoare de 2.064. Comparând această valoare cu valoarea calculată a 2.,247 indică faptul că valoarea t calculată este mai mare decât valoarea tabelului la un nivel de semnificație de 5%. Prin urmare, este sigur să respingem ipoteza nulă că nu există nicio diferență între mijloace. Setul de populație are diferențe intrinseci și nu sunt întâmplătoare.,

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *