T-테스트 란 무엇입니까?
t-test 는 특정 기능에서 관련 될 수있는 두 그룹의 수단간에 유의 한 차이가 있는지 확인하는 데 사용되는 추론 통계 유형입니다. 그 때 주로 사용되는 데이터 설정 같은 데이터 세트로 기록되는 결과에서 동전 던지기로 100 시간,따라 정상적인 배포하고 있을 수 있습니다 알 수 없는 차이를 확인합니다. T-테스트는 모집단에 적용 가능한 가정을 테스트 할 수있는 가설 테스트 도구로 사용됩니다.,
t-테스트에서 보이는 t-통계,t-배포 값,그리고 자유도를 결정하는 통계적 의미를 갖는다. 세 가지 이상의 수단으로 테스트를 수행하려면 분산 분석을 사용해야합니다.
T-테스트
설명하 T-테스트
기본적으로, t-테스트할 수 있습이 우리를 비교하는 평균 값의 두 데이터를 설정하고 확인하면서 왔는지 그들이 동일하다., 위의 예에서,우리가 우리들의 샘플을 학생들에서 클래스 A 과의 또 다른 예에서 학생들을 클래스 B,우리가 기대하지 않을 것이 그들에게 정확히 동일한 의미와 표준 편차가 있다고 가정합니다. 마찬가지로,샘플에서 찍은 위약-공급 제어는 그룹과 그에게서 취 약물 처방 한 그룹이 있어야 약간 다른 것을 의미와 표준 편차가 있다고 가정합니다.
수학적으로,t-테스트 샘플의 각각에서 두 개의 설정과 설정에 문제가 문을 가정하여 널 가설에는 두 가지 방법을 동일합니다., 에 따라 적용 가능한 수식,특정 값이 계산되며 비교 표준에 대한 값,그리고 가정 null 가설 수락 또는 거부했습니다.
경우에는 null 을 가설 수의 자격을 거부를 나타내는 데이터 판독이 강하고 아마 때문에 기회입니다. T-테스트는이 목적을 위해 사용되는 많은 테스트 중 하나 일뿐입니다. 통계학자는 t-test 이외의 테스트를 추가로 사용하여 더 큰 표본 크기로 더 많은 변수와 테스트를 검사해야합니다. 큰 표본 크기의 경우 통계학자는 z-테스트를 사용합니다., 다른 테스트 옵션으로는 chi-square 테스트와 f-테스트가 있습니다.
세 가지 유형의 t-테스트가 있으며 종속 및 독립 t-테스트로 분류됩니다.
키 테이크 아웃
- t-테스트 유형의 추정 통계를 결정하는 데 사용하는 경우 상당한 차이가 있을 사이에 두 개의 그룹이 될 수있는,관련된 특정한 특징입니다.
- t-테스트는 통계에서 가설 테스트의 목적으로 사용되는 많은 테스트 중 하나입니다.
- t-테스트를 계산하려면 세 가지 주요 데이터 값이 필요합니다., 여기에는 각 데이터 세트의 평균값의 차이(평균 차이라고 함),각 그룹의 표준 편차 및 각 그룹의 데이터 값 수가 포함됩니다.
- 필요한 데이터 및 분석 유형에 따라 수행 할 수있는 여러 가지 유형의 t-테스트가 있습니다.
모호한 테스트 결과
을 고려하는 약물 제조업체를 테스트하고 싶어 새롭게 발명 의학입니다. 그것은 한 그룹의 환자에게 약물을 시도하고 대조군이라고 불리는 다른 그룹에 위약을 투여하는 표준 절차를 따릅니다., 위약에게 주어 그룹은 물질의 없이 의도한 치료 가치를 제공 기준으로 측정하는 방법을 다른 그룹을 제공하는 실제적인 마약,응답합니다.
후 약물 시험의 구성원들은 위약-공급 control 그룹 보고에 있는 증가 평균 수명의 세 년 동안 그룹의 구성원들은 누구 규정의 새로운 약 보고서의 증가로서의 평균 수명합니다. 즉각적인 관찰은 결과가 약물을 사용하는 그룹에 더 좋으므로 약물이 실제로 효과가 있음을 나타낼 수 있습니다., 그러나,관찰이 기회 발생,특히 행운의 놀라운 조각 때문일 수도있다. T-테스트는 결과가 실제로 정확하고 전체 인구에 적용 가능한지 결론을 내리는 데 유용합니다.
한 학교에서 a 급 학생 100 명은 표준 편차가 3%인 평균 85%의 점수를 매겼습니다. B 클래스에 속한 또 다른 100 명의 학생들은 평균 87%의 표준 편차로 4%의 점수를 매겼습니다., 는 동안의 평균 클래스 B 보다 더 나은 클래스에,그것은 정확하지 않을 수도 있습하는 결론으로 이동하는 전반적인 성능의에서 학생들을 클래스 B 는 보다 나은 학생들의 등 A. 이 있기 때문에 자연적인 변화에서 테스트에 점수를 모두 클래스를,그래서 차이가 될 수 있는 기회가 혼자입니다. T-테스트는 한 클래스가 다른 클래스보다 더 잘 지내는지 여부를 결정하는 데 도움이 될 수 있습니다.
T-테스트 가정
- t-테스트와 관련하여 만들어진 첫 번째 가정은 측정 규모에 관한 것입니다., 가정을 위해 t-테스트는 그 규모의 측정에 적용되는 수집된 데이터는 다음과 같이 연속 또는 서수,규모와 같은 점수를 위해.
- 두 번째로 가정을 만들은 간단한 무작위 샘플링,데이터는 수집된 대표자에서,무작위로 선택된 부분의 총 인구입니다.
- 세 번째 가정은 데이터를 때,표시,결과를 정상 유통,종 모양의 분포 곡선입니다.
- 최종 가정은 분산의 동질성입니다., 균질 또는 균등 분산은 샘플의 표준 편차가 거의 같을 때 존재합니다.
T-Test 계산
t-test 계산에는 세 가지 주요 데이터 값이 필요합니다. 여기에는 각 데이터 세트의 평균값의 차이(평균 차이라고 함),각 그룹의 표준 편차 및 각 그룹의 데이터 값 수가 포함됩니다.t-테스트의 결과는 t-값을 생성합니다. 그런 다음이 계산 된 t-값은 임계 값 테이블(T-분포 테이블이라고 함)에서 얻은 값과 비교됩니다., 이 비교는 차이에 대한 기회 단독의 영향과 그 차이가 해당 기회 범위를 벗어나는 지 여부를 결정하는 데 도움이됩니다. T-테스트 질문에는지 그룹 사이의 차이를 나타내는 진정한 차이를 연구하거나면 그것은 아마도 의미가 없이 임의 차이입니다.
T-Distribution Tables
T-Distribution Table 은 한 꼬리 및 두 꼬리 형식으로 제공됩니다. 전자는 명확한 방향(양수 또는 음수)으로 고정 된 값 또는 범위를 갖는 경우를 평가하는 데 사용됩니다., 예를 들어,가능성이 무엇인지의 출력 값이 남은 아래 -3,또는 더 이상 할 때 주사위의 쌍? 후자는 좌표가-2 와+2 사이에 떨어지는 지 묻는 것과 같은 범위 바운드 분석에 사용됩니다.
계산을 수행할 수 있 표준 소프트웨어 프로그램을 지원하는 데 필요한 통계 기능,그 MS Excel.
T-값과 자유도
t-테스트 생산하는 두 개의 값으로 출력:t-값과도 자유입니다., T-값은 두 샘플 세트의 평균과 샘플 세트 내에 존재하는 변이의 차이의 비율입니다. 는 분자(값 사이의 차이는 말은 두 가지의 샘플 세트)를 간단하게 계산,분모(변화에 존재하는 샘플 설정)이 될 수 있는 조금 복잡하의 종류에 따라 데이터 값을 포함 된다. 비율의 분모는 분산 또는 가변성의 측정입니다. T-점수라고도하는 t-값의 더 높은 값은 두 샘플 세트간에 큰 차이가 있음을 나타냅니다., T-값이 작을수록 두 샘플 세트간에 더 많은 유사성이 존재합니다.
- 큰 t 점수는 그룹이 다르다는 것을 나타냅니다.
- 작은 t-점수는 그룹이 비슷하다는 것을 나타냅니다.
자유도 값을 말한 연구에서는 자유롭게 변화하고 있는 필수적인 평가를 위해 중요성과의 유효성 null 가설입니다. 이러한 값의 계산은 일반적으로 샘플 세트에서 사용 가능한 데이터 레코드 수에 따라 달라집니다.,
상관(또는 짝)T-테스트
상관 t-테스트 때 수행되는 샘플에 의하여 전형적으로 이루어져 있는 쌍의 유사한 장치,또는 때가 있는 경우의 반복 측정한다. 예를 들어,동일한 환자가 특정 치료를 받기 전과 후에 반복적으로 검사를받는 경우가있을 수 있습니다. 이러한 경우,각 환자는 자신에 대한 대조군 샘플로 사용되고 있습니다.,
이 방법을 적용하는 경우에는 샘플은 관련된 어떤 방식으로 또는에 일치하는 특성을 같은 비교 분석을 포함하는 아이들,부모 또는 형제입니다. 상관 관계가 있거나 쌍을 이루는 t-테스트는 두 세트의 샘플이 관련되어있는 경우를 포함하므로 종속 유형입니다.
에 대한 공식을 컴퓨팅 t-값과 자유도를 위해 paired t-test:
나머지 두 가지 유형에 속하는 독립 t-테스트합니다., 이러한 유형의 샘플은 서로 독립적으로 선택됩니다-즉,두 그룹의 데이터 세트는 동일한 값을 참조하지 않습니다. 그들은 100 명의 환자 그룹이 각각 50 명의 환자 두 세트로 나뉘는 것과 같은 경우를 포함합니다. 그룹 중 하나가 대조군이되어 위약을 투여받는 반면 다른 그룹은 처방 된 치료를받습니다. 이것은 서로 짝이없는 두 개의 독립적 인 샘플 그룹을 구성합니다.,
동일한 분산(또는 풀링)T-테스트
동등한 차 t-테스트할 때 사용되는 샘플의 수에서 각 그룹은 동일한 또는 분산의 두 데이터 집합은 비슷합니다. 다음과 같은 공식을 계산하는 데 사용되는 t-값과 자유도를 위한 동일한 분산 t-테스트:
불평등 분 T-테스트
불평등 분 t-테스트할 때 사용되는 샘플의 수에서 각 그룹은,다른 의 분산 데이터는 두 개의 설정도 다릅니다. 이 테스트는 웰치의 t-테스트라고도합니다., 다음과 같은 공식을 계산하는 데 사용되는 t-값과 자유도를 위해 불평등 분 t-테스트:
고,
결정이 올바른 T-테스트 사용하기
다음과 같은 순서도를 결정하는 데 사용할 수 있는 t-테스트 사용해야의 특성에 따라 견본 세트입니다. 고려해야 할 주요 항목에는 샘플 레코드가 유사한지 여부,각 샘플 세트의 데이터 레코드 수 및 각 샘플 세트의 분산이 포함됩니다.,
불평등 분 T-테스트 Example
가정을 우리는 대각선으로 측정 그림을 받에서는 아트 갤러리도 있습니다. 한 그룹의 샘플에는 10 개의 그림이 포함되고 다른 그룹에는 20 개의 그림이 포함됩니다., The data sets, with the corresponding mean and variance values, are as follows:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.,7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.,9 | ||
13.3 | ||
의미 | 19.4 | 21.6 |
차 | 1.4 | 17.1 |
지만 의미의 2 를 설정은 보다 높은 설정 1,우리는 수 없는 결론 지구에 해당하는 설정 2 가 더 높은 의미보다 인구에 해당하는 설정 1. 은 차이에서 19.4 21.6 때문에 기회가 혼자,또는 차이점이 정말 존재하에서 전체 인구의 모든 그림에서 받은 아트 갤러리?, 우리가정의 문제로 가정하면 null 이 가설을 의미가 동일한 두 견본 세트를 진행 t-검정을 테스트하는 경우에는 가설은 그럴듯하다.
의 수 있기 때문에 데이터 기록은 다른(n1=10n2=20)및 분산도 다르,t-값과 자유도는 계산 상기 데이터를 사용하여 설정한 수식에서 언급된 불평등 분 T-테스트 섹션입니다.t-값은 -2.24787 입니다. 두 t-값을 비교할 때 빼기 기호를 무시할 수 있으므로 계산 된 값은 2.24787 입니다.,
자유도 가치가 24.38 및 감소를 24 일 때문에 수식화질 요구림의 가치를 최소한의 정수 값을 사용할 수 있습니다.
수용의 기준으로 확률 수준(알파 수준,유의 수준,p)을 지정할 수 있습니다. 대부분의 경우 5%값을 가정할 수 있습니다.
자유도 값을 24 와 5%유의 수준으로 사용하여 t-값 분포 테이블을 살펴보면 2.064 의 값을 제공합니다. 이 값을 2 의 계산 된 값과 비교합니다.,247 은 계산 된 t-값이 5%의 유의 수준에서 테이블 값보다 크다는 것을 나타냅니다. 따라서 수단간에 차이가 없다는 귀무 가설을 거부하는 것이 안전합니다. 인구 집합에는 본질적인 차이가 있으며 우연히 그렇지 않습니다.,