T検定とは何ですか?
t検定は、二つのグループの平均間に有意な差があるかどうかを判断するために使用される推論統計量の一種であり、特定の特徴に関連してい これは、コインを100回反転した結果として記録されたデータセットのように、データセットが正規分布に従い、未知の分散がある場合に主に使用されます。 T検定は、母集団に適用可能な仮定の検定を可能にする仮説検定ツールとして使用されます。,
t検定は、統計的有意性を決定するために、t統計量、t分布値、および自由度を調べます。 三つ以上の手段でテストを行うには、分散分析を使用する必要があります。
T検定
T検定を説明する
本質的に、t検定は、二つのデータセットの平均値を比較し、それらが同じ母集団から来たかどうか, 上記の例では、クラスAの学生のサンプルとクラスBの学生の別のサンプルを取る場合、平均と標準偏差がまったく同じであるとは思わないでしょ 同様に、プラセボ投与対照群から採取したサンプルと、薬物処方群から採取したサンプルは、わずかに異なる平均および標準偏差を有するべきである。
数学的には、t検定は二つのセットのそれぞれからサンプルを取り、二つの平均が等しいという帰無仮説を仮定することによって問題文を確立, 適用可能な式に基づいて、特定の値が計算され、標準値と比較され、仮定された帰無仮説がそれに応じて受け入れられるか、または拒否されます。
帰無仮説が棄却される資格がある場合、データの読み取りが強く、おそらく偶然によるものではないことを示します。 T検定は、この目的のために使用される多くの検定の一つに過ぎません。 統計学者はさらに、t検定以外の検定を使用して、より多くの変数およびより大きな標本サイズの検定を調べる必要があります。 標本サイズが大きい場合、統計学者はz検定を使用します。, 他のテストの選択はカイ二乗検定およびfテストを含んでいる。
t検定には三つのタイプがあり、それらは依存t検定と独立t検定に分類されます。
キーテイクアウト
- t検定は、特定の特徴に関連する可能性のある二つのグループの平均間に有意な差があるかどうかを判断するために使用される推
- t検定は、統計における仮説検定の目的で使用される多くの検定の一つです。
- t検定を計算するには、三つのキーデータ値が必要です。, それらには、各データセットからの平均値の差(平均差と呼ばれる)、各グループの標準偏差、および各グループのデータ値の数が含まれます。
- 必要な分析のデータとタイプに応じて実行できるt検定には、いくつかの異なるタイプがあります。
あいまいなテスト結果
製薬会社が新しく発明された薬をテストしたいと考えてください。 これは、患者のあるグループで薬物を試し、対照群と呼ばれる別のグループにプラセボを与えるという標準的な手順に従います。, 対照群に与えられたプラセボは、意図された治療価値のない物質であり、実際の薬物を与えられた他の群がどのように反応するかを測定するためのベンチマークとして機能する。
薬物試験後、プラセボ投与対照群のメンバーは平均寿命の増加を報告したが、新薬を処方されているグループのメンバーは平均寿命の増加を報告した。 即刻の観察は結果が薬剤を使用しているグループのためによりよいので薬剤が全く働いていることを示すかもしれませ, しかし、観察は偶然の発生、特に驚くべき運のためである可能性もあります。 T検定は、結果が実際に正しく、母集団全体に適用できるかどうかを結論づけるのに役立ちます。
学校では、クラスAの100人の学生が平均85%、標準偏差は3%でした。 クラスBに属する別の100人の学生は、平均87%の標準偏差で4%を獲得しました。, クラスBの平均はクラスAの平均よりも優れていますが、クラスBの学生の全体的なパフォーマンスはクラスAの学生のそれよりも優れているという結論にジャンプするのは正しくないかもしれません。これは、両方のクラスのテストスコアに自然変動があるためです。その違いはチャンスだけによるものである可能性があります。 T検定は、あるクラスが他のクラスよりも優れているかどうかを判断するのに役立ちます。
T検定の仮定
- t検定に関する最初の仮定は、測定のスケールに関するものです。, T検定の仮定は、収集されたデータに適用される測定スケールが、IQ検定のスコアなどの連続スケールまたは順序尺度に従うというものです。
- なされる第二の仮定は、データが総母集団の代表的な、無作為に選択された部分から収集されることを、単純な無作為標本のことである。
- 第三の仮定は、データであり、プロットされたとき、正規分布、鐘形の分布曲線になります。
- 最後の仮定は分散の均質性です。, サンプルの標準偏差がほぼ等しい場合、均質または等しい分散が存在します。
T検定の計算
t検定の計算には、三つのキーデータ値が必要です。 それらには、各データセットからの平均値の差(平均差と呼ばれる)、各グループの標準偏差、および各グループのデータ値の数が含まれます。
t検定の結果はt値を生成します。 この計算されたt値は、次に、臨界値テーブル(T分布表と呼ばれる)から得られた値と比較される。, この比較は、差に対する偶然のみの影響、および差がその確率範囲外であるかどうかを判断するのに役立ちます。 T検定は、グループ間の差が研究における真の差を表すのか、それとも無意味なランダム差である可能性があるのかを問います。
T分布テーブル
T分布テーブルは、片側形式および両側形式で使用できます。 前者は、明確な方向(正または負)を持つ固定値または範囲を有するケースを評価するために使用される。, たとえば、出力値が-3以下に残っている確率、またはサイコロのペアを転がしたときに七つ以上になる確率はどれくらいですか? 後者は、座標が-2と+2の間にあるかどうかを尋ねるなど、範囲限界分析に使用されます。
計算は、MS Excelのように、必要な統計関数をサポートする標準のソフトウェアプログラムで実行できます。
T値と自由度
t検定は、出力としてt値と自由度の二つの値を生成します。, T値は、二つのサンプルセットの平均とサンプルセット内に存在する変動との差の比です。 分子値(二つのサンプルセットの平均の差)は計算が簡単ですが、分母(サンプルセット内に存在する変動)は、関係するデータ値のタイプに応じて少し複雑 比の分母は、分散または変動性の測定値です。 Tスコアとも呼ばれるt値の値が高いほど、二つのサンプルセットの間に大きな差が存在することを示します。, T値が小さいほど、二つのサンプルセットの間により多くの類似性が存在する。
- 大きなtスコアは、グループが異なっていることを示します。
- 小さなtスコアは、それらのグループが類似していることを示す。
自由度は、変化する自由を持ち、帰無仮説の重要性と妥当性を評価するために不可欠な研究の値を指します。 これらの値の計算は、通常、サンプルセットで使用可能なデータレコードの数に依存します。,
相関(またはペア)T検定
相関t検定は、サンプルが一般的に類似した単位の一致したペアで構成されている場合、または反復測定の 例えば、特定の治療を受ける前および受けた後に、同じ患者が繰り返し検査される例があるかもしれない。 そのような場合には、各患者は、自身に対する対照試料として使用されている。,
この方法は、サンプルが何らかの方法で関連している場合、または子供、親または兄弟を含む比較分析のような一致する特性を有する場合にも 相関または対になったt検定は、二つのサンプルセットが関連している場合を含むため、依存型のものです。
対になったt検定のt値と自由度を計算するための式は次のとおりです。
残りの二つのタイプは独立したt検定に属します。
残りの二つのタイプは独立したt検定に属します。, つまり、二つのグループのデータセットが同じ値を参照しないようにします。 彼らは100人の患者のグループのようなケースがそれぞれ50人の患者の二組に分割されています。 一方の群は対照群になり、プラセボが与えられ、他方の群は所定の治療を受ける。 これは互いに対になっていない二つの独立したサンプル群を構成する。,
等分散T検定
等分散t検定は、各グループのサンプル数が同じであるか、二つのデータセットの分散が類似している場合に使用されます。 等分散t検定に対するt値と自由度の計算には、次の式が使用されます。
および、
不等分散T検定
不等分散t検定は、各グループのサンプル数が異なり、二つのデータセットの分散も異なる場合に使用されます。 この検定はウェルチのt検定とも呼ばれます。, 次の式は、不等分散t検定のt値と自由度を計算するために使用されます。
および、
使用する正しいT検定の決定
次のフローチャートを使用して、サンプルセットの特性に基づいてどのt検定を使用すべきかを決定することができます。 考慮すべき重要な項目には、サンプルレコードが類似しているかどうか、各サンプルセット内のデータレコードの数、および各サンプルセットの分散が含ま,
不等分散T検定の例
受け取った絵画の対角測定を取っていると仮定しますアートギャラリーで。 サンプルの一つのグループには10の絵画が含まれ、他の20の絵画が含まれてい, The data sets, with the corresponding mean and variance values, are as follows:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.,7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.,9 | ||
13.3 | ||
平均 | 19.4 | 21.6 |
分散 | 1.4 | 17.1 |
セット2の平均はセット1の平均よりも高いが、セット2に対応する母集団はセット1に対応する母集団よりも高い平均を有すると結論づけることはできない。 19.4から21.6への違いは偶然だけによるものですか、それともアートギャラリーで受け取ったすべての絵画の全体的な集団に違いが本当に存在してい, 我々は、二つのサンプルセットの間で平均が同じであるという帰無仮説を仮定し、仮説がもっともらしいかどうかを検定するためにt検定を実施することによって問題を確立する。
データレコードの数が異なり(n1=10とn2=20)、分散も異なるため、上記のデータセットのT値と自由度は、不等分散T検定のセクションで述べた式を使用して
t値は-2.24787です。 二つのt値を比較するときにマイナス記号は無視できるので、計算された値は2.24787です。,
自由度の値は24.38であり、値を可能な限り小さい整数値に丸める必要がある式定義のため、24に減少します。
受け入れの基準として、確率のレベル(アルファレベル、有意性のレベル、p)を指定することができます。 ほとんどの場合、5%の値を想定できます。
自由度の値を24とし、有意性の5%のレベルを使用すると、t値分布表を見ると2.064の値が得られます。 この値を計算された値2と比較します。,247は、計算されたt値が有意水準5%で表値より大きいことを示します。 したがって、平均間に差がないという帰無仮説を棄却することは安全です。 集団セットには本質的な違いがあり、偶然ではありません。,
となっています。/div>