ウェルチのt検定

統計学において、ウェルチのt検定(ウェルチのtけんてい、: Welch's t test)は、2標本の位置の検定であり、2つの母集団が等しい平均を持つという仮説を検定するために用いられる。ウェルチ=アスピン検定(Welch-Aspin Test)とも呼ばれる。スチューデントのt検定の改良型であり、非等分散を持つ可能性のある2つの標本に用いることが意図されている[1]。ウェルチのt検定は、ベーレンス=フィッシャー問題の近似解である。

ウェルチのt検定は統計量tを以下の式によって定義する。

t = X ¯ 1 X ¯ 2 s 1 2 N 1 + s 2 2 N 2 {\displaystyle t={{\overline {X}}_{1}-{\overline {X}}_{2} \over {\sqrt {{s_{1}^{2} \over N_{1}}+{s_{2}^{2} \over N_{2}}}}}\,}

X ¯ i {\displaystyle {\overline {X}}_{i}} s i 2 {\displaystyle s_{i}^{2}} N i {\displaystyle N_{i}} はそれぞれ i {\displaystyle i} th標本平均不偏分散サンプルサイズである。スチューデントのt検定とは異なり、分母は推定された合併分散に基づかない。

この推定分散と関連した自由度 ν {\displaystyle \nu } は、ウェルチ-サタスウェイトの式を用いて近似される。

ν ( s 1 2 N 1 + s 2 2 N 2 ) 2 s 1 4 N 1 2 ν 1 + s 2 4 N 2 2 ν 2 = ( s 1 2 N 1 + s 2 2 N 2 ) 2 s 1 4 N 1 2 ( N 1 1 ) + s 2 4 N 2 2 ( N 2 1 ) {\displaystyle \nu \approx {{\left({s_{1}^{2} \over N_{1}}+{s_{2}^{2} \over N_{2}}\right)^{2}} \over {{s_{1}^{4} \over N_{1}^{2}\cdot \nu _{1}}+{s_{2}^{4} \over N_{2}^{2}\cdot \nu _{2}}}}={{\left({s_{1}^{2} \over N_{1}}+{s_{2}^{2} \over N_{2}}\right)^{2}} \over {{s_{1}^{4} \over N_{1}^{2}\cdot \left({N_{1}-1}\right)}+{s_{2}^{4} \over N_{2}^{2}\cdot \left({N_{2}-1}\right)}}}\,}

ここで ν i = N i 1 {\displaystyle \nu _{i}=N_{i}-1} であり、自由度は i {\displaystyle i} th推定分散と関連している。この自由度の式は、Welch (1938)[2] の式(9)に見られる。

統計検定

tおよび ν {\displaystyle \nu } が計算されると、これらの統計量は、「2つの母集団の平均は等しい」(両側検定)という帰無仮説あるいは「母集団の一方の平均がもう一方よりも大きいあるいは等しい」(片側検定)という帰無仮説を検定するためにt分布と共に用いることができる。具体的には、この検定によって得られるp値は、帰無仮説を棄却あるいは採択するための十分な証拠を与える。

出典

  1. ^ Welch, B. L. (1947). “The generalization of "Student's" problem when several different population variances are involved”. Biometrika 34 (1–2): 28–35. doi:10.1093/biomet/34.1-2.28. MR19277. 
  2. ^ Welch, B. L. (1938). “The significance of the difference between two means when the population variances are unequal”. Biometrika 29 (3–4): 350–362. doi:10.1093/biomet/29.3-4.350. http://www.stat.cmu.edu/~fienberg/Statistics36-756/Welch-Biometrika-1937.pdf. 

推薦文献

  • Daniel Borcard, Lecture Note Appendix: t-test with Welch correction, excerpt from Legendre, P. and D. Borcard. Statistical comparison of univariate tests of homogeneity of variances.
  • Sawilowsky, Shlomo S. (2002). “Fermat, Schubert, Einstein, and Behrens–Fisher: The Probable Difference Between Two Means When σ1 ≠ σ2”. Journal of Modern Applied Statistical Methods 1 (2): 461-472. http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=1022&context=coe_tbf. 
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ