T分布

曖昧さ回避 t検定」をご覧ください。
スチューデントのt分布
確率密度関数
累積分布関数
母数 ν > 0 {\displaystyle \nu >0} 自由度
( , + ) {\displaystyle (-\infty ,+\infty )}
確率密度関数 Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) ( ν + 1 2 ) {\displaystyle {\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-({\frac {\nu +1}{2}})}}
累積分布関数 1 2 + t Γ ( ν + 1 2 ) 2 F 1 ( 1 2 , ν + 1 2 ; 3 2 ; t 2 ν ) π ν Γ ( ν 2 ) {\displaystyle {\begin{matrix}{\frac {1}{2}}+t\Gamma \left({\frac {\nu +1}{2}}\right)\cdot \\[0.5em]{\frac {{}_{2}\!F_{1}\left({\frac {1}{2}},{\frac {\nu +1}{2}};{\frac {3}{2}};-{\frac {t^{2}}{\nu }}\right)}{{\sqrt {\pi \nu }}\,\Gamma ({\frac {\nu }{2}})}}\end{matrix}}}
ここで、2F1超幾何関数
期待値 0 {\displaystyle 0} (ただし ν > 1 {\displaystyle \nu >1}
中央値 0 {\displaystyle 0}
最頻値 0 {\displaystyle 0}
分散

ν > 2 {\displaystyle \nu >2} の場合、 ν ν 2 {\displaystyle {\frac {\nu }{\nu -2}}}

1 < ν 2 {\displaystyle 1<\nu \leq 2} の場合、 {\displaystyle \infty } (無限大)
歪度 0 {\displaystyle 0} (ただし ν > 3 {\displaystyle \nu >3} の場合)
尖度 6 ν 4 {\displaystyle {\frac {6}{\nu -4}}} (ただし ν > 4 {\displaystyle \nu >4} の場合)
エントロピー

ν + 1 2 [ ψ ( 1 + ν 2 ) ψ ( ν 2 ) ] + log [ ν B ( ν 2 , 1 2 ) ] {\displaystyle {\begin{matrix}{\frac {\nu +1}{2}}\left[\psi ({\frac {1+\nu }{2}})-\psi ({\frac {\nu }{2}})\right]\\[0.5em]+\log \left[{\sqrt {\nu }}B({\frac {\nu }{2}},{\frac {1}{2}})\right]\end{matrix}}}

モーメント母関数 なし
特性関数

K ν / 2 ( ν | t | ) ( ν | t | ) ν / 2 Γ ( ν / 2 ) 2 ν / 2 1 {\displaystyle {\frac {K_{\nu /2}({\sqrt {\nu }}|t|)({\sqrt {\nu }}|t|)^{\nu /2}}{\Gamma (\nu /2)2^{\nu /2-1}}}}

  • ただし、 ν > 0 {\displaystyle \nu >0} の場合。
  • K ν ( x ) {\displaystyle K_{\nu }(x)} ベッセル関数[1]
テンプレートを表示

統計学および確率論において、t分布(ティーぶんぷ、またはスチューデントのt分布: Student's t-distribution)は、連続確率分布の一つであり、正規分布する母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される。また、2つの平均値の差の統計的有意性を検討するt検定で利用される。t分布は、一般化双曲型分布の特別なケースである。

t分布は1908年にウィリアム・シーリー・ゴセットにより発表された。当時の彼はビール醸造会社であるギネスに雇用されており、ギネスでは秘密保持のため従業員による科学論文の公表を禁止していたので、彼はこの問題を回避するため「スチューデント」というペンネームを使用して論文を発表した[2]

その後、ロナルド・フィッシャーがこの論文の重要性を見抜きスチューデントのt分布と呼んだため、このように呼ばれるようになった。

導出

X1, …, Xn平均 μ、分散 σ2正規分布に従う独立な確率変数とする。また標本平均を

X ¯ = X 1 + + X n n {\displaystyle {\overline {X}}={\frac {X_{1}+\cdots +X_{n}}{n}}}

とし、不偏分散を

S 2 = 1 n 1 i = 1 n ( X i X ¯ ) 2 {\displaystyle S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}}

とする。ここで次の変数

t = X ¯ μ S / n {\displaystyle t={\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}}

を考えると、これは

f ( t ) = Γ ( ( ν + 1 ) / 2 ) ν π Γ ( ν / 2 ) ( 1 + t 2 / ν ) ( ν + 1 ) / 2 {\displaystyle f(t)={\frac {\Gamma ((\nu +1)/2)}{{\sqrt {\nu \pi \,}}\,\Gamma (\nu /2)}}(1+t^{2}/\nu )^{-(\nu +1)/2}}

(ただし ν = n − 1, Γガンマ関数)という確率密度関数に従うことが、ゴセットによって示された。ここで t の従う分布をt 分布(またはスチューデント分布)と呼ぶ。ν自由度と呼ばれる。この分布は ν によるが、元の正規分布の母標準偏差σ にはよらないという重要な性質を持っている。

この確率密度関数は、元の正規分布の母数であるμおよびσが既知と仮定しているので、厳密には条件付確率密度関数 f ( t μ , σ ) {\displaystyle f(t\mid \mu ,\sigma )} と書くべきものである。μおよびσを確率変数と考え、その確率密度関数を適当に仮定し(例えばテーブル状の一様分布関数)、ベイズの定理を適用することによって、標本平均 X ¯ {\displaystyle {\overline {X}}} および不偏標準偏差 S {\displaystyle S} が既知の場合の条件付確率密度関数 f ( t | X ¯ , S ) {\displaystyle f(t|{\overline {X}},S)} を計算することができる(もう少し正確に言えば、まず条件付確率密度関数 f ( X ¯ , S μ , σ ) {\displaystyle f({\overline {X}},S\mid \mu ,\sigma )} を求め、これにベイズの定理を適用して f ( μ , σ X ¯ , S ) {\displaystyle f(\mu ,\sigma \mid {\overline {X}},S)} を求め、さらにσについて積分して f ( t X ¯ , S ) {\displaystyle f(t\mid {\overline {X}},S)} を求める)。実はこの関数は f ( t μ , σ ) {\displaystyle f(t\mid \mu ,\sigma )} と全く同じ形をしている。つまり、

f ( t X ¯ , S ) = Γ ( ( ν + 1 ) / 2 ) ν π Γ ( ν / 2 ) ( 1 + t 2 / ν ) ( ν + 1 ) / 2 t = X ¯ μ S / n {\displaystyle {\begin{aligned}f(t\mid {\overline {X}},S)&={\frac {\Gamma ((\nu +1)/2)}{{\sqrt {\nu \pi \,}}\,\Gamma (\nu /2)}}(1+t^{2}/\nu )^{-(\nu +1)/2}\\t&={\frac {{\overline {X}}-\mu }{S/{\sqrt {n}}}}\end{aligned}}}

である。これが、t分布が母標準偏差σ にはよらないという性質の反映である。不偏標準偏差 S {\displaystyle S} は既知であるから、tの確率分布から母平均値μの確率分布を求めることができ、これを用いてμの区間推定や、仮説検定を行うことができる。

t分布を用いた母集団の平均値μの区間推定では、t=0について対称な区間で、その区間に亘る確率密度の積分値が95%となる区間(95%信頼区間)を考え、これに対応するμの区間を信頼区間 (CI) とする方法が広く用いられている(99%信頼区間を用いる場合も有る)。

t分布を用いた母集団の平均値μの仮説検定では、tの値が予め定めたα水準の下での信頼区間(95%あるいは99%)に含まれるか否かを判定基準とし、含まれる場合は母集団の平均値がμであるという仮説(帰無仮説)は棄却されず、区間からはみ出す場合は仮説を棄却する。

累積分布関数

累積分布関数は、正則不完全ベータ関数を用いて以下のように表される。

t f ( u ) d u = I x ( ν 2 , ν 2 ) = B ( x ; ν 2 , ν 2 ) B ( ν 2 , ν 2 ) {\displaystyle \int _{-\infty }^{t}f(u)\,du=I_{x}\left({\frac {\nu }{2}},{\frac {\nu }{2}}\right)={\frac {B\left(x;{\frac {\nu }{2}},{\frac {\nu }{2}}\right)}{B\left({\frac {\nu }{2}},{\frac {\nu }{2}}\right)}}}

ただし、

x = t + t 2 + ν 2 t 2 + ν . {\displaystyle x={\frac {t+{\sqrt {t^{2}+\nu }}}{2{\sqrt {t^{2}+\nu }}}}.}

モーメント

t分布のモーメントは以下の式で表される。

  • k が奇数の場合
E ( t k ) = { 0 , 0 < k < ν undefined , 0 < ν k {\displaystyle E(t^{k})={\begin{cases}0,&\quad 0<k<\nu \\{\mbox{undefined}},&\quad 0<\nu \leq k\end{cases}}}
  • k が偶数の場合
E ( t k ) = { Γ ( k + 1 2 ) Γ ( ν k 2 ) ν k / 2 π Γ ( ν 2 ) , 0 < k < ν , 0 < ν k {\displaystyle E(t^{k})={\begin{cases}{\frac {\Gamma ({\frac {k+1}{2}})\Gamma ({\frac {\nu -k}{2}})\nu ^{k/2}}{{\sqrt {\pi }}\Gamma ({\frac {\nu }{2}})}},&\quad 0<k<\nu \\\infty ,&\quad 0<\nu \leq k\end{cases}}}

特別なケース

ν の値により、簡単な形となる。

ν = 1 の場合

コーシー分布と一致する。

累積分布関数:

F ( t ) = 1 2 + 1 π arctan ( t ) . {\displaystyle F(t)={\frac {1}{2}}+{\frac {1}{\pi }}\arctan(t).}

確率密度関数:

f ( t ) = 1 π ( 1 + t 2 ) . {\displaystyle f(t)={\frac {1}{\pi (1+t^{2})}}.}

ν = 2 の場合

累積分布関数:

F ( t ) = 1 2 [ 1 + t 2 + t 2 ] . {\displaystyle F(t)={\frac {1}{2}}\left[1+{\frac {t}{\sqrt {2+t^{2}}}}\right].}

確率密度関数:

f ( t ) = 1 ( 2 + t 2 ) 3 / 2 . {\displaystyle f(t)={\frac {1}{\left(2+t^{2}\right)^{3/2}}}.}

ν → ∞ の場合

自由度 ν(無限大)に近づくにつれ、t分布は正規分布に近づく。

出典

  1. ^ Hurst, Simon, The Characteristic Function of the Student-t Distribution, Financial Mathematics Research Report No. FMRR006-95, Statistics Research Report No. SRR044-95
  2. ^ Walpole, Ronald; Myers, Raymond; Ye, Keying. Probability and Statistics for Engineers and Scientists. Pearson Education, 2002, 7th edition, pg. 237

参考文献

  • 栗原伸一 (2011年7月25日). 入門統計学. オーム社. ISBN 978-4-274-06855-3 

関連項目

離散単変量で
有限台
離散単変量で
無限台
  • ベータ負二項(英語版)
  • ボレル(英語版)
  • コンウェイ–マクスウェル–ポワソン(英語版)
  • 離散位相型(英語版)
  • ドラポルト(英語版)
  • 拡張負二項(英語版)
  • ガウス–クズミン
  • 幾何
  • 対数(英語版)
  • 負の二項
  • 放物フラクタル(英語版)
  • ポワソン
  • スケラム(英語版)
  • ユール–サイモン(英語版)
  • ゼータ(英語版)
連続単変量で
有界区間に台を持つ
  • 逆正弦(英語版)
  • ARGUS(英語版)
  • バルディング–ニコルス(英語版)
  • ベイツ(英語版)
  • ベータ
  • beta rectangular(英語版)
  • アーウィン–ホール(英語版)
  • クマラスワミー(英語版)
  • ロジット-正規(英語版)
  • 非中心ベータ(英語版)
  • raised cosine(英語版)
  • reciprocal(英語版)
  • 三角
  • U-quadratic(英語版)
  • 一様
  • ウィグナー半円
連続単変量で
半無限区間に台を持つ
  • ベニーニ(英語版)
  • ベンクタンダー第一種(英語版)
  • ベンクタンダー第二種(英語版)
  • 第2種ベータ
  • Burr(英語版)
  • カイ二乗
  • カイ(英語版)
  • Dagum(英語版)
  • デービス(英語版)
  • 指数-対数(英語版)
  • アーラン
  • 指数
  • F
  • folded normal(英語版)
  • Flory–Schulz(英語版)
  • フレシェ
  • ガンマ
  • gamma/Gompertz(英語版)
  • 一般逆ガウス(英語版)
  • Gompertz(英語版)
  • half-logistic(英語版)
  • half-normal(英語版)
  • Hotelling's T-squared(英語版)
  • 超アーラン(英語版)
  • 超指数(英語版)
  • hypoexponential(英語版)
  • 逆カイ二乗(英語版)
    • scaled inverse chi-squared(英語版)
  • 逆ガウス
  • 逆ガンマ
  • コルモゴロフ
  • レヴィ
  • 対数コーシー
  • 対数ラプラス(英語版)
  • 対数ロジスティック(英語版)
  • 対数正規
  • ロマックス(英語版)
  • 行列指数(英語版)
  • マクスウェル–ボルツマン
  • マクスウェル–ユットナー(英語版)
  • ミッタク-レフラー(英語版)
  • 仲上(英語版)
  • 非心カイ二乗
  • パレート
  • 位相型(英語版)
  • poly-Weibull(英語版)
  • レイリー
  • relativistic Breit–Wigner(英語版)
  • ライス(英語版)
  • shifted Gompertz(英語版)
  • 切断正規
  • タイプ2ガンベル(英語版)
  • ワイブル
    • 離散ワイブル(英語版)
  • ウィルクスのラムダ(英語版)
連続単変量で
実数直線全体に台を持つ
連続単変量で
タイプの変わる台を持つ
  • 一般極値
  • 一般パレート(英語版)
  • マルチェンコ–パストゥール(英語版)
  • q-指数(英語版)
  • q-ガウス
  • q-ワイブル(英語版)
  • shifted log-logistic(英語版)
  • トゥーキーのラムダ(英語版)
混連続-離散単変量
  • rectified Gaussian(英語版)
多変量 (結合)
【離散】
エウェンズ(英語版)
多項
ディリクレ多項(英語版)
負多項(英語版)
【連続】
ディリクレ
一般ディリクレ(英語版)
多変量正規
多変量安定(英語版)
多変量 t(英語版)
正規逆ガンマ(英語版)
正規ガンマ(英語版)
行列値
逆行列ガンマ(英語版)
逆ウィッシャート(英語版)
行列正規(英語版)
行列 t(英語版)
行列ガンマ(英語版)
正規逆ウィッシャート(英語版)
正規ウィッシャート(英語版)
ウィッシャート
方向
【単変量 (円周) 方向
円周一様(英語版)
単変数フォン・ミーゼス
wrapped 正規(英語版)
wrapped コーシー(英語版)
wrapped 指数(英語版)
wrapped 非対称ラプラス(英語版)
wrapped レヴィ(英語版)
【二変量 (球面)】
ケント(英語版)
【二変量 (トロイダル)】
二変数フォン・ミーゼス(英語版)
【多変量】
フォン・ミーゼス–フィッシャー(英語版)
ビンガム(英語版)
退化特異
  • 円周(英語版)
  • 混合ポワソン(英語版)
  • 楕円(英語版)
  • 指数
  • 自然指数(英語版)
  • 位置尺度(英語版)
  • 最大エントロピー(英語版)
  • 混合(英語版)
  • ピアソン(英語版)
  • トウィーディ(英語版)
  • wrapped(英語版)
サンプリング法(英語版)
  • 一覧記事 一覧(英語版)
  • カテゴリ カテゴリ