はじめに
今回は、あまり見かけることのない線形回帰分析におけるt値がt分布に従うことを証明していきます。
t値と仮説検定については、仮説検定のブログを参照してください
なお、この証明を行うのに線形代数や統計学の知識は必須ですので、わからない方は適宜調べながら追っていってもらえればと思います。
t分布について
まず、t分布のおさらいです。自由度をnのt分布はzを標準正規分布、vを自由度nのカイ2乗分布に従うとき、以下のように表されます。
t=v/nz
t値について
線形回帰分析の式は以下です。
yi=β0+β1xi1+⋯+βkxik+ui
ただし、ui∼N(0,σ2)で独立同分布(i.i.d)です。
行列表記にすると、以下になります。
y=Xβ+u
また、yの予測値y^を以下で定義します。
y^=Xβ^
ただし、β^は現在のデータから計算したパラメータです。
残差eを次のように定義します。
e=y−y^
回帰分析のt値は以下で表されます。
t=sjβ^j
ただし、sj=s2qjj、 s2=n−ke′e=n−k∑j=1kej2、 qjjは(X′X)−1の(j,j)要素とします。
ちなみに、sj2はVar(β^j)の不偏分散になります。sjは標本誤差とも呼ばれます。
このt値が自由度(n−k)のt分布に従うことを証明していきたいと思います。
証明の方針
z=σqjjβj^、v=σ2(n−k)s2としたとき、t値はt=v/(n−k)zと表すことができます。
zが標準正規分布であること、vが自由度(n−k)のカイ二乗分布に従うことが示されればt分布に従うことを証明できるので、これを目標とします。
かなり長いので、証明のアウトラインを載せます。
- zが標準正規分布に従うこと
- あるべき等対称行列Mを用いて、e=Muと表される。ただし、べき等対称行列とはM=M′=M2を満たすMである。
- e′e=u′Mu
- P′MP=In,n−kとなる直交行列Pが存在すること(ただしIn,n−kとは、(n−k)個の対角成分が1、それ以外が0のn×n行列とする。)
- σ2u′Mu∼χ2(n−k)
- σ2(n−k)s2∼χ2(n−k)
1と6から、zが標準正規分布であること、vが自由度(n−k)のカイ二乗分布に従うことが証明され、t値がt分布に従うことが証明されます。
1. zが標準正規分布に従うこと
β^j∼N(βj,σ2qjj)を示せばzが標準正規分布に従うことが示せるので、これを示します。
以前のブログから、β^=(X′X)−1X′yであることを示したので、これを使います。
β^=(X′X)−1X′y=(X′X)−1X′(Xβ+u)=β+(X’X)−1X′u
ui∼N(0,σ2)ですので、正規分布の再生性からβ^は多変量正規分布に従い、E[β^]=βとなります。
また、分散については、以下のように計算できます。
(数式省略)
qjjは(X′X)−1の(j,j)要素であるので、Var(β^)=σ2qjjとなり、β^j∼N(βj,σ2qjj)が示されます。
2. あるべき等対称行列Mを用いて、e=Muと表される。
(数式省略)
ただし、M=In−X(X′X)−1X′とします。
これは、計算するとM=M′、M2=Mを示すことができ、べき等行列です。
さらに、MX=0を満たすので、以下の式が成り立ちます。
e=My=M(Xβ+u)=Mu
3. e′e=u′Mu
上記から、以下の式が成り立ちます。
e′e=(Mu)′(Mu)=u′M2u=u′Mu
4. P′MP=In,n−kとなる直交行列Pが存在すること
Mは対称行列より対角化可能です。すなわち、P′MP=diag(λ1,λ2,⋯,λn)となる直交行列Pが存在します。
また、Mpi=λipiとなるλiは、M2=Mからλi2=λiを満たします。すなわち、λiは0または1です。
また、1の個数をrとおくと、P′MP=In,rであり、
(数式省略)
となります。したがって、P′MP=In,n−kとなる直交行列Pが存在します。
5. σ2u′Mu∼χ2(n−k)
上記のPを用いて、z=σ1P′uとなるzを定義します。
ui∼N(0,σ)かつi.i.dからziは正規分布に従い、平均は0です。
さらに、Var(z)=σ21Var(P′u)=σ21P′(σ2In)P=In(Pは直交行列より)となるので、zi∼N(0,1)かつi.i.dです。
したがって、u=σPz より以下が成り立ちます。
σ21u′Mu=(Pz)′M(Pz)=z′P′MPz=z′In,n−kz=∑i=1n−kzi2
i.i.dの標準正規分布の二乗和はカイ二乗分布に従い、和の個数が自由度となるため、σ21u′Mu∼χ2(n−k)が証明されました。
6. σ2(n−k)s2∼χ2(n−k)
「s2=n−ke′e」と、証明3、5から示すことができます。
以上で証明が終了となります。
文献は以下を参考にしていますので、より詳しく知りたい方は是非読んでみてください。
参考文献
- 蓑谷 千凰彦 著. 線形回帰分析(2015). 朝倉書店