Shingoの数学ノート

プログラミングと機械学習のメモ

線形回帰分析のt値がt分布に従う理由(証明)

はじめに

今回は、あまり見かけることのない線形回帰分析におけるt値がt分布に従うことを証明していきます。

t値と仮説検定については、仮説検定のブログを参照してください

なお、この証明を行うのに線形代数や統計学の知識は必須ですので、わからない方は適宜調べながら追っていってもらえればと思います。

t分布について

まず、t分布のおさらいです。自由度をnnのt分布はzzを標準正規分布、vvを自由度nnのカイ2乗分布に従うとき、以下のように表されます。

t=zv/nt=\frac{z}{\sqrt{v/n}}

t値について

線形回帰分析の式は以下です。

yi=β0+β1xi1++βkxik+uiy_i=\beta_0+\beta_1x_{i1}+\cdots+\beta_kx_{ik}+u_i

ただし、uiN(0,σ2)u_i \sim N(0,\sigma^2)で独立同分布(i.i.d)です。

行列表記にすると、以下になります。

y=Xβ+u\mathbf y=\mathbf X\mathbf \beta+\mathbf u

また、y\mathbf yの予測値y^\mathbf{\hat{y}}を以下で定義します。

y^=Xβ^\mathbf{\hat{y}} = \mathbf X \mathbf{\hat{\beta}}

ただし、β^\mathbf{\hat{\beta}}は現在のデータから計算したパラメータです。

残差e\mathbf eを次のように定義します。

e=yy^\mathbf e = \mathbf y-\mathbf{\hat{y}}

回帰分析のt値は以下で表されます。

t=β^jsjt=\frac{\hat{\beta}_j}{s_{j}}

ただし、sj=s2qjjs_j=s^2q^{jj}s2=eenk=j=1kej2nks^2=\frac{\mathbf e'\mathbf e}{n-k}=\frac{\sum_{j=1}^{k}e_j^2}{n-k}qjjq^{jj}(XX)1(X'X)^{-1}(j,j)(j,j)要素とします。

ちなみに、sj2s_j^2Var(β^j)Var(\hat\beta_j)の不偏分散になります。sjs_jは標本誤差とも呼ばれます。

このt値が自由度(nk)(n-k)のt分布に従うことを証明していきたいと思います。

証明の方針

z=βj^σqjjz=\frac{\hat{\beta_j}}{\sigma \sqrt{q^{jj}}}v=(nk)s2σ2v=\frac{(n-k)s^2}{\sigma^2}としたとき、t値はt=zv/(nk)t=\frac{z}{\sqrt{v/(n-k)}}と表すことができます。

zzが標準正規分布であること、vvが自由度(nk)(n-k)のカイ二乗分布に従うことが示されればt分布に従うことを証明できるので、これを目標とします。

かなり長いので、証明のアウトラインを載せます。

  1. zzが標準正規分布に従うこと
  2. あるべき等対称行列M\mathbf Mを用いて、e=Mu\mathbf e=\mathbf M\mathbf uと表される。ただし、べき等対称行列とはM=M=M2\mathbf M=\mathbf M'=\mathbf M^2を満たすM\mathbf Mである。
  3. ee=uMu\mathbf e'\mathbf e=\mathbf u'\mathbf M\mathbf u
  4. PMP=In,nk\mathbf P'\mathbf M\mathbf P=I_{n,n-k}となる直交行列P\mathbf Pが存在すること(ただしIn,nkI_{n,n-k}とは、(nk)(n-k)個の対角成分が1、それ以外が0のn×nn \times n行列とする。)
  5. uMuσ2χ2(nk)\frac{\mathbf u'\mathbf M\mathbf u}{\sigma^2} \sim \chi^2(n-k)
  6. (nk)s2σ2χ2(nk)\frac{(n-k)s^2}{\sigma^2}\sim\chi^2(n-k)

1と6から、zzが標準正規分布であること、vvが自由度(nk)(n-k)のカイ二乗分布に従うことが証明され、t値がt分布に従うことが証明されます。

1. zzが標準正規分布に従うこと

β^jN(βj,σ2qjj)\hat\beta_j\sim N(\beta_j,\sigma^2 q^{jj})を示せばzzが標準正規分布に従うことが示せるので、これを示します。

以前のブログから、β^=(XX)1Xy\hat\beta=(\mathbf X'\mathbf X)^{-1}\mathbf X'\mathbf yであることを示したので、これを使います。

β^=(XX)1Xy=(XX)1X(Xβ+u)=β+(XX)1Xu\mathbf{\hat\beta}=(\mathbf X'\mathbf X)^{-1}\mathbf X'\mathbf y=(\mathbf X'\mathbf X)^{-1}\mathbf X'(\mathbf X\mathbf{\beta}+\mathbf u)=\mathbf{\beta}+(\mathbf X’\mathbf X)^{-1}\mathbf X'\mathbf u

uiN(0,σ2)u_i \sim N(0,\sigma^2)ですので、正規分布の再生性からβ^\mathbf{\hat\beta}は多変量正規分布に従い、E[β^]=βE[\mathbf{\hat\beta}]=\mathbf{\beta}となります。

また、分散については、以下のように計算できます。

(数式省略)

qjjq^{jj}(XX)1(\mathbf X'\mathbf X)^{-1}(j,j)(j,j)要素であるので、Var(β^)=σ2qjjVar(\mathbf{\hat\beta})=\sigma^2q^{jj}となり、β^jN(βj,σ2qjj)\hat\beta_j\sim N(\beta_j,\sigma^2 q^{jj})が示されます。

2. あるべき等対称行列M\mathbf Mを用いて、e=Mu\mathbf e=\mathbf M\mathbf uと表される。

(数式省略)

ただし、M=InX(XX)1X\mathbf M=\mathbf I_n-\mathbf X(\mathbf X'\mathbf X)^{-1}\mathbf X'とします。

これは、計算するとM=M\mathbf M=\mathbf M'M2=M\mathbf M^2=\mathbf Mを示すことができ、べき等行列です。

さらに、MX=0\mathbf M\mathbf X=0を満たすので、以下の式が成り立ちます。

e=My=M(Xβ+u)=Mu\mathbf e=\mathbf M\mathbf y=\mathbf M(\mathbf X\mathbf{\beta}+\mathbf u)=\mathbf M\mathbf u

3. ee=uMu\mathbf e'\mathbf e=\mathbf u'\mathbf M\mathbf u

上記から、以下の式が成り立ちます。

ee=(Mu)(Mu)=uM2u=uMu\mathbf e'\mathbf e=(\mathbf M\mathbf u)'(\mathbf M\mathbf u)=\mathbf u'\mathbf M^2\mathbf u=\mathbf u'\mathbf M\mathbf u

4. PMP=In,nk\mathbf P'\mathbf M\mathbf P=\mathbf I_{n,n-k}となる直交行列P\mathbf Pが存在すること

M\mathbf Mは対称行列より対角化可能です。すなわち、PMP=diag(λ1,λ2,,λn)\mathbf P'\mathbf M\mathbf P=diag(\lambda_1,\lambda_2,\cdots,\lambda_n)となる直交行列P\mathbf Pが存在します。

また、Mpi=λipi\mathbf M\mathbf p_i=\lambda_i\mathbf p_iとなるλi\lambda_iは、M2=M\mathbf M^2=\mathbf Mからλi2=λi\lambda_i^2=\lambda_iを満たします。すなわち、λi\lambda_iは0または1です。

また、1の個数をrrとおくと、PMP=In,r\mathbf P'\mathbf M\mathbf P=\mathbf I_{n,r}であり、

(数式省略)

となります。したがって、PMP=In,nk\mathbf P'\mathbf M\mathbf P=\mathbf I_{n,n-k}となる直交行列P\mathbf Pが存在します。

5. uMuσ2χ2(nk)\frac{\mathbf u'\mathbf M\mathbf u}{\sigma^2} \sim \chi^2(n-k)

上記のP\mathbf Pを用いて、z=1σPu\mathbf z=\frac{1}{\sigma}\mathbf P'\mathbf uとなるz\mathbf zを定義します。

uiN(0,σ)u_i\sim N(0,\sigma)かつi.i.dからziz_iは正規分布に従い、平均は0です。

さらに、Var(z)=1σ2Var(Pu)=1σ2P(σ2In)P=InVar(\mathbf z)=\frac{1}{\sigma^2}Var(\mathbf P'\mathbf u)=\frac{1}{\sigma^2}\mathbf P'(\sigma^2\mathbf I_n)P=\mathbf I_n(P\mathbf Pは直交行列より)となるので、ziN(0,1)z_i\sim N(0,1)かつi.i.dです。

したがって、u=σPz\mathbf u=\sigma \mathbf P\mathbf z より以下が成り立ちます。

1σ2uMu=(Pz)M(Pz)=zPMPz=zIn,nkz=i=1nkzi2\frac{1}{\sigma^2}\mathbf u'\mathbf M\mathbf u=(\mathbf P\mathbf z)'\mathbf M(\mathbf P\mathbf z)=\mathbf z'\mathbf P'\mathbf M\mathbf P\mathbf z=\mathbf z'\mathbf I_{n,n-k}\mathbf z=\sum_{i=1}^{n-k}z_i^2

i.i.dの標準正規分布の二乗和はカイ二乗分布に従い、和の個数が自由度となるため、1σ2uMuχ2(nk)\frac{1}{\sigma^2}\mathbf u'\mathbf M\mathbf u\sim \chi^2(n-k)が証明されました。

6. (nk)s2σ2χ2(nk)\frac{(n-k)s^2}{\sigma^2}\sim\chi^2(n-k)

s2=eenks^2=\frac{\mathbf e'\mathbf e}{n-k}」と、証明3、5から示すことができます。

以上で証明が終了となります。

文献は以下を参考にしていますので、より詳しく知りたい方は是非読んでみてください。

参考文献

  1. 蓑谷 千凰彦 著. 線形回帰分析(2015). 朝倉書店

Comments

Loading comments...