第ー章 解答¶
目次
1.2(基本)¶
過学習を防ぐため正則化項を加えた二乗和誤差関数(1.4)を考える。この誤差関数を1.1と同様の方法で表現せよ。

Answer¶
1.1と同様に、誤差関数を最小にするために
で微分すると、誤差が最小となる時、以下が成り立つので、

となる。上記の左辺を書き直すと

関数
に関する情報がないと、これ以上簡単にすることができない。よって、関数
が線形モデルであると仮定する。(問いに 線形方程式系を書き下せ とあるので、線形モデルを仮定しても良いと思う。線形方程式の必要条件が線形モデルであるかどうかは証明していない。)
関数
が 線形モデル であると仮定すると、関数
は以下のように書くことが出来る。

関数
は任意の関数であるとしてよいと思う。(
で
で値を持つくらいはマトモであって欲しい。)すると(1)は以下のように書き直すことが出来る。

ここで、

とし、(4)に代入すると、

となる。
1.3(標準)¶
3個の色分けされた箱r(赤)、b(青)、g(緑)を考える 箱rには3個のりんご、4個のオレンジ、3個のライムが入っており、箱bには1個のりんご、1個のオレンジ、0個のライムが入っており、箱gには3個のりんご、3個のオレンジ、4個のライムが入つている箱を
、
、
という確率でランダムに選び、果物を箱から1個取り出す (箱の中のものは等確率で選ばれるとする)とき、りんごを選び出す確率を求めよ.また、選んだ果物がオレンジであったとき、それが緑の箱から取り出されたものである確率はいくらか?
Answer¶
本文中に赤と青の例が記載されているので、わからない場合は本文を参照すればいい。ここでは、確率の基本法則を用いればよい。

ここからは、箱は大文字で表記し、りんご(r)、オレンジ(o)、ライム(r)とする。
果物を箱から1個取り出すとき、りんごを選び出す確率は以下になる

選んだ果物がオレンジであったとき、それが緑の箱であるときの確率は

1.4(標準)¶
連続変数
上で定義された確率密度
を考える。
により非線形変換を施すと密度は以下の変換を受ける。

上記を微分して,
に関する密度を最大にする位置
と
に関する密度を最大にする位置
とが,ヤコビ因子の影響によリー般には単純な
という関係にないことを示せ これは確率密度の最大値が,(通常の関数と異なり)変数の選択に依存することを示している。線形変換の場合には最大値の位置が変数自身と同じ変換を受けることを確かめよ。
1.7(標準)¶
ガウス分布の規格化されていることを確かめよ。
Answer¶
この問題は、ガウス積分と名前がついているほど非常に有名な問題です。広義積分の例題として学ぶことが多いのではないでしょうか。物理系の人ならば統計力学で復習するはず。
私のために、広義積分の復習も載せておきます。
の半開区間
で定義された実数値函数
が次の 1),2) をみたすものとする。
に対し、有界閉区間
で
は有界で可積分である。
が存在する。
は
で 広義可積分 であるという。また
を
における
の( 広義 ) 積分 という。問題通りに進めると、

その2乗を考えると

ここで直交座標系
から極座標
に変換する
。ヤコビアンは

積分範囲は

よって、
は

よって、
となり、同時に正規分布は規格化されていることが示された。
1.14¶
を成分とする任意の正方行列は
という形に書けることを示せ。ただし、
と
はそれぞれ対称行列と反対称行列の成分であり、
と
が成り立つ。ここで、D次元における高次の多項式の2次の項

を考えると

となり、反対称行列の寄与が消えることを示せ。これを使って、行列
の独立パラメータの数が
で与えらえれることを示せ。
Answer¶
1.15¶
D次元の多項式のM次の項を書きおろすと、

となる。係数
は
個あるが、そのうち独立なパラメータの数は
の多くの置換対称性からそれよりずっと少なくなる。はじめに、M次の項を

と書き直すことによって係数の冗長性を取り除けることを示せ。ただし、
と
の厳密な関係は陽に表す必要はないことに注意せよ。この結果を使って、M次における 独立な パラメータの数
が

という再帰的な関係を満たすことを示せ。

上の2つの結果から、数学的帰納法により、

を示せ。
Answer¶
1.16¶
演習1.15で、M次のD次元多項式の独立なパラメータの数を計算した。まず 

を満たすことを示せ。上記の結果と数学的帰納法より、

を示せ。最後に、
のとき
が
で大きくなること示せ。





を微分すると
の指摘は、
は
は

は
が非線形変換であるから、
よって



のとき、最大値の位置が変数と同じ変換を受けていることが確認できた。![{\rm var}[f] = {\bf E} [ (f(x) - {\bf E}[f(x)])^2 ]](../../_images/math/b3e0c8781846a1c9fc5dae086746ee30de631f1a.png)
![{\rm var}[f] = {\bf E} [ (f(x)^2 ] - {\bf E}[f(x)]^2](../../_images/math/04ad201c14c6addd4d994ac44ed672be7e5a171e.png)
![\begin{eqnarray*}
{\rm var}[f] &=& {\bf E} [ (f(x) - {\bf E}[f(x)])^2 ] \\
&=& {\bf E} [(f(x)^2 - 2f(x){\bf E}[f(x)] + {\bf E}[f(x)]^2] \\
&=& {\bf E} [(f(x)^2] - 2{\bf E}[f(x)]{\bf E}[f(x)] + {\bf E}[f(x)]^2 \\
&=& {\bf E} [(f(x)^2] - {\bf E}[f(x)]^2
\end{eqnarray*}](../../_images/math/c9509a3dd6cfb6eee9ffde6c18b8442102258df0.png)
![\begin{eqnarray*}
cov(x,y) &=& {\bf E}_{x,y}[(x-{\bf E}[x])(y-{\bf E}[y])] \\
&=& {\bf E}_{x,y}[xy-x{\bf E}[y]-y{\bf E}[x]+{\bf E}[x]{\bf E}[y]] \\
&=& {\bf E}_{x,y}[xy]-{\bf E}_{x,y}[x]{\bf E}[y]-{\bf E}_{x,y}[y]{\bf E}[x]+{\bf E}[x]{\bf E}[y] \\
&=& {\bf E}_x[x]{\bf E}_y[y]-{\bf E}_x[x]{\bf E}[y]-{\bf E}_y[y]{\bf E}[x]+{\bf E}[x]{\bf E}[y] = 0
\end{eqnarray*}](../../_images/math/939a67f5e76fc8615d84d2803590a45000bb1bce.png)

![{\bf E}[x] = \int^{\infty}_{-\infty} N(x|\mu,\sigma^2) x dx = \mu](../../_images/math/a05ad878b42a3322f04290df18c344b85204042d.png)
に関して微分して![{\bf E}[x^2] = \int^{\infty}_{-\infty} N(x|\mu,\sigma^2) x^2 dx = \mu^2 + \sigma^2](../../_images/math/e5f36db82ffdce670ce82b340e1be817dc2b6f7c.png)
![var[x] = {\bf E} [x^2]-{\bf E} [x]^2 = \sigma^2](../../_images/math/c8e7dcc721cd705aa0fcbd210c36db23e9874a90.png)
![\begin{eqnarray*}
{\bf E}[x] &=& \int^{\infty}_{-\infty} N(x|\mu,\sigma^2) x dx \\
&=& \int^{\infty}_{-\infty} \frac{1}{(2\pi\sigma^2)^{1/2}}exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2\right\}x dx \\
&=& \frac{\sigma^2}{(2\pi\sigma^2)^{1/2}} \int^{\infty}_{-\infty} \left\{ exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2\right\} \right\}' dx + \frac{\mu}{(2\pi\sigma^2)^{1/2}} \int^{\infty}_{-\infty} exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2 \right\} dx \\
&=& 0 + \frac{\mu}{(2\pi\sigma^2)^{1/2}} (2\pi\sigma^2)^{1/2} = \mu
\end{eqnarray*}](../../_images/math/add4bc97793e28e98e36aaefcc99d0b248b061b2.png)
![\begin{eqnarray*}
{\bf E}[x] &=& \int^{\infty}_{-\infty} N(x|\mu,\sigma^2) x^2 dx \\
&=& \int^{\infty}_{-\infty} x \cdot x\frac{x}{(2\pi\sigma^2)^{1/2}}exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2\right\} dx \\
&=& \int^{\infty}_{-\infty} (u-\mu)^2 x\frac{1}{(2\pi\sigma^2)^{1/2}}exp\left\{ -\frac{1}{2\sigma^2}(x-\mu)^2\right\} dx \\
&=& 0 + \frac{\mu}{(2\pi\sigma^2)^{1/2}} (2\pi\sigma^2)^{1/2} = \mu
\end{eqnarray*}](../../_images/math/dfc54fd255e2156b945608fe4b5259f2d02690d6.png)
で与えられることを示せ。同様に、多変量ガウス分布のモードが
であることを示せ。
が統計的に独立であるとすると、以下が成り立つことを示せ。![\begin{eqnarray}
{\bf E}[x+z] = {\bf E}[x] + {\bf E}[z] \\
var[x+z] = var[x] + var[z]
\end{eqnarray}](../../_images/math/00c8ba5648000080dcc6ac759dc9590e856b70f9.png)
![\begin{eqnarray*}
{\bf E}[x+z] &=& \int^{\infty}_{-\infty} \int^{\infty}_{-\infty} p(x, z)(x+z) dxdz \\
&=& \int^{\infty}_{-\infty} \int^{\infty}_{-\infty} p(x)p(z)(x+z) dxdz \\
&=& \int^{\infty}_{-\infty} p(x)xdx + \int^{\infty}_{-\infty} p(z)z dz \\
&=& {\bf E}[x] + {\bf E}[z]
\end{eqnarray*}](../../_images/math/ece3d7fd75ec89d75d56b6277213554350ffe7eb.png)
![\begin{eqnarray*}
var[x+z] &=& {\bf E}[(x+z)^2] + {\bf E}[x+z]^2 \\
&=& {\bf E}[x^2 + 2xz + z^2] + ({\bf E}[x] + {\bf E}[z])^2 \\
&=& {\bf E}[x^2] + {\bf E}[2xz] + {\bf E}[z^2] - ( {\bf E}[x]^2 + 2{\bf E}[x]{\bf E}[z] + {\bf E}[z]^2) \\
&=& {\bf E}[x^2] + 2{\bf E}[x]{\bf E}[z] + {\bf E}[z^2] - ( {\bf E}[x]^2 + 2{\bf E}[x]{\bf E}[z] + {\bf E}[z]^2) \\
&=& {\bf E}[x^2] -{\bf E}[x]^2 + {\bf E}[z^2] - {\bf E}[z]^2 \\
&=& var[x] + var[z]
\end{eqnarray*}](../../_images/math/6ea2dfc2cc5c24cc36d8f77ec65be29424841ff2.png)


![\begin{eqnarray*}
\mathbb{E}[x] &=& \int^{\infty}_{-\infty} \mathcal{N}(x | \mu , \sigma^2) x \mathrm{d}x = \mu \\
\mathbb{E}[x^2] &=& \int^{\infty}_{-\infty} \mathcal{N}(x | \mu , \sigma^2) x^2 \mathrm{d}x = \mu^2 + \sigma^2
\end{eqnarray*}](../../_images/math/f6b0c3ab8474d61b9f2162cd938596c8ae81b580.png)
![\begin{eqnarray*}
\mathbb{E}[x_nx_m] &=& \mu^2 + I_{nm}\sigma^2
\end{eqnarray*}](../../_images/math/be81b749d76a81f5d235844a9465b824b9beb581.png)
は平均
は
のとき
でそれ以外は
であるとする。これから以下を証明せよ。![\begin{eqnarray*}
\mathbb{E}[\mu_{ML}] &=& \mu \\
\mathbb{E}[\sigma^2_{ML}] &=& \left( \frac{N-1}{N} \right) \sigma^2
\end{eqnarray*}](../../_images/math/9a4d84ee3d275e36fa907f93c4856628758a8e1c.png)

を証明せよ。また、
を示し、xが整数なら
となることを示せ。
,体積
を導く。まず直交座標から極座標への変換から導かれる


および
から上記の式らが
および
の通常の表現に帰着されることを示せ。