Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

ベータ分布の意味と平均・分散の導出

ベータ分布とは,確率密度関数が

f(x)=Cxa1(1x)b1(0x1)f(x)=Cx^{a-1}(1-x)^{b-1}\:(0\leq x\leq 1)

であるような確率分布のことです。

ただし,a,ba,b はパラメータ(正の実数)であり,CC は規格化定数です。

ベータ分布の意味

ベータ分布は「コイン投げにおける表が出る確率の予測分布」という解釈ができます。

表が出る確率 xx が不明であるコインを何回か投げて,表が mm 回,裏が nn 回出たとします。このとき「表が出る確率の予測値」は,パラメータが (a,b)=(m+1,n+1)(a,b)=(m+1,n+1) であるベータ分布に従うと考えることができます(→注)。

いろいろなベータ分布の図

例えば,

(a,b)=(1,1)(a,b)=(1,1) のときは,ベータ分布は青い直線のように一様分布になります。つまり,m=n=0m=n=0 のとき(そもそもコインを投げていないとき)は「情報が全く無いので,xx は一様分布に従う」と解釈できます。

(a,b)=(2,3)(a,b)=(2,3) のときは,ベータ分布は赤い曲線のようになります。つまり,m=1,n=2m=1,n=2 のときは「表が出る確率は 13\dfrac{1}{3} に近そうだけど,試行回数が少ないので,13\dfrac{1}{3} からは遠い値かもしれない」と解釈できます。

(a,b)=(4,7)(a,b)=(4,7) のときは,ベータ分布は緑の曲線のようになります。つまり,m=3,n=6m=3,n=6 のときは「表が出る確率は 13\dfrac{1}{3} に近そうで,さきほどより試行回数が多いので,より自信を持って 13\dfrac{1}{3} に近いと言える」と解釈できます。

注:上記は大雑把な説明です。より正確に言うと, 事前分布を一様分布とし,尤度が二項分布(コイン投げ)であるときの事後分析がベータ分布になります。

ベータ分布のパラメータ

ベータ分布は,a,ba,b という2つのパラメータを持っています。 a,ba,b の値によって分布の形は大きく異なります。Wolfram Alphaでbetadistribution[a,b]と入力すればパラメータが a,ba,b のベータ分布の確率密度関数のグラフを見ることができます。 aabb をいろいろな値にして図示してみると楽しいです。

例えば,a=ba=b の場合,確率密度関数は x=12x=\dfrac{1}{2} に関して対称になります。

ベータ分布の規格化定数

ベータ分布の確率密度関数

f(x)=Cxa1(1x)b1f(x)=Cx^{a-1}(1-x)^{b-1}

における CC は規格化定数です。

C=101xa1(1x)b1dxC=\dfrac{1}{\int_0^1x^{a-1}(1-x)^{b-1}dx}

です。

ベータ関数を使うと,C=1B(a,b)C=\dfrac{1}{B(a,b)} と表すことができます。また,a,ba,b が整数のとき,

C=(a+b1)!(a1)!(b1)!C=\dfrac{(a+b-1)!}{(a-1)!(b-1)!} となります。

ベータ分布の平均

ベータ分布の平均は E[X]=aa+bE[X]=\dfrac{a}{a+b} です。これは綺麗なので覚えておいてもよいでしょう。

証明

平均は,

01xf(x)dx=01xa(1x)b1dx01xa1(1x)b1dx\displaystyle\int_0^1 xf(x)dx\\ =\dfrac{\int_0^1x^a(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}

ここで,分母分子はそれぞれベータ関数の積分公式01xm(1x)ndx=m!n!(m+n+1)!\displaystyle\int_0^1x^m(1-x)^ndx=\dfrac{m!n!}{(m+n+1)!} を用いて計算できるので,上式は

a!(b1)!(a+b)!(a+b1)!(a1)!(b1)!=aa+b\dfrac{a!(b-1)!}{(a+b)!}\cdot \dfrac{(a+b-1)!}{(a-1)!(b-1)!}\\ =\dfrac{a}{a+b}

となる。

ベータ分布の分散

ベータ分布の分散は V[X]=ab(a+b)2(a+b+1)V[X]=\dfrac{ab}{(a+b)^2(a+b+1)} です。これは覚える必要はありません。

証明

分散は,

E[X2]E[X]2=01xa+1(1x)b1dx01xa1(1x)b1dxa2(a+b)2E[X^2]-E[X]^2\\ =\dfrac{\int_0^1x^{a+1}(1-x)^{b-1}dx}{\int_0^1x^{a-1}(1-x)^{b-1}dx}-\dfrac{a^2}{(a+b)^2}

第一項はさきほどと同様にベータ関数の積分公式を用いて計算できる。上式は,

(a+1)!(b1)!(a+b+1)!(a+b1)!(a1)!(b1)!a2(a+b)2=a(a+1)(a+b)(a+b+1)a2(a+b)2=a(a+1)(a+b)a2(a+b+1)(a+b2)(a+b+1)=ab(a+b)2(a+b+1)\dfrac{(a+1)!(b-1)!}{(a+b+1)!}\cdot\dfrac{(a+b-1)!}{(a-1)!(b-1)!}-\dfrac{a^2}{(a+b)^2}\\ =\dfrac{a(a+1)}{(a+b)(a+b+1)}-\dfrac{a^2}{(a+b)^2}\\ =\dfrac{a(a+1)(a+b)-a^2(a+b+1)}{(a+b^2)(a+b+1)}\\ =\dfrac{ab}{(a+b)^2(a+b+1)}

となる。

なお,コイン投げはベルヌーイ分布(確率1/2ずつで 0,10,1 を取る分布)またはラーデマッハー分布(Rademacher 分布,確率1/2ずつで ±1\pm 1 を取る分布)で表されることが多いです。

Tag:いろいろな確率分布の平均,分散,特性関数などまとめ