大学の統計に慣れる【例題を通して】【大学数学】

大学生用コンテンツ

2022.07.252022.07.27

離散型確率変数
連続型確率変数

離散型確率変数

確率変数Nの確率が以下で定められている。
P(N=n) = (n-1)p²(1-p)^n-2　(n=2,3,,,,)

例題１「E(N)を求めよ」

P(N=n)の理解のイメージ

P(N=n) = (n-1)p²(1-p)^n-2　(n=1,2,3,,,,)
は確率変数Nの値が整数nになる確率が右辺だということ。
厳密な書き方は、P({w; N(w)=n})
例えると、人間Nにおやつwをあげると、満足度nになる。人間Nが満足度nになる確率がP(N=n)

E(N)の理解のイメージ

確率変数Nの取る値の期待値（平均値）を表す。
・N=nになる確率はP(N=n)
・N=nになったときのNの値はそのままn

具体的に例を考えてみる。
６面サイコロの１面が出る確率は1/6とする。
出た目の数がポイントとする。
一回サイコロを振った時のポイントの期待値（平均値）を求めてみる。
1・(1/6)+ 2・(1/6)+・・・+ 6・(1/6) = 3.5

平均値って聞くと母数で割り算したくなるけど、確率を掛け算している部分が割り算に相当するので、する必要がありません。

解答：
E(N) = ΣnP(N=n) = Σn(n-1)p²(1-p)^n-2 =（計算省略）= 2/p

＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

例題２：
「確率変数Nが以下で定められている。
N = N₁ + N₂
確率変数N₁, N₂の確率は以下で定められている。また、N₁, N₂は独立。
P(N₁=n) = p(1-p)^n-1　(n=1,2,3,,,,)
P(N₂=n) = (n-1)p²(1-p)^n-2　(n=2,3,4,,,,)

Nの確率P(N=n) (n=3,4,5,,,,)を答えよ。」

P(N=n)のイメージ

N = N₁ + N₂なので、代入してみる。
P(N₁ + N₂ = n)
例えばN₁ = 5 なら、N₂ = n-5 なので、
N₁ = k なら、N₂ = n-kなので、kに関してΣを使う。

解答：
\(\begin{aligned}
E(N)
&=\sum_{k=2}^{n-1} P\left(N_{1}=n-k_{1}, N_{2}=p_{1}\right)\\
&=\sum_{k=1}^{k-1} P\left(N_{1}=n-k\right) P\left(N_{2}=k\right) （∵ 独立）\\
&=\sum_{k=2}^{n-1} p(1-P)^{n+k-1} \cdot(n-1) p^{2}\left(1-P)^{k-2}\right.\\
&=(n-1) p^{3}(1-P)^{n-3} \sum_{k=2}^{n-1} 1\\
&=(n-1) p^{3}\left(1-p)^{n-3}(n-2)\right.\\
&=(n-1)(n-2) p^{3}(1-p)^{n-3} .
\end{aligned}\)

例題３：
「不偏推定量 c/(N-1)
がpの不偏推定量となるような、p,Nに依存しないcの値を求めよ」

一般論（不偏推定量）

統計量Tの確率分布の平均がθの時、
E[T] = θ
となるとき、Tは母数θに対する不偏推定量と呼ぶ。

今回

E(c/(N-1)) = p
となれば良い。

E(1/N)は確率変数Nが値1/nを取る確率がP(N=n)

解答：
E(c/(N-1)) = cE(1/(N-1)) = cΣ1/(n-1)P =（計算）= p
示せた。

＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

例題４：
N₁, N₂の定義はさっきまでとおなじ。
N₁ = n₁, N₂ = n₂　を観測した時のpの最尤推定量を求めよ。

一般論（最尤推定量）

最尤法は母集団の分布の形がわかっている時に使える方法。（ちなみに、母集団の分布の形がわかっているがその母数が未知であるときに、標本値からその母数を決めようとする方法の１つ）
母数θとして、母集団の確率密度関数をf(x;θ)とする。
X₁, X₂,,,X_nを母集団からの標本とすると、尤度関数はこれによって定まるn次元確率分布の確率密度関数L(X₁, X₂,,,X_n；θ)となる。
尤度関数Lに標本調査で得られた値（サンプル）を代入したL(x₁, x₂,,,x_n；θ)をθの関数L(θ)だと考えて、そのLの値を最大にするθを考える。最大にするθを最尤推定量という。

X₁, X₂,,,X_nが無作為標本ならば、
L(θ) (=L(x₁, x₂,,,x_n；θ)) = f(x₁;θ)f(x₂;θ)・・・f(x_n;θ)
となる。
L,fはどっちも正なので、
log L(X₁, X₂,,,X_n；θ) = Σlog f(X_n;θ)
を最大にするθを求めたらいい。

今回

尤度関数は
L(p) (=L(n₁, n₂；p)) 
= f(n₁;p)f(n₂;p)
= P(N₁ = n₁)P(N₂ = n₂)
= p(1-p)^n₁-1 (n₂-1)p²(1-p)^n₂-2
= (n₂-1)p³(1-p)^n₁+n₂-3

log L(p)
= log(n₂-1) + log p³ + log (1-p)^n₁+n₂-3

log L(p)を最大にするpを求めるので、pで微分する

log L'(p) = 0　を計算する。
3/p - (n₁+n₂-3)/(1-p)　=0
・・・・・
p=3/(n1+n2)

連続型確率変数

分布関数 F(x) = P(X ≦ x) が

\(\begin{aligned}F\left( x\right) =\int ^{x}_{-\infty }f\left( t\right) dt\
\end{aligned}\)

と、ある非負値関数fの積分で書ける場合、Xは連続型確率変数。

確率なので、\(\begin{aligned} \int ^{\infty}_{-\infty }f\left( t\right) dt = 1
\end{aligned}\)

例題１：

確率変数X₁, X₂を以下の確率分布関数を持つ分布からの大きさ2のランダム標本とする。
\(\begin{equation}
f(x)= \begin{cases}e^{-x} & x>0 \\ 0 & \text { その他 }\end{cases}
\end{equation}\)
Y₁= min{X₁, X₂}, Y₂= max{X₁, X₂}とする。
Y₂の確率密度関数を求めよ。

方針など

Y₂の確率密度関数なので、f(y₂)を求めればいい。
いきなりf(y₂)は分からないので、その分布であるF(y₂)を考える。 

Fの定義より、F(y₂)をy₂で微分すればf(y₂)が出る。

解答：

F(y₂) = P( Y₂ ≦ y₂ )
= P( max(X₁, X₂) ≦ y₂ )
= P(X₁ ≦ y₂)P(X₂ ≦ y₂) （ランダム標本のX₁, X₂が両方ともy₂より小さい確率を求めている）
= {P(X₁ ≦ y₂)}²
（計算）
= (1 – e^-y₂)²

f(y₂) = F'(y₂) = 2e^-y₂(1 – e^-y₂)