一般化パレート分布の平均と分散をレベルセットを使って計算する

積分の計算をレベルセットの積分に変形する公式として, Layer Cake Representation が知られている.

Layer Cake Representation

定理 1. (Layer Cake Representation)

 \nu を非負実数直線  [0,+\infty) 上のBorel 集合族の上の測度とし, 単調増大関
\begin{equation}\label{eq_LCR_1}
\phi(\lambda) = \nu ([0,\lambda))
\end{equation}
が任意の  \lambda>0 に対して有限であるとする. また,  (\Omega,\Sigma, \mu) \sigma -有限な測度空間とし,  f を非負な可測関数とする.
このとき,
\begin{equation}
\int_\Omega \phi(f(x))\,d\mu(x)
= \int_0^\infty \mu\left(x\in \Omega; f(x)>\lambda\right)\,d\nu (\lambda)
\end{equation}
が成り立つ. 特に,  a>0 に対して  \phi(\lambda) = \lambda^a とすると,
\begin{equation}
\int_\Omega f(x)^a\,d\mu(x)
= a\int_0^\infty \lambda^{a-1}\mu\left(x\in \Omega; f(x)>\lambda\right)\,d\lambda
\end{equation}
が成り立つ.

注意 2.

  1.  \mu は符号付き測度でもよい. このとき,  \phi有界変動な関数であり, 第2式は正負のいずれかが有限確定の場合に成り立つ.
  2. 第3式を確率論っぽく書くと,  f の代わりに確率変数 X を用いて,

\begin{equation}
E[X^a]
= \int_\Omega X(\omega)^a\,dp(\omega)
= a\int_0^\infty \lambda^{a-1} P(X>\lambda)\,d\lambda
\end{equation}
と書ける. ただし  P\left(\omega\in \Omega; X(\omega)>\lambda\right) P(X>\lambda) と表している.

証明は Analysis の Theorem 1.13 を見ましょう:

命題 3. Tail-Sum Formula

非負の値をとる確率変数  X に対して,
\begin{align*}
E[X]
&=\int_0^\infty P(X>\lambda)\,d\lambda,\\
E[X^2]
& =2\int_0^\infty \lambda P(X>\lambda)\,d\lambda,\\
V[X]
& =2\int_0^\infty \lambda P(X>\lambda)\,d\lambda\\
&\quad - \left(\int_0^\infty P(X>\lambda)\,d\lambda\right)^2
\end{align*}
証明は定理 1 から直ちに従うため省略する. 藤田岳彦『弱点克服 大学生の確率・統計』では, これはしっぽ確率と呼ばれている.

Tail-Sum Formula(離散版)

非負整数値をとる確率変数  X に対して,
\begin{align}\label{eq_1st_moment_disc}
E[X]
&=\sum_{k=0}^\infty P(X>k)\\\notag
&= \sum_{k=1}^\infty P(X\ge k),\\
\label{eq_2nd_moment_disc}
E\left[X(X-1)\right]
& =2\sum_{k=0}^\infty k P(X>k),\\
\label{eq_variance_disc}
V[X]
& =2\sum_{k=0}^\infty k P(X>k)\\\notag
&\quad - \sum_{k=0}^\infty P(X>k)\left(\sum_{k=0}^\infty P(X>k)-1\right)
\end{align}

証明

命題 2 より第1式は明らかである. 第2式を示そう.
非負整数  k に対して,  \lambda k< \lambda< k+1 をみたすとき,  P(X>\lambda) = P(X>k) だから, 命題 2 より,
\begin{align*}
E[X(X-1)]
&= \int_0^\infty \dfrac{2\lambda-1}{2}P(X>\lambda)\,d\lambda\\
&= \sum_{k=0}^\infty \int_k^{k+1}\dfrac{2\lambda-1}{2}P(X>\lambda )\,d\lambda\\
&= \sum_{k=0}^\infty \int_k^{k+1} \dfrac{2\lambda-1}{2}\,d\lambda \times P(X>k)\\
&= \sum_{k=0}^\infty k P(X>k).
\end{align*}
第3式はここから従う.

応用例っぽいの

ちょっとした応用例として, 一般化パレート分布の平均・分散と, 幾何分布の平均・分散を求めてみる.

一般化パレート分布

Wikipediaなど見ればわかるように, 位置パラメータ  \mu \in \mathbb{R} , 尺度パラメータ  \sigma>0, 形状パラメータ  \xi \in \mathbb{R} としたときの一般化パレート分布の累積分布関数は,
 \begin{equation}
F_X(x)= 1- \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi}
\end{equation}
と表され, 台は  1+\xi\dfrac{x-\mu}{\sigma}\ge 0 の範囲である. このとき, 次が成立する.

命題 5.

 \xi <1 のとき, 一般化パレート分布の平均は
 \begin{equation}
E[X]=\mu + \dfrac{\sigma}{1-\xi}
\end{equation}
であり,  \xi <1/2 のとき, 一般化パレート分布の分散は
 \begin{equation}
V[X]=\dfrac{\sigma^2}{(1-\xi)^2(1-2\xi)}
\end{equation}
である.

証明

 \mu >0 のときを考える*1.
レベルセットは
 \begin{equation}
P(X>\lambda)
=\begin{cases}
 \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi}\,\quad &x\in (\mu,\infty),\\
 1\quad & x\in(0,\mu).
\end{cases}
\end{equation}
これより,
 
\begin{align}
E[X]
&= \int_0^\mu \,d\lambda+\int_\mu^\infty \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi}\,d\lambda\\
&= \mu +\left[\dfrac{\sigma}{\xi}\dfrac{1}{-1/\xi+1}
  \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi+1}\right]_{\lambda =\mu}^\infty\\
&= \mu + \dfrac{\sigma}{1-\xi}.
\end{align}
一方で,
 \begin{align}
E[X^2]
&= 2\int_0^\mu \lambda\,d\lambda+2\int_\mu^\infty \lambda\left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi}\,d\lambda\\
&= \mu^2 +\left[\lambda \dfrac{\sigma}{\xi}\cdot\dfrac{1}{-1/\xi+1}
  \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi+1}
  - \dfrac{\sigma}{-1+\xi}\cdot\dfrac{\sigma}{-1+2\xi}
  \left(1+\xi\dfrac{x-\mu}{\sigma}\right)^{-1/\xi+2}\right]_{\lambda =\mu}^\infty\\
&= \mu^2 -2\dfrac{\mu\sigma}{1-\xi}+\dfrac{2\sigma^2}{(1-\xi)(1-2\xi)}
\end{align}
が部分積分により従う. これより,
 \begin{align}
V[X]
&=E[X^2]-E[X]^2\\
&= \dfrac{\sigma^2}{(1-\xi)^2(1-2\xi)}
\end{align}
を得る.

幾何分布

書く

参考文献


*1:そうでないときは各自考える.