第 2 回 Q-Qプロット、第2回課題
本日の内容
このドキュメントは
http://edu.net.c.dendai.ac.jp/
上で公開されています。
定義
事象により、確率変数 はある値をとる。
の変域として実数を考える。
が
以下の
値を取る確率
を累積分布関数
という。
累積分布関数
の導関数
を確率密度関数といい、
で定義する。
これは
、
を満たす。
のとき、
と
は独立であると言う。
平均
は
である。
分散は
確率変数 が平均 0、分散1のとき、
は平均 、分散
になる。
の
確率密度関数が
であるとき、
の
確率密度関数は
より
となる。
モーメント母関数(積率母関数)を
特性関数を
とする。
これは確率密度関数のフーリエ変換になるので、
逆フーリエ変換を考えると次が成り立つ。
中心極限定理と正規分布
を
独立で、
平均が で
分散が
となる、任意の同じ確率分布の確率変数とする。
このとき、
は
が大きくなると
平均
、
分散
の正規分布に収束する。
証明
が平均0, 分散 1 の正規分布に従うことを示す。
の積率母関数を考える。
特性関数は
となるので、これを逆フーリエ変換して確率密度関数関数を求める。
Q.E.D.
平均
分散
の正規分布を
で表す。
確率密度関数は
。
とすると、累積分布関数は
。
モーメント母関数は
様々な確率分布(1)
- 指数分布
-
平均
、
分散
の指数分布の確率密度関数は
、累積分布関数は
。
モーメント母関数は
。
- 対数正規分布
-
確率密度関数は
、累積分布関数は
再生性
確率分布族に含まれる確率分布
,
に従う確率変数
,
に対して、
の確率分布が同じ確率分布族に含まれるとき、
その確率分布族は再生性があると言います。
直接確率分布を計算する他に、モーメント母関数から求める方法がありま
す。
のモーメント母関数は
より、モーメント母関数の積が同じ確率分布族になる場合、再生性がある
と言える。
- 正規分布
-
,
のそれぞれのモーメント母関数
,
の積を考えると
となり、
のモーメント母関数となるため、再生性を持つ。
- 指数分布
- 対数正規分布
Q-Qプロットの Q は quantiles分位数を意味します。
累積分布関数を持つ確率分布に従うとき、
分位数
は
となる値である。
Q-Qプロットは定義とすれば、2つの確率分布
,
について、
分位数
がそれぞれ
,
とすると、
をパラメータとして
をプロットしたものが Q-Qプロットになる。
もし、
と
が同じ分布のとき、
このグラフは
のグラフになる。
個のデータ
,
(
)
の
番目のデータを
分位数
とみなし、
また、このデータが従う確率分布の累積分布関数が
のとき、
をプロットすると、
上に並ぶ。
もし、
このデータ系列が
また、このデータが従う確率分布の累積分布関数が
に従っているとき、
をプロットすると、
上に点が並ぶ。
つまり、平均、分散をパラメータとして与えられる確率分布に
従うデータに関しては、
平均0、分散1の確率分布の分位数を考えることで、
Q-Qプロットで直線が得られる。
特に、
の累積分布関数
に関して、
をプロットするのを
正規確率プロット
と呼ぶ。
Q-Qプロットをすると、与えられたデータが仮定した確率分布とどの程度
類似しているかを可視化できる。
なお、仮定する確率分布として、正規分布の他、指数分布や対数正規分布など、
様々なものが使われる。
課題
以下のデータをダウンロードし、何らかの確率分布を仮定し、Q-Qプロット
で類似性を可視化すること。
また、Q-Qプロットから確率分布を推定しなさい。
- data21.csv
- data22.csv
坂本直志 <sakamoto@c.dendai.ac.jp>
東京電機大学工学部情報通信工学科