第 3 回 ノンパラメトリック検定、第3回課題
本日の内容
このドキュメントは
http://edu.net.c.dendai.ac.jp/
上で公開されています。
ポアソン分布
時間内に回
独立に事象が起きる確率
を
とし、微小時間
に
の確率で事象が起きるとする。
このとき、次の式が成り立つとする。
このとき、
次が成り立つことを示す
-
より、
これは
のときの式を満たす。
-
ここで、を代入したもの
を
ポアソン分布と呼ぶ。
指数関数のマクローリン展開
を使うと
なお、中心極限定理より、平均 のポア
ソン分布
は
に近似できる
分布
を互いに独立な
に従う確率変数とする。
このとき、
の確率分布を求める。
確率母関数を考えると
特性関数を
確率密度関数は
累積分布関数は
定理
を互いに独立な
に従う確率変数とする。
を標本平均とする。
ここで、
は自由度
のχ2分布に従う。
(証明)
統計的仮説検定とは
統計的仮説検定とは、ある母集団に対する仮説を立てて、その仮説の有効
性を、標本値を元に確率で判断する。
仮説としては、帰無仮説と呼ばれる、可能性の低そうな仮説
を立て、標本値からその仮説の成立する確率を計算し、十分低い確率であ
る場合、
その帰無仮説を棄却するというものである。
このとき、棄却するための確率を有意水準と呼ぶ。
通常は、5%や 1% などの値を選ぶ。
検定
事象が 種類に分類されるとして、
それぞれが
,...,
だったとする。
全事象の数が
個だったとすると、
となる。
各 番目の観測値に対する期待値を
で表すとき、
が
に従うと仮定して、分布のズレを考える。
ズレを正規化するため、
を正規化するため、
ズレの分布を正規分布
に近似し、その2乗和を考える。
つまり、
を考える。
このとき、
帰無仮説を「ズレは正常の範囲内」とするとき、
χ2分布の確率密度関数
について、
有意水準を αとすると、
であれば、帰無仮説は棄却される。
課題1
ある学校で、生徒たちが好きなスポーツに関する調査を行いました。スポーツ
は1つだけ選ばせています(野球、サッカー、バスケットボール)。また、
生徒たちの性別(男性・女性)も記録しています。以下は、200人の生徒
のデータです。このデータを基に、性別とスポーツの好みに有意な関連が
あるかを
有意水準5%で検定しなさい。
|
野球が好き | サッカーが好き | バスケットボールが
好き | 合計 |
男性 | 50 | 40 | 30 | 120 |
女性 | 20 | 30 | 30 | 80 |
合計 | 70 | 70 | 60 | 200 |
課題2
あるサイコロが公平かどうかを調べるために、600回のサイコロ投げを行っ
た。その結果は次の通りであった。サイコロが公平であるかどうかを有意
水準5%で検定しなさい。
出目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
回
数 | 90 | 110 | 95 | 100 | 105 | 100 | 600 |
坂本直志 <sakamoto@c.dendai.ac.jp>
東京電機大学工学部情報通信工学科