パワプロと統計
お久しぶりです。師走は「忙しくてお坊さんも走ってしまう」なんて言われますが近頃お坊さんもデジタル化しているようで。お経の配信とか、オンラインおみくじを自分でプログラムした方とか、デジタルと仏教なんてすごく斬新な組み合わせだなぁなんて感じますね。昔とある講演会で、『一見交わらなさそうな分野の融合にこそ価値が生まれる』と聞いたのが非常に印象に残っています。そういう今までになかった組み合わせを発見できたのは、ある意味よいことだったのではないでしょうか。でも、その開拓をするためには多少の勉強が要ったでしょう。それにあたって、自分も各分野最低限の知識は得ておきたいなぁなんて考えております…(考えだけは大層なんですがね)
それはさておき、今回は統計、特に2標本問題について少し学ぶことがあったのでそれを身近な例に用いて復習がてら検証してみたいと思います。
パワプロ、というゲームをご存じでしょうか。プロ野球をベースとしたゲームなのですが、このゲームには1年間ペナントレースをシミュレートする、というモードがあります。
ここで、一つ。それぞれの選手にはいろいろなパラメータが存在します。この中で『走力』、すなわち足の速さを表すパラメータに注目してみましょう。
このパラメータの最低値と最高値を持った選手の打率を比較したとき、そこの平均に優位な差は存在するのでしょうか。普通に考えれば足は速いほうがヒット数も増えて打率も増えるように思われますが、、、
早速ですがそれぞれ12回調査した結果を見てみましょう。この結果はとある動画からお借りしました。
最高値 | 最低値 | |
1 | 0.308 | 0.252 |
2 | 0.283 | 0.288 |
3 | 0.262 | 0.282 |
4 | 0.247 | 0.247 |
5 | 0.242 | 0.251 |
6 | 0.278 | 0.267 |
7 | 0.242 | 0.315 |
8 | 0.271 | 0.269 |
9 | 0.282 | 0.283 |
10 | 0.240 | 0.245 |
11 | 0.226 | 0.268 |
12 | 0.260 | 0.261 |
Ave. | 0.262 | 0.269 |
以下検証になります。
それぞれの母集団は正規母集団であると仮定しておく。また、両者の分散は同じであると仮定する。
すなわち、走力が最高値の際の打率の分布を、最低値の際の打率の分布をとする。
またから無作為に抽出した大きさ12の標本を、から無作為に抽出した大きさ12の標本をとする。
とする。
このとき、はに従う。
さて、ここから帰無仮説と対立仮説を立てていくが、今回は走力が高い方が打率も高くなるだろうと思われるので、
のもとではに従う。
よって棄却域は
今回、打率から計算すると。
したがって。棄却されない。
すなわち足の速さにより打率によい影響が与えられるとは言えない。
………まあ12回の平均値が、走力の速さと逆の関係を持っていたのでその時点でこの結果は確定していました。TeXを使ってみたかったのとちょっと復習がしたかっただけなのでいいんですよ(強がり)。
あとこれは余談なんですが、「tex: >」とするとうまく表示されないのはなんなんですかね?今回は無理矢理追い出しましたが…
ここまで読んでいただきありがとうございます。次は「満足度94%!(回答数33人)」みたいなやつの信憑性を検証してみたいですね。