Uのblog

『アホ』な旅やイベントに憧れる人のブログ。

パワプロと統計

お久しぶりです。師走は「忙しくてお坊さんも走ってしまう」なんて言われますが近頃お坊さんもデジタル化しているようで。お経の配信とか、オンラインおみくじを自分でプログラムした方とか、デジタルと仏教なんてすごく斬新な組み合わせだなぁなんて感じますね。昔とある講演会で、『一見交わらなさそうな分野の融合にこそ価値が生まれる』と聞いたのが非常に印象に残っています。そういう今までになかった組み合わせを発見できたのは、ある意味よいことだったのではないでしょうか。でも、その開拓をするためには多少の勉強が要ったでしょう。それにあたって、自分も各分野最低限の知識は得ておきたいなぁなんて考えております…(考えだけは大層なんですがね)

 

それはさておき、今回は統計、特に2標本問題について少し学ぶことがあったのでそれを身近な例に用いて復習がてら検証してみたいと思います。

パワプロ、というゲームをご存じでしょうか。プロ野球をベースとしたゲームなのですが、このゲームには1年間ペナントレースをシミュレートする、というモードがあります。

 

ここで、一つ。それぞれの選手にはいろいろなパラメータが存在します。この中で『走力』、すなわち足の速さを表すパラメータに注目してみましょう。

このパラメータの最低値と最高値を持った選手の打率を比較したとき、そこの平均に優位な差は存在するのでしょうか。普通に考えれば足は速いほうがヒット数も増えて打率も増えるように思われますが、、、

早速ですがそれぞれ12回調査した結果を見てみましょう。この結果はとある動画からお借りしました。

 

  最高値 最低値
1 0.308 0.252
2 0.283 0.288
3 0.262 0.282
4 0.247 0.247
5 0.242 0.251
6 0.278 0.267
7 0.242 0.315
8 0.271 0.269
9 0.282 0.283
10 0.240 0.245
11 0.226 0.268
12 0.260 0.261
Ave. 0.262 0.269

以下検証になります。

 

それぞれの母集団は正規母集団であると仮定しておく。また、両者の分散は同じであると仮定する。

すなわち、走力が最高値の際の打率の分布を N(\mu_1,\sigma^2)、最低値の際の打率の分布を N(\mu_2,\sigma^2)とする。

また N(\mu_1,\sigma^2)から無作為に抽出した大きさ12の標本を X_1,X_2...X_{12} N(\mu_2,\sigma^2)から無作為に抽出した大きさ12の標本を Y_1,Y_2...Y_{12}とする。

 \overline{X} = \frac{1}{12} (X_1+X_2+... +X_{12}),{S_X}^2 = \frac{1}{11} \sum_{i=1}^{12} (X_i - \overline{X})^2

 \overline{Y} = \frac{1}{12} (Y_1+Y_2+... +Y_{12}),{S_Y}^2 = \frac{1}{11} \sum_{i=1}^{12} (Y_i - \overline{Y})^2

S^2 = \frac{1}{2} ({S_X}^2+{S_Y}^2), t=\frac {(\overline{X} - \overline{Y})-(\mu_1 - \mu_2)}{\sqrt{(\frac{1}{12}+\frac{1}{12})S^2}}とする。

このとき、tt(22)に従う。

さて、ここから帰無仮説と対立仮説を立てていくが、今回は走力が高い方が打率も高くなるだろうと思われるので、

帰無仮説H_0 : \mu_1=\mu_2、対立仮説H_1 : \mu_{1}> \mu_{2}とし、有意水準5%で検定する。

H_0のもとでt=\frac {\overline{X} - \overline{Y}}{\sqrt{(\frac{1}{12}+\frac{1}{12})S^2}}t(22)に従う。

よって棄却域はt \geq t_{0.05}(22)=1.717

今回、打率から計算すると\overline{X}=0.262,\overline{Y}=0.269,{S_X}^2=5.55\times 10^{-4}, {S_Y}^2=4.17\times 10^{-4},S^2=4.86\times 10^{-4}

したがってt=-0.778。棄却されない。

すなわち足の速さにより打率によい影響が与えられるとは言えない。

 

 

 

………まあ12回の平均値が、走力の速さと逆の関係を持っていたのでその時点でこの結果は確定していました。TeXを使ってみたかったのとちょっと復習がしたかっただけなのでいいんですよ(強がり)。

 

あとこれは余談なんですが、「tex: >」とするとうまく表示されないのはなんなんですかね?今回は無理矢理追い出しましたが…

 

ここまで読んでいただきありがとうございます。次は「満足度94%!(回答数33人)」みたいなやつの信憑性を検証してみたいですね。