ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

統計家コミュの確率密度関数で1以上の値?

  • mixiチェック
  • このエントリーをはてなブックマークに追加
確率密度関数の解釈について質問です。

つい先日、エクセルの normdist 関数を使っていてふと思ったのですが、引数の標準偏差に小さい値を入れると返ってくる値が1を越していました。例えば=NORMDIST(1,1,0.1,FALSE)。
素人っぽい考えで、確率だから1を超える値の解釈に戸惑ってしまいました。

ガウス分布の確率密度関数の式によると、確率密度関数は(エクセル風で失礼します・・) 1/(sqrt(2*pi())*exponential(...) のようになるので、確かに標準偏差が 1/(sqrt(2*pi()) よりも小さい値をとると、x の値によっては1を超えることがわかります。

ただこの解釈をどうしたらよいのかと思い質問させていただきました。
例えば、仮に学力テストの結果、平均50点で、標準偏差が0.2、生徒数が100人いたと仮定すると、平均点(50点)を取った学生は NORMDIST を使って
= NORMDIST(50, 50, 0.2, FALSE) * 100
でおおよそ200人!?のような感じです。

私の解釈が間違っているのは承知しているのですが、確率の解釈で納得できる物が無くて、例えば上記テストの結果の解釈を例えにご教授していただければと思いました。

学術的な式をかじりながら知っていても、現実の例に合わせると、何かと理解に苦しむことが多いです・・よく理解していないせいですね・・

コメント(2)

正規分布は連続的な変数に対する分布なので、テストの例のような離散的な値をとる変数については少し考慮が必要です。

確率密度関数は確率ではなく密度を表します。密度×幅(すなわちグラフ表現したときの面積)が確率です。したがって、「50点」のようなただ1点をとる確率は 0 です(幅が0なので)。しかし、これを「49.5 点以上 50.5 点未満」と考えるならば、その高さと幅をかけて49.5〜50.5までを足し上げた(正確には「積分した」)ものが確率になります。

ということで、密度の値が局所的に1を超えていても何ら問題ありません。任意の幅をとって積分したならば必ず1以下になりますので。

ちなみにExcelで確率を計算するには、
=NORMDIST(50.5,50,0.2,TRUE)-NORMDIST(49.5,50,0.2,TRUE)
のようにします。この例ではあまりに標準偏差が小さすぎるので99%ぐらいの確率になってしまいますが。
ご丁寧にありがとうございます!

そうですね、私の式は積分する概念が入っていませんでした。エクセルの累積密度 (normdist(,,,TRUE) ) を使って私の問題もすっきり解決することが出来ました。

遅い時間にわかりやすい御回答いただき真にありがとうございました。

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

統計家 更新情報

統計家のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング