ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

かる〜く統計学コミュの予測統計:数量化?類

  • mixiチェック
  • このエントリーをはてなブックマークに追加
今日は数量化?類の勉強をしてみました。

といっても、参考書のデータをRで計算させてみて結果が同じことを確認しただけですが...

数量化?類は、重回帰分析の説明変数に質的データを使用する手法です。
説明を読むと、どうも名義尺度を無理やり間隔尺度に変換して重回帰分析を実施しているようです。重回帰分析のトピを先に立てなくてはいかんかなと少し後悔しましたが、もうあとには引けません。

ここでは参考書にしたがって、駅のキオスクにおける、新聞の売り上げに及ぼす種々の要因について分析してみました。

目的変数:売り上げ部数
説明変数:曜日、天気、前日の巨人戦の結果、競馬の開催

サンプルデータをRで処理してみると、以下の結果が得られました。どの変数もとても良く適合しているようです。
(参考書のデータなので当然です)

Partial Cor. t value P value
曜日 0.9878696 30.50925 0.00000 ***
天気 0.9969597 61.36174 0.00000 ***
巨人 0.9932639 41.10934 0.00000 ***
競馬 0.9795239 23.33324 0.00000 ***

ベースは重回帰分析ですので、各説明変数の各水準(カテゴリ)がどれだけ目的変数に貢献しているかの得点を出すことができます(カテゴリスコアといいます。図を参照)。

このカテゴリスコア使用して、新聞の売り上げ部数の予測ができるわけです。

たとえば、サンプルデータでの最初の日の売り上げ予測は、

  曜日 日  -7.774
  天気 晴れ 7.751
  巨人 勝ち 6.629
  競馬 無し -1.428
+)  平均値 45.036
-------------------------
売り上げ部数予測値 50.214

となり、実測値50とかなり近いことがわかります。
この要領で未来の新聞の売り上げも予測できるはずです。たぶん!

【サンプルデータ】
日付 曜日 天気 巨人 競馬 売り上げ部数
1 日 晴れ 勝 無し 50
2 月 晴れ 勝 有り 77
3 火 晴れ 無し 無し 40
4 水 雨 無し 無し 24
5 木 晴れ 負 無し 55
6 金 晴れ 勝 無し 59
7 土 小雨 無し 有り 33
8 日 晴れ 無し 無し 37
9 月 晴れ 負 無し 57
10 火 晴れ 無し 無し 41
11 水 雨 負 無し 31
12 木 晴れ 勝 無し 61
13 金 小雨 勝 無し 44
14 土 晴れ 無し 有り 48
15 日 晴れ 無し 無し 35
16 月 雨 勝 無し 44
17 火 雨 無し 無し 20
18 水 小雨 勝 無し 46
19 木 雨 負 無し 34
20 金 雨 勝 無し 38
21 土 晴れ 負 無し 47
22 日 小雨 勝 無し 34
23 月 晴れ 勝 有り 75
24 火 晴れ 負 無し 48
25 水 晴れ 無し 無し 45
26 木 小雨 負 無し 40
27 金 晴れ 勝 無し 59
28 土 小雨 勝 無し 39

【参考書】
「入門 パソコン統計処理 下」技術評論社 ISBN4-87408-356-0

コメント(1)

( ̄□ ̄;)!!
いろいろすっ飛ばして高度などころへ…

数量化?類を超簡単に言うと、重回帰分析の予測変数に質的データを用いる方法ですね。

…重回帰分析の説明をこのコミュニティでしてませんが、、、

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

かる〜く統計学 更新情報

かる〜く統計学のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング