ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

統計家コミュの判別分析

  • mixiチェック
  • このエントリーをはてなブックマークに追加
はじめまして。
初歩的なことかもしれませんが、教えていただきたいことがあります。

入院患者の1ヵ月後の移動能力を予測するために、
入院時の評価を11項目(量的変量)行っています。

移動能力は車椅子に1人で移ることが出来るか出来ないかの2群の予測です。

その2群を予測するために判別分析を行いましたが、
入院時の評価が11項目もあるため、係数が多く臨床的に使用困難です。
また11項目の全てが大事な項目かも分かりません。

そこで予測する2群を「1」「2」と量的変量に置き換えて
変数選択重回帰分析をおこなうと変数が絞り込まれた上に
回帰関数が求まるのでこれでよいかなと思われたのですが、
今度は結果が実数で出てくるために予測しづらいものとなりました。

そこでなのですが、変数選択重回帰分析で得られた説明変数を用いて
(今回は4つに絞られました)判別分析を行うということは統計学上
行ってもよいことなのでしょうか?

それと、こういった事例に対して他に有効な手段はありますでしょうか?

コメント(8)

目的変数が離散数(質的変数)なので,ロジスティック回帰分析を行った方が良いと思います.
ありがとうございます。
しかし、そのロジスティック回帰分析がいまいち理解できてないんですよね。
勉強します。
素朴な疑問なんですが、統計分析の方法を決めずにデータを取っちゃう、というのはまずいような気がしますが・・・。
トッスィーさんがされているのは調査研究,後方視的に診療録を掘り返して行っているものでしょうから特に問題ない気もしますが…
医療の世界では後から診療録を見返してというのはよくあることだと思いますが.
ありがとうございます。
そうです。
後方視的に行なっているものです。
予後予測などは臨床的にはとても有用なものですので
それを調べたいと思っています。
ロジスティック回帰では11個の変数すべてを使う訳ではなく変数選択で有効な要因のみを使用します.また,結果が出来る/出来ないの確率(足して100%)で出てきますので,私の感覚ではこちらの方が有用だと思いますが...
普通に考えるとまずはロジスティック回帰、満足な結果が得られなければregression tree や
support vector machine を試してみるという感じではないでしょうか。

変数の数が11個と少ないですので、よほどサンプル数が多くない限り、モデル選択は大した
困難を伴わないと思います。例えば、全ての変数を含んだモデルから開始して、AIC (Akaike
Information Criterion)などの基準で、不要な変数を除いていく(backward stepwise selection)
方法なら、統計ソフト(Rなど)を用いて一瞬でできるでしょう。
また、全ての組み合わせを探索しても2の11乗(=2048)通りしかありませんから、大した時間は
かかりません。

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

統計家 更新情報

統計家のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング