ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

統計家コミュの単発質問トピック

  • mixiチェック
  • このエントリーをはてなブックマークに追加
なかったので作ってみました。
不適切でしたら削除お願いします。

コメント(352)

X1+X2 が、{2a, 2a+2] の区間に分布し、確率密度が 2a+1 のところで1、両端で 0 となる三角形の分布になることは計算できているようですね。
そうしたら、C から 2a+2 までの定積分値(x 軸と確率密度関数に囲まれた部分の面積)が、X1 の確率密度関数の 0.95 から a+1 までの定積分値(=a+0.05)と同じになるようにCを定めればよいのではないでしょうか。直角二等辺三角形の分布なので、積分計算などせずとも作図して計算すればOKでしょう。
ただこういう問題には、実際の統計解析の場面ではあまりお目にかからないように思います。
>>[313]

さっそくの返答ありがとうございます。問題の式ですが、仮説検定なので、a=0 を等式に代入して、Cを出す形でよいでしょうか?先ほどまで代入しないでCを求めようとしていたのですが、解がかなり複雑になり、いろいろ考えていたら、仮説検定なのでa=0の代入が必要なのではと思いました。

問題はまだあるのですが、それぞれ検定力関数はどのように出すのですか?区間が[0, a] だった場合は最尤推定量はX1の最大値になるのですが、区間が[a, a+1] の場合は最尤推定量は変わるのでしょうか?この問題のほうが最初の問題より難しく感じます。
最初の検定は、「もしa=0ならば、X1が0.95以上になる確率は5%しかない」と言い換えられますので、危険率は5%、アポロさんの言うとおりa=0を代入して、
「もしa=0ならば、X1+X2がC以上になる確率は5%しかない」という状況をつくりだせばよいことになります。

検出力関数は、上記313の計算結果に315で算出されたCを代入すると第2種の誤りの確率βがaの関数として算出されるのでこれをもとに検出力1-βを算出すればよいでしょう。

最尤推定値は、統計の実践の場面では、得られた離散データから背後にある(微分可能な)連続分布のパラメータを推定するのに用いることが多いので、こういうのはやったことがありません。ただ、一様分布の場合には観測値の最大値が最尤推定量になりますので、分布がどちらへずれても同じことではないでしょうか。

統計解析をしていて、こういう問題に直面する可能性は極めて低いと思います。そろそろ実際のデータにあたってみては?
質問

ある単一の質問にゼロ/ワンで回答するデータを3回とったとします(1回目〜3回目までのデータは個人後とに対にはなっていないものの対象者は同じです)


このとき
1回目、2回目、3回目の得点に有意な差があるか検定することは可能ですか



具体的には

1回目 100人中20人がはいと答えた

2回目 100人中25人がはいと答えた

3回目 100人中75人がはいと答えたとして有意な差は求められますか
エス様
 同じ母集団なのに、データに対応がないというのが事態を厄介にしています。
 対応があれば、いいえ→はいを+、はい→いいえを−、変化なしを無視して符合検定を行うことができます。
 大きな母集団の中からランダムに再抽出されたものであれば、カイ二乗検定(独立性の検定)や(拡張)フィッシャーの正確確率検定が使えます。
 しかし、同じ母集団なのに対応関係がわからなくなっていると、どちらの検定方法の前提も崩れるので不適当ということになります。
 まずは元のデータに戻って、個人ごとの各回の回答の対応がわかるようにして下さい。そして符合検定を適用してください。
>>[318]


返信ありがとうございます

元のデータに戻って、対応付けるのは不可能な状況です


符合検定ははじめまして聞きました
勉強になります。


たとえばなんですが

100人のデータですが
100人を一人と見なすことができたと仮定して、その一人が
20点
25点
75点
をとったととらえることが出来るから先ほどの符合検定で導き出せますか?
これも無理ですね。それぞれの分布が独立でないからです。
卒論か何かですか?元のデータをあたることはできないのですか?
同様の試験をあと2回くらいやれば、分散分析が使えるのですが。
補足です。互いのデータが独立と見なせればカイ二乗検定などが、対応が全てはっきりしていれば符合検定が使えます。しかし、対応があるはずなのに対応が不明になってしまっていると、どちらの前提も崩れてしまうということなのです。
初めまして。質問させていただきます。
初歩的な質問なため、こちらで質問させていただくのも不適切なのかもしれませんが、割合、率、比の違いを教えてください。
日本語では“比”,“率”,“割合”は一般的には明確な区別なく混同されて使用されていますが、英語にすると違いがわかります。

比[ratio]
さまざまな2つの量の比較において用いられている.例えば,a:bあるいはa/b.

割合[proportion]
単位の次元をもたない数であり,1(=100%)を超えない.同質で包含関係のある情報同士の比であり,包含関係で大きな側を分母とする.例えば,a/(a+b).数学的には“比率“と同義.

率[rate]
適当な単位量あたりの変化量を比として示したもの. 1より大きくなる場合もある.
生存率分析について質問です。この分析と回帰分析とのつながりがうまく理解できていません。例えば以下のモデルがあったとします。

y = ln(x) = 2 + 0.5z + 2 w

w は標準正規分布していて、z はもし治療を受ければ1の値をとり、受けなければ0の値をとります。x は生存した月数です。

この場合、どのようにして生存率を計算したらいいのでしょうか。例えば治療を受けた場合、1ヶ月以上の生存する確率はいくらになりますか。

もし回帰分析のモデルがなかった場合にはログ正規分布に対する生存率関数を使って求められるのですが、この回帰モデルがある場合、それをどのように使ったらいいのかがわかりません。

ありがとうございます。
>>[324]
wは正規分布誤差なので、生存率の期待値には影響しません。
ご質問の例では、y の期待値は 2 + 0.5×1 = 2.5、x の期待値は exp(2.5) ということになります。
>>[325] 、早速のご返答ありがとうございます。

期待値に関しては理解できましたが、1ヶ月以上のの生存確率はどのように求めらいいのでしょうか?
>>[326]
今度は y が期待値 2.5、標準偏差 2 の正規分布になるので、その値が 0 以上 (ln 1 = 0 なので) になる確率を考えればよいでしょう。標準正規分布に換算すると、(0 - 2.5)/2 以上になる確率ということになります。
>>[328]

返答ありがとうございました。yの分布を考えればよかったんですね。
ご助言をお願い致します。

15分間隔12時間採血して得られた血中ホルモン濃度の波形を解析したいと考えています。
波形を構成する要因を分け、コンピューターシュミレーションで波形を再現するモデルを作成するということをやってみたいのですが、どのような手順で進めたらよいのか分かりません。
時系列データの解析になるような気がするのですが。。。
基本的な解析の流れや、参考書など教えて下さい。

よろしくお願いいたします。
またまた質問です。

指数分布から取り出したものの合計はガンマ分布をするのですが、もし指数分布のパラメターがa + bだった場合、その合計のガンマ分布の平均値はどのようになりますか。いろいろ専門書やネットで調べているのですが、統一した答えが出ません。教えていただければ幸いです。

ありがとうございます。
>>[330]
 この分野は詳しくありませんが、周期性の検出なのでフーリエ解析でしょうね。寄与が小さい周期(ノイズ)を切り捨ててモデル化、でしょうか。
>>[331]
 指数分布のパラメータはθ=1/λ1つだけなので、θ=a+bならばそのままk(a+b)、λ=a+bならばk/(a+b)ではだめなのですか?kは指数分布に従う変数を合計する数です。
>>[332]

早速ご回答いただき、ありがとうございます。

フーリエ解析、やったことがないので、まず勉強してみます。

>>[333]

返答ありがとうございます。僕もそのように考えていたのですが、あるウェブサイトでは違ったように書かれていたので疑問に思い質問しました。実際は

E[1/(指数分布する Ti の合計(n個))]

で、それが (a+b)/n-1 と表記されています( (a + b)が指数分布のパラメターです) 。ここでの指数分布は以下のように設定されています。

(a+b) exp (-t (a+b))

t はここでは時間となります。

これは間違っているのではないかと思うのですが、どうでしょうか?僕は 1/n(a+b) が正しいのではないかと思っているのですが。
>>[335]
 これはちょっとわからないのですが、1つだけ明らかなのは、逆数の期待値は期待値の逆数とは一致しないということです。
 テイラー展開をしてみると何かわかるかもしれません。(指数分布する Ti の合計(n個))の期待値であるn/(a+b)の周りでテイラー展開をすると、第0項は(a+b)/nに一致しますが、バイアスを示す第2項が{x-n/(a+b)}^2/{n/a+b)}~3 になります。分子の期待値がガンマ分布の分散n/(a+b)^2なので、この期待値は(a+b)/n^2になります。第0項に加えると(a+b)(n-1)/n^2になりますが・・・上記の値とは一致しない!
>>[339]

大変ありがとうございます。逆数の期待値が期待値の逆数とは一致しないということで、ガンマ分布の逆数の期待値をインターネットで調べたら、なぜ上記の期待値になるのかがわかりました。これですっきりしました。

>>[340]
 ちょっと計算してみたのですが、どうしても335のような結果になりません。このことが掲載されていたウェブページを教えていただけないでしょうか?
>>[341]

返信が大変遅くなってしまい申し訳ございません。

英語になりますが、以下のものの最初の1ページをを参照にして計算しました。

http://www.johndcook.com/inverse_gamma.pdf
>>[342]
ありがとうございます。
暇を見て検討させていただきます。
こういう議論は質問される方も勉強になります。また何か面白いネタがあれば上げてください。
適合度検定の方法を教えてください。カイ自乗統計量による方法ではないものを探しています。具体的には、指数分布と一様分布について、アンダーソンダーリング検定のような方法を使いたいのです。正規分布の場合はネット上に情報があったのですが、一般の分布の場合の方法が分かりません。よろしくお願いいたします。
心理統計学、統計学の問題が解けるという方いらっしゃいましたらメッセージ下さいm(__)m
よろしくお願いします。
COX比例ハザードモデルについて、その比例仮定が満たされているかいろいろなテストを行っているのですが、テストの種類によって満たしていない変数が違ってくるのですが、この場合どうすればいいのでしょうか?例えば、あるテストでは変数A,B,とCが満たしていないと判定して、違うテストでは変数A,B,D,とEが満たしていないと示した場合、どの変数が満たしていないと判断したら言いのでしょうか。グラフでのチェックを含む、3−4種類のテストを行っています。変数A,B,C,D,とE全てが仮定を満たしていないと考えていいのでしょうか。

ありがとうございます。
 
はじめまして。
統計について知識がないため、質問させていただきたいです。

ここ mixiで、例えば3万5千人ほどのコミュニティのアクティブユーザーに、何かイエスorノーの質問をする場合、何名くらいの回答を得たら、コミュニティ内アクティブユーザー全体の回答内容と近いものになるのでしょうか?

ちなみに mixiは近年データを公表していないそうで、ユーザー数やアクティブユーザー数については以下リンクのようです。

登録会員数はさらに増加で2711万人、しかし幽霊会員率も44.2%に…mixi動向(ユーザー数とアクティブユーザー、2012年3月) : ガベージニュース
http://www.garbagenews.net/archives/1929847.html

となたか、よろしくお願いします。
 
>>[347]
 2年ぶりくらいに来てみたら、最近の質問で答えられそうなものが上がっていましたので、お答えします。
 アクティブユーザーという母集団から、完全にランダム・サンプリングができると仮定します。イエスの母比率をP、サンプル数をnとすれば、サンプルから算出されるイエスの比率pは P(1-P)/n の分散σ^2をもつことになります。標準偏差σはその平方根、nPあるいはn(1-P)の小さい方の値が十分に大きければ、pの値は95%の確率でP±1.96σの範囲に収まります。
例えば、P=0.5、n=100であればσ=0.05、pは95%の確率で0.40〜0.60の範囲に収まることになります。P=0.2、n=400であれば、pは95%の確率で0.16〜0.24の範囲に収まることになります。
もっともこれは、理想的なランダム・サンプリングが行われた場合であって、実際には回答者の傾向が母集団からずれることが多いので、そこまでの信頼度は得られません。
>>[350]
ご返信、ありがとうございました。
参考にさせていただきます。

ログインすると、残り320件のコメントが見れるよ

mixiユーザー
ログインしてコメントしよう!

統計家 更新情報

統計家のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング