ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

かる〜く統計学コミュのこんなときどうする?

  • mixiチェック
  • このエントリーをはてなブックマークに追加
統計で困ったら、ここに質問を書き込んでみましょう。

グータラ管理人や優秀なコミュニティのメンバーがヒントをくれるかもしれません。

ただし、「計算してくれ!」とかはダメです(自分でやりましょう)。

こんな時、どんな検定を使えばいい?という内容の質問でおねがいします。

コメント(278)

トピの方針にあってませんでしたので、修正します。

15000本全部を母集団と見ると、
標本値xは、範囲「平均±z値*標準偏差」内にあります。

ここでは、45mm±z値*標準偏差 です。

これは、
z= (x − 平均)/ 標準偏差
というZ変換が元になっています。
zは標準正規分布に従います。

zの下限値をz-、zの上限値をz+とすると、
z- ≦ z≦ z+ですので、
z- ≦ (x-平均)/標準偏差 ≦ z+
平均 + z-×標準偏差 ≦ x ≦ 平均 + z+×標準偏差
となります。

一般に|z-| = z+ = z と見なして、P値を算出しますので、

平均 - z×標準偏差 ≦ x ≦ 平均 + z×標準偏差  ・・・(1)

の範囲をxが取ります。

ところで、zは確率変数でしたので、
ある確率Pの時のz値は決まります。

あとは(1)と、45mm - 1mm ≦ x ≦ 45mm + 1mm・・・(2)
を比較しながら、
正規分布表を参照すれば答えが導けると思いますよ。
>238

これ、zを求めて、それが何%になるかを正規分布表から求める問題じゃないですかね?
最初から90%とアタリをつけるのは乱暴かと。

手順としては・・・

0.6*z = 1
z = 1.666..
z = ~1.67 (四捨五入)

正規分布表より、zが1.67のときの標準正規分布の面積が0.9525(片側)なので、
ボツになるネジの数は2*(1-0.9525)=0.095
15000*0.095 = 1425

販売できないネジの数はおよそ1425本
(zが1.66としたときは1455本となったので、正確には1425本〜1455本の間)

Excelの結果はどうでした?>ちささん
>241さん

>最初から90%とアタリをつけるのは乱暴かと。

確かにそうですね。すみません。

>手順としては・・・

なるほどですね。ありがとうございました。
> 244

>下限と上限の間にあるネジの割合は
>0.95221−0.04779=0.90442
>商品にならないのは 1-0.90442=0.09558

正規分布は左右対称なので、0.04779を2倍すれば0.09558になりますね(一枚目の図参照)

>http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
>の表を使っても計算は可能なのでしょうか?

可能です。要は一枚目の図でいうところの赤色の部分の面積を求めれば良いのですが、ちささんが引用した標準正規分布表は、半分の面積しか載っていないので、表から求めた面積を正規分布半分の面積(0.5)から引き、それを2倍すれば良いです(2枚目の図参照)。

計算すると、

zが1.67の時の面積は標準正規分布表より0.4525。
2*(0.5-0.4525) = 0.0095

15000*0.095 = 1425(本)となります。
はじめまして。
さっそくですが質問が2つほどあります。

1つ目は確率の問題です。
「袋の中に1から10までの番号を記入した球があり、1から6までが赤球で7から10までが黒球である。この袋から任意に1個の球を取り出すとき、3の赤球であるような確率はいくらか」
答えは1/10だと思ったのですが、解答には1/10÷6/10=1/6とありました。なぜ÷6/10するのかわかりません。

2つ目は確率分布の問題です。
「正常なサイコロを2回投げる実験を考える。確率変数Xをサイコロの目の数の和と定義するとき、平均値.分散.標準偏差を求めよ」
基本的なところでつまずいています。分散や標準偏差を求める式を見てもなかなか理解できません…。

わかる方いましたらよろしくお願いします。
> どろんさん

お答えいただきありがとうございます。

あっ!無意識に球は全部で10個だと思っていましたが1個ずつとは書いていませんね…。
しかしそれでもなぜ6/10するのかよくわからないです…。
> あっちゃん

確率の問題ですが、問題の原文そのままですか?
「3の赤球であるような」ではなくて、「3もしくは赤球であるような」確率ではないでしょうか?
それだと解答と整合とれるのですが。

管理人さん。

最近の質問、だんだんトピの趣旨から離れているような気がするのですが、答えないほうがいいですかね?
> どろんさん

「〜この袋から任意に1個の球を取り出すとき、その球の色は赤であった。そのとき抽出された球が3であるような確率はいくらか」が原文です。
> あっちゃん

球が赤だと分かった時点からの3の確率なんだ。

赤い球は六個だから、答えが1/6ってのは感覚的に理解できるけど、何で割るのかよくわかりませんね。

ググりました…

○○を知った条件での××の確率の事を『条件付き確率』というらしいです。

あとは自分で調べて下さい。
コミュニティメンバーのみなさんへ

このトピックの書き込みが当初の方針からかけ離れているという意見がありました。

そのため、応用編・基礎編の二つのトピックを作りました。

今後はこちらを使ってください。

応用編(研究に使う統計手法の選択に迷ったとき)
これ、どうしよ?
http://mixi.jp/view_bbs.pl?id=50157400&comment_count=0&comm_id=1803039

基礎編(計算式もOKな、統計初学者向けトピック)
あれ?どうだったっけ?
http://mixi.jp/view_bbs.pl?id=50157696&comment_count=0&comm_id=1803039


このトピックの再利用法はまた考えます。
> あっちゃん

新トピが立ちましたので、247の最初の質問の回答を基礎編にUPしました。
学校の課題で困っています。

統計データを探し、その中からカテゴリーデータと数量データを抜き出しなさい。
カテゴリーデータからは単純集計表を、数量データからは度数分布表を作成し、表から解釈できる事をまとめなさい。

という課題なのですが、やりやすい統計データとかありますか?

お願いm(__)m
M(・∀・)† さん
M(・∀・)† さんの周りにあったり、ニュースなどで使われている統計データだったらほとんど、なんでも大丈夫だと思いますよ。
気象データ、何かの売り上げ、患者の数などいろいろあると思いますよ。
> M(・∀・)†さん

身近なところでは

mixiのジャンル別コミュの数

コミュの会員数

とか…
はじめまして、ちょっと質問させていただきます!

チョコボールで金のエンゼルの出る確率を調べるのに必要な標本数はいくらになるでしょうか。

都市伝説的には、チョコボールで金のエンゼルは1000個に1個出るそうです。
信頼度を95%として
チョコボールを無限母集団と考えると
必要な標本数nは

n>=1/e/z*e/z*1-1/p(p-1)

e=0.05
z=1.96
p=0.001

になると思うのですが、これで計算すると、標本数が1000個より小さく明らかに少ないです。

というか母比率が小さくなっていくと必要な標本数がどんどん小さくなってしまうのですが・・・

どこが間違っているのでしょうか?

すごくどうでもいいことなのですが、気になってしまってあせあせ
spincity@CR-Z さん
誤差eの値が大きすぎるのではないでしょうか?
誤差eは、0.001〜0.0005程度に設定すべきじゃないでしょうか?
eの値は、予測される母平均(この場合1/1000)−標本平均で決めます。
品川モンビランさん

「その数に何の意味があるの?」との答えとしては、
「その集団の特徴を表す数値の一つ」というのでどうでしょうか?
ある人を表す特徴として、身長・体重・年齢・性格などいろいろなパラメータがあるのと同じで
平均は集団をいろいろな面からみた特徴の一つだと思います。
実際、平均値自体はデータの合計をデータ数割ったものという以上の意味を持ちませんし。
中央値、最小値、最大値、最頻値、分散と同等な物です。
平均や標準偏差と絡めると・・・というのは分布型を限定した特殊な場合なので別なお話しだと思います。

平均年収は、ん〜自分は平均より高いから満足、満足としか言えないですよね。
平均年収が昨年より10万円上がった、景気よくなりつつあるのかな?くらいの使い方ならそれなりに適切かもです。
現在卒業研究をしています。超初心者なので初歩的な質問ですがよろしくお願いします。

実験研究で、被験者に2回ストレス負荷試験を受けてもらいました。そのうち1回はアロマを使用し、1回は何もない状態で実施しました。

2回とも実施の前後に様々な測定を行ったのですが、今回の研究ではアロマを使用した事がこれらの測定結果に影響を与えているか見たいと思います。

測定値は実施前からかなり個人差があるので、測定値そのものではなく実施前後の変化量を使ってアロマの効果を明らかにしたいと思います。

様々な本を読んで自分なりに考えた所、この場合対応のあるt検定を用いて分析しようと考えたのですが、他により適した分析方法はありますか?また、t検定は測定値そのものではなく実施前後の差の比較でも大丈夫でしょうか?

よろしくお願いします
指導教官の言うことに従うのがいいと思います
> はっしーさん
ご意見ありがとうございますぴかぴか(新しい)おっしゃる通りだとおもいますが、指導教員が忙しいとの理由で2ヶ月先まで指導の時間をとってもらえず、メールでの相談にも対応してもらえない状態です。

2ヶ月後からはいくらでも指導すると言われているのですが、2月には資格試験(これに落ちると内定取消ですあせあせ(飛び散る汗))もあり、12月から分析を始めると1月の提出期限にはどう考えても間に合いません涙バッド(下向き矢印)

このような理由から非常に困っていますので、少しでも詳しい方がいましたら回答いただけると幸いですがまん顔
はじめまして。今、通信の大学で研究論文の計画書を作成中です。全く統計学については無知で、 本を読んでもネットで検索しても分からずmixiのコミュニティーの皆様に頼る他ない状況ででお恥ずかしいのですが、よろしくお願いします。努力不足は承知なのですが…
200名の方にアンケートで質問をして、その中の何パーセントの方が、何番の内容を選んでどの番号の内容から順に多いか調べたいのですが、それは統計なのでしょうか?そんなレベルですみません。
>aya<さん
 正規分布するのなら差の比較でも大丈夫だと思います。

りぃかさん
 立派に統計ですよ。

メダルさん
 男女の差はx2乗検定、年齢の差はt検定でどうでしょうか?
 エクセルで十分できますよ。
> うたちゃんさん
ありがとうございます電球
とても助かりましたがまん顔ぴかぴか(新しい)
うたちゃんさんありがとうございました!
すいません。
ご質問お願いします。

現在職場で、セレデーションラインを引いてと言われたのですが、調べても出てこなくて困っております、、
回帰直線のことかと思ったのですが違うのでしょうか??

また、回帰直線と違似直線は違うものなのでしょうか?

ど素人で申し訳ありません。
すいませんが、偏差値の出し方と意味がよくわかりません。
誰が教えていただけたらうれしいです
>>[277]
https://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE

ログインすると、残り248件のコメントが見れるよ

mixiユーザー
ログインしてコメントしよう!

かる〜く統計学 更新情報

かる〜く統計学のメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。