群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習第5回「データの分布と検定の概念」課題

2009年11月9日

(注)前回の課題の解答例は,http://phi.med.gunma-u.ac.jp/medstat/it2009-04r.htmlに示してあります。

課題

第1回に入力されたデータを元に加工して作成し第2回,第3回の課題で使ったsample02.txtを読み込み,BMIの値が正規分布しているかどうか男女別に検定するコードを書き,実行して結果を考察せよ。なお,検定の有意水準は5%とする。学籍番号・氏名とともに,下のフォームにRのコードと考察を貼り付けて送信すること。

(注)なお,帰無仮説にデータが一致しすぎている場合もあって,そういう場合は捏造あるいは都合のいいデータだけを使った可能性を疑うべきである。有名な例はメンデルのエンドウマメであり,偶然のばらつきもあるはずなのに,それが極端に少なく,データが分離の法則に一致しすぎていたとフィッシャーが指摘している。他の例としては,第二水俣病発覚当時,昭和電工が出してきた上流域住民の毛髪中水銀濃度の分布が,対照地域の住民の毛髪中水銀濃度の分布と一致しすぎていたことが挙げられる。水銀汚染がないといいたいがために,差がなさ過ぎるデータを作ってしまったのであろうと言われている(出典:田栗正章・藤越康祝・柳井晴夫・C.R.ラオ『やさしい統計入門』講談社ブルーバックス)。

解答フォーム

項目入力欄
学籍番号
氏名
メールアドレス
解答(Rのコード)
解答(考察)