群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習2009年度第4回「標本統計量と母数推定」課題

2009年11月2日

(注)前回の課題の解答例は,http://phi.med.gunma-u.ac.jp/medstat/it2009-03r.htmlに示してあります。

課題

下のコードは,10000人(男女5000人ずつ)の母集団データをファイルsample04.txtからデータフレームdatに読み込み,身長を意味する変数HTについて男女別に(変数SEXごとに)サイズ10とサイズ100の標本(サンプル)を抽出する数値実験である。この画面で範囲選択コピーしてから,R Consoleのプロンプトにペーストすれば実行できる。

なお,最初の2行は,ランダムな標本抽出を行うために,まずRNGkind("Mersenne-Twister")によって乱数生成アルゴリズムをメルセンヌツイスター法に指定し(注:乱数については,このページを参照されたい),set.seed(54321)によって乱数を初期化しているものである。このことによって,解答者全員がまったく同じサンプリングを行うことができる。

RNGkind("Mersenne-Twister")
set.seed(54321)
dat <- read.delim("http://phi.med.gunma-u.ac.jp/medstat/sample04.txt")
malesHT <- dat$HT[dat$SEX=="M"]
femalesHT <- dat$HT[dat$SEX=="F"]
s10M <- sample(malesHT,10)
s100M <- sample(malesHT,100)
s10F <- sample(femalesHT,10)
s100F <- sample(femalesHT,100)

この数値実験で得られたデータに基づいて,以下の内容を実行せよ。1.と2.と3.については解答フォームの上の欄にRのコードを貼り付け,4.については解答フォームの下の欄に文章で考察せよ。学籍番号と氏名を忘れないこと。

  1. 男女それぞれについて,母集団での身長(malesHT及びfemalesHT)の平均値を求めよ。
  2. 男女それぞれについて,サイズ10の標本(s10Mとs10F)から推定される母集団の身長の平均値と95%信頼区間を求めよ。
  3. 男女それぞれについて,サイズ100の標本(s100Mとs100F)から推定される母集団の身長の平均値と95%信頼区間を求めよ。
  4. 母集団での身長の真の平均値と,サイズ10の標本から推定された平均値及び95%信頼区間とサイズ100の標本から推定された平均値及び95%信頼区間を比べて考察せよ。

解答フォーム

項目入力欄
学籍番号
氏名
メールアドレス
解答(1.と2.と3.を実行するRのコード)
解答(4.の考察)