群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習:第11回課題の解答例

課題

第1回,第2回,第6回に用いたp02-2008.txtを読み込み,所得の不均衡度が高い国(EU=="Uneven")と所得の不均衡度が低い国(EU=="Egaritarian")の間で,平均寿命(LIFEEXP)に差がないという仮説を,適切な作図をした上で,何らかのノンパラメトリックな方法を用いて有意水準5%で検定せよ(第6回の課題ではWelchの検定を行ったが,平均寿命の分布はかなり歪んでいるので,ノンパラメトリックな検定の方がおそらく頑健である)。

学籍番号・氏名とともに(注:絶対に忘れないこと!),下のフォームにRのコードと考察を貼り付けて送信せよ。

解答例

Rのコードは例えば以下のようになる。

dat <- read.delim("http://phi.med.gunma-u.ac.jp/medstat/p02-2008.txt")
attach(dat)
boxplot(LIFEEXP ~ EU, xlab="所得の不均衡度によるグルーピング", ylab="平均寿命", 
 main="世界の国を所得の不均衡度で2群に\n分けたときの平均寿命の比較")
wilcox.test(LIFEEXP ~ EU)
detach(dat)
世界の国を所得の不均衡度で2群に分けたときの平均寿命の比較

1行目はデータをdatというデータフレームに読み込んでいる。2行目はそのデータフレームをattach()して一々データフレーム名を入力しなくても,そのデータフレームが含んでいる変数を参照できるようにしている。次のboxplot()により上のグラフが描かれる。さらにその次のwilcox.test()により下記の出力が得られ,所得の不均衡度で分けた2群間で平均寿命に差がないという帰無仮説の検定結果として,有意確率(p-value)が0.01294と0.05より小さいので,有意水準5%で帰無仮説は棄却され所得の不均衡度によって平均寿命には有意な差があったといえる。なお,最後にdetach()しているのは,データフレームをattach()した解析が終わった後の作法である。

Wilcoxon rank sum test with continuity correction

data:  LIFEEXP by EU 
W = 2167.5, p-value = 0.01294
alternative hypothesis: true location shift is not equal to 0

リンクと引用について