群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
第1回,第2回,第6回に用いたp02-2008.txtを読み込み,所得の不均衡度が高い国(EU=="Uneven")と所得の不均衡度が低い国(EU=="Egaritarian")の間で,平均寿命(LIFEEXP)に差がないという仮説を,適切な作図をした上で,何らかのノンパラメトリックな方法を用いて有意水準5%で検定せよ(第6回の課題ではWelchの検定を行ったが,平均寿命の分布はかなり歪んでいるので,ノンパラメトリックな検定の方がおそらく頑健である)。
学籍番号・氏名とともに(注:絶対に忘れないこと!),下のフォームにRのコードと考察を貼り付けて送信せよ。
Rのコードは例えば以下のようになる。
dat <- read.delim("http://phi.med.gunma-u.ac.jp/medstat/p02-2008.txt") attach(dat) boxplot(LIFEEXP ~ EU, xlab="所得の不均衡度によるグルーピング", ylab="平均寿命", main="世界の国を所得の不均衡度で2群に\n分けたときの平均寿命の比較") wilcox.test(LIFEEXP ~ EU) detach(dat)
1行目はデータをdatというデータフレームに読み込んでいる。2行目はそのデータフレームをattach()して一々データフレーム名を入力しなくても,そのデータフレームが含んでいる変数を参照できるようにしている。次のboxplot()により上のグラフが描かれる。さらにその次のwilcox.test()により下記の出力が得られ,所得の不均衡度で分けた2群間で平均寿命に差がないという帰無仮説の検定結果として,有意確率(p-value)が0.01294と0.05より小さいので,有意水準5%で帰無仮説は棄却され,所得の不均衡度によって平均寿命には有意な差があったといえる。なお,最後にdetach()しているのは,データフレームをattach()した解析が終わった後の作法である。
Wilcoxon rank sum test with continuity correction data: LIFEEXP by EU W = 2167.5, p-value = 0.01294 alternative hypothesis: true location shift is not equal to 0