群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
途上国のある村で年齢階級別の人口と死亡数を調べた結果,以下の表が得られたとする。作図した上で,年齢階級によって死亡率に差があるか検定せよ。もし有意だったら,どの年齢階級とどの年齢階級に差があるのか検討せよ。なお,検定の有意水準は5%とする。
年齢階級 人口 1年間の死亡者数 30歳未満 320 24 30歳〜49歳 120 12 50歳以上 110 22 学籍番号・氏名とともに(注:絶対に忘れないこと!),下のフォームにRのコードと考察を貼り付けて送信せよ。
dead <- c(24,12,22) pop <- c(320,120,110) names(pop) <- c("-30","30-49","50-") barplot(dead/pop) prop.test(dead,pop) pairwise.prop.test(dead,pop)
上記コードを実行すると,以下の出力が得られる。
グラフを見ると,50歳以上で死亡率が高いようにみえる。prop.test()により3群の死亡率に差がないという帰無仮説を検定した結果は,以下の通り帰無仮説は有意水準5%で棄却され,統計学的に有意な差があるといえる。
3-sample test for equality of proportions without continuity correction data: dead out of pop X-squared = 13.6074, df = 2, p-value = 0.001110 alternative hypothesis: two.sided sample estimates: prop 1 prop 2 prop 3 0.075 0.100 0.200
次にどの年齢階級とどの年齢階級の間に差があるのかを見るため,pairwise.prop.test()関数を使い,Holmの方法で検定の多重性を調整した比率の差の検定を行うと,以下の結果が得られ,30歳未満群と50歳以上群の間で,死亡率に有意差がある(p=0.0015)ことがわかった。
Pairwise comparisons using Pairwise comparison of proportions data: dead out of pop 1 2 2 0.5113 - 3 0.0015 0.1027 P value adjustment method: holm