群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
carライブラリに含まれているデータフレームWomenlfは,1977年に263人のカナダ人女性を対象として調査した,労働参加状態(変数partic,3つの値fulltimeかnot.workかparttimeのどれかをとる),夫の年収(変数hincome,単位は1000カナダドル),子供の有無(変数children,absentかpresentのどちらか),居住地域(変数region,Atlantic,BC,Ontario,Prairie,Quebecのどれか)についてのデータである。このデータフレームを使って,女性の労働参加状態によって夫の収入に差があるかどうか,あるとしたらどの群とどの群の間で差があるのかを検討せよ。検定を行う場合は,有意水準は5%とする。
学籍番号・氏名とともに,下のフォームにRのコードと考察を貼り付けて送信せよ。
library(car) str(Womenlf) attach(Womenlf) stripchart(hincome ~ partic, method="jitter", vert=T, main="Husband's income by wife's working status.") mx <- tapply(hincome,partic,mean) sx <- tapply(hincome,partic,sd) ix <- 1:length(table(partic))+0.1 points(ix,mx,pch=18) arrows(ix,mx-sx,ix,mx+sx,code=3,angle=90) bartlett.test(hincome ~ partic) oneway.test(hincome ~ partic) pairwise.t.test(hincome,partic) TukeyHSD(aov(hincome ~ partic)) detach(Womenlf)
上記コードを実行すると,以下の出力が得られる。
図を見ると,1977年のカナダ女性では,女性の労働参加状態によって,夫の収入の平均値には差がありそうである。ばらつき具合をbartlett.test()でチェックした結果は,下記の通り有意な差は認められなかった。
data: hincome by partic Bartlett's K-squared = 3.9325, df = 2, p-value = 0.1400
Welchの拡張による一元配置分散分析の結果は,下記の通り,女性の労働参加状態を示す変数が,夫の収入に有意な効果を示した(参考:結果は示さないが,通常の一元配置分散分析でも同様に有意である)。
data: hincome and partic F = 7.5844, num df = 2.000, denom df = 97.827, p-value = 0.0008666
次にどの労働状態とどの労働状態の間で夫の収入に差があるのかをみるため,多重比較を行う。まず,holmの方法で検定の多重性を調整したt検定の結果は,
fulltime not.work not.work 0.0025 - parttime 0.0115 0.7630
となり,まったく働いていない女性とパート勤務をしている女性の間では夫の収入に差がないという帰無仮説は棄却されないが,フルタイムで働いている女性は,まったく働いていない女性とも,パート勤務をしている女性とも夫の収入が有意に異なることがわかった。念のため,TukeyのHSDを実行すると下記の結果が得られ,同様の結論を得る。
diff lwr upr p adj not.work-fulltime 3.5200391 1.0670259 5.973052 0.0023818 parttime-fulltime 3.8917749 0.5975228 7.186027 0.0158117 parttime-not.work 0.3717358 -2.5315125 3.274984 0.9510350