群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習第10回「クロス集計」課題

2009年1月5日

(注)前回の課題の解答例は,http://phi.med.gunma-u.ac.jp/medstat/it09-2008-r.htmlに示してあります。

課題

日本初の疫学小説である川端裕人『エピデミック』(角川書店)には,謎の感染症の原因をクロス集計を使って探って行く場面が登場する。エピローグに出てくるジャーナリストが書いた情報を元にして,生データを想像すると,epidemic.txtのようになっているはずである(もちろん,作品中ではこの情報の他にも,年齢とか職業とか怪しげなミネラルウォータを飲んでいたかどうかといった情報がとられたことになっていたが,数字を再構築できるのはこれだけ)。

データファイル中の変数名は以下の通りである。PLACEがヒトの居住地で,作中XSARSと名づけられた謎の感染症の患者が集団発生した「石畳」か,それ以外の「石畳外」のどちらかの値をとる。PETCATがペットとしてネコを飼っているかどうか(1が飼っているでことを示し,0が飼っていないことを示す),XSARSは謎の感染症を発症したかどうか(1が患者,0が罹らなかった人を意味する),TOUCHCATは野ネコとの接触を含めて,日常的にネコに接しているかどうか(1が日常的に接していて,0が接していないことを示す)。

このデータから,物語の筋に従い,(1)まず石畳地区と石畳以外の地区で別々にペットとしてネコを飼っているかどうかと感染症を発症したかどうかのクロス集計を行ってオッズ比を求め,(2)石畳地区で日常的にネコに接しているかどうかと感染症を発症したかどうかのクロス集計を行ってオッズ比を求め,結果を考察せよ。

可能なら,地区を層別因子としてクロス集計表の併合を行い,マンテル=ヘンツェルの共通オッズ比を求め,考察を加えよ。

学籍番号・氏名とともに(注:絶対に忘れないこと!),下のフォームにRのコードと考察を貼り付けて送信せよ。

解答フォーム

項目入力欄
学籍番号
氏名
メールアドレス
解答(Rのコード)
解答(考察)