群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習:2011年度第1回課題解答例

課題

http://phi.med.gunma-u.ac.jp/medstat/sample02.txtは,ソロモン諸島の首都のとある学校で実施した健診結果を,一昨年の実習で入力してもらった後にエラーを訂正したタブ区切りテキスト形式データである。

このファイルをRで読み込んで(ファイルとして読み込んでもいいし,ブラウザ上ですべてを選択コピーした後に,read.delim("clipboard")としても読める),str()関数により以下を調べよ。

さらに,そのままでいいのかどうか考察し,もしあれば感想・要望・質問などとともに下のフォームから送信せよ。学籍番号と氏名の入力を忘れないこと。

解答例

Rを起動しておいて,上記ファイルへのリンクをクリックし,全てを選択してから右クリックしてコピーし,str(read.delim("clipboard"))とRコンソールに打ち込めば,下記の出力が得られる。それを解釈すればよい。

'data.frame':   61 obs. of  14 variables:
 $ AGE    : int  15 20 21 22 22 23 23 24 24 24 ...
 $ SEX    : Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ...
 $ BMI    : num  28 22.3 24.6 23.7 27.9 23.2 26.4 21.7 31.6 21.5 ...
 $ PH     : num  5 6 7.5 6 6 6 6 6 6 6 ...
 $ SG     : num  1.01 1.01 1.01 1.03 1.01 ...
 $ MARITAL: Factor w/ 4 levels "Divorced","Married",..: 2 3 3 3 3 3 3 2 2 3 ...
 $ FEVER  : int  2 4 4 4 1 4 1 4 4 1 ...
 $ CQ     : int  4 4 4 2 4 4 4 4 4 4 ...
 $ BEDNET : int  2 4 4 4 4 4 4 4 2 3 ...
 $ BSUGAR : int  92 108 91 111 65 75 98 156 159 70 ...
 $ HB     : num  13.4 12.3 13.5 9.2 15.3 10.8 11.8 13.4 12.6 12.5 ...
 $ SBP    : int  125 103 119 101 117 101 116 113 117 110 ...
 $ DBP    : int  74 61 57 57 74 65 66 65 70 71 ...
 $ HR     : int  79 102 89 110 73 75 82 91 97 72 ...
項目解答解釈の根拠
サンプルサイズ61結果の1行目に"61 obs."とあるから。
変数SEXの型要因型$ SEX: Factor w/ 2 levelsとあるから。2つの水準をもつ要因型である。
変数BMIの型数値型$ BMI: numとあるから。
変数MARITALの型要因型$ MARITAL: Factor w/ 4 levelsとあるから。4つの水準をもつ要因型である。
変数BEDNETの型整数型$ BEDNET: intとあるから。
変数HBの型数値型$ HB: numとあるから。

考察としては次のようなことがいえる。SEX,BMI,MARITAL,HBの型は妥当だが,BEDNETの型が整数型なのは妥当でないかもしれない。「いつも利用」,「時々利用」,「使っていない」,「持っていない」という4つのカテゴリに整数を割り振っただけなので,等間隔な数値として扱ってしまうことには問題がある。例えばas.ordered()関数を使って順序型(より正確に言えば順序付き要因型)にする方が紛れが無い。

多かった質問・感想について

例年のことですが,ペースが速いというコメントとゆっくりだったというコメントがありました。できるだけコンピュータが苦手なために速く感じる人に合わせて丁寧に説明したいと思います(限度はあります)ので,ゆっくり過ぎて時間があまってしまう人は,周りの人に教えてあげるか,または講義内容のバリエーションを自分で試してみるなどしてください。

後ろのディスプレイはコンピュータにつながっていないので表示できません。スクリーンが見にくい人は,同じ画面を自分のコンピュータ画面でみて確認してください。


リンクと引用について