群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
http://phi.med.gunma-u.ac.jp/medstat/sample02.txtは,ソロモン諸島の首都のとある学校で実施した健診結果を,一昨年の実習で入力してもらった後にエラーを訂正したタブ区切りテキスト形式データである。
このファイルをRで読み込んで(ファイルとして読み込んでもいいし,ブラウザ上ですべてを選択コピーした後に,read.delim("clipboard")としても読める),str()関数により以下を調べよ。
さらに,そのままでいいのかどうか考察し,もしあれば感想・要望・質問などとともに下のフォームから送信せよ。学籍番号と氏名の入力を忘れないこと。
Rを起動しておいて,上記ファイルへのリンクをクリックし,全てを選択してから右クリックしてコピーし,str(read.delim("clipboard"))とRコンソールに打ち込めば,下記の出力が得られる。それを解釈すればよい。
'data.frame': 61 obs. of 14 variables: $ AGE : int 15 20 21 22 22 23 23 24 24 24 ... $ SEX : Factor w/ 2 levels "F","M": 1 1 1 1 1 1 1 1 1 1 ... $ BMI : num 28 22.3 24.6 23.7 27.9 23.2 26.4 21.7 31.6 21.5 ... $ PH : num 5 6 7.5 6 6 6 6 6 6 6 ... $ SG : num 1.01 1.01 1.01 1.03 1.01 ... $ MARITAL: Factor w/ 4 levels "Divorced","Married",..: 2 3 3 3 3 3 3 2 2 3 ... $ FEVER : int 2 4 4 4 1 4 1 4 4 1 ... $ CQ : int 4 4 4 2 4 4 4 4 4 4 ... $ BEDNET : int 2 4 4 4 4 4 4 4 2 3 ... $ BSUGAR : int 92 108 91 111 65 75 98 156 159 70 ... $ HB : num 13.4 12.3 13.5 9.2 15.3 10.8 11.8 13.4 12.6 12.5 ... $ SBP : int 125 103 119 101 117 101 116 113 117 110 ... $ DBP : int 74 61 57 57 74 65 66 65 70 71 ... $ HR : int 79 102 89 110 73 75 82 91 97 72 ...
項目 | 解答 | 解釈の根拠 |
---|---|---|
サンプルサイズ | 61 | 結果の1行目に"61 obs."とあるから。 |
変数SEXの型 | 要因型 | $ SEX: Factor w/ 2 levelsとあるから。2つの水準をもつ要因型である。 |
変数BMIの型 | 数値型 | $ BMI: numとあるから。 |
変数MARITALの型 | 要因型 | $ MARITAL: Factor w/ 4 levelsとあるから。4つの水準をもつ要因型である。 |
変数BEDNETの型 | 整数型 | $ BEDNET: intとあるから。 |
変数HBの型 | 数値型 | $ HB: numとあるから。 |
考察としては次のようなことがいえる。SEX,BMI,MARITAL,HBの型は妥当だが,BEDNETの型が整数型なのは妥当でないかもしれない。「いつも利用」,「時々利用」,「使っていない」,「持っていない」という4つのカテゴリに整数を割り振っただけなので,等間隔な数値として扱ってしまうことには問題がある。例えばas.ordered()関数を使って順序型(より正確に言えば順序付き要因型)にする方が紛れが無い。
例年のことですが,ペースが速いというコメントとゆっくりだったというコメントがありました。できるだけコンピュータが苦手なために速く感じる人に合わせて丁寧に説明したいと思います(限度はあります)ので,ゆっくり過ぎて時間があまってしまう人は,周りの人に教えてあげるか,または講義内容のバリエーションを自分で試してみるなどしてください。
後ろのディスプレイはコンピュータにつながっていないので表示できません。スクリーンが見にくい人は,同じ画面を自分のコンピュータ画面でみて確認してください。