群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習:2010年度第1回課題解答例

課題

http://phi.med.gunma-u.ac.jp/medstat/sample02.txtは,ソロモン諸島の首都のとある学校で実施した健診結果を,昨年の実習で入力してもらった後にエラーを訂正したタブ区切りテキスト形式データである。

このファイルをRで読み込んで(ファイルとして読み込んでもいいし,ブラウザ上ですべてを選択コピーした後に,read.delim("clipboard")としても読める),str()関数により以下を調べよ。

さらに,そのままでいいのかどうか考察し,もしあれば感想・要望・質問などとともに下のフォームから送信せよ。学籍番号と氏名の入力を忘れないこと。

解答例

項目入力欄
サンプルサイズ61
変数SEXの型Factor w/ 2 levels of "F", "M" ("F"と"M"という2つの水準からなる要因型)
変数BMIの型num(数値型)
変数MARITALの型Factor w/ 4 levels of "Divorced", "Married", ..("Divorced","Married"など4つの水準からなる要因型
変数BEDNETの型int(整数型)
変数HBの型num(数値型)
考察BEDNET以外の型は妥当である。しかしBEDNETの型は整数型になっているが,意味からすればカテゴリなので,要因型に変換すべきである。

要望・質問

後ろから見えないので、後ろの画面にも映してほしい。
後ろの画面はDVD/Blu-Rayの再生専用のようで,コンピュータにつながっていませんので無理です。
エクセルの使い方が分からないので、説明してほしい。
すみませんが時間的に無理です(世の中にExcelの参考書はたくさんあると思うので,それを参考にしてください)。たぶん今後の演習の中でExcelを使うことはほとんどないと思います。
次の駒にも授業が入っているので、できるだけ早い授業展開を希望します/できれば課題に取り組む時間を十分に取っていただきたいです。
努力します。そのためには定刻に開始したいので,遅刻する人がいないようにしてください。
もう少しだけ、ゆっくり進めてくださるとついていけそうです。
たぶんこれ以上ゆっくりにすることは無理です。テキストがweb上あるいは書籍の形で事前アクセス可能なので,できたら予習としてテキストに目を通してきてください。
PCの起動が遅いので対策を講じることを、所望します/どうもパソコンが正常に動きません。pc67なのですが、エクセル、ワードが開かない上、ネット、pdfもすぐにフリーズします。
演習室のコンピュータはメディアセンターしかメンテナンスできないので……。10月1日から4日にかけてメディアセンターによりメンテナンスがされたはずなので,改善したと思うのですが,どうでしょうか?
なお,OSがVistaであることが遅さの大きな原因なので,7にバージョンアップしてほしいという改善要望を出したのですが,インストール済みのアプリケーションがたくさんあって,それが7で正常動作するかどうかの確認がすぐにはとれないので,すぐにはバージョンアップできないそうです。
やり方を各々のディスプレイに表示してほしいです。
残念ながら演習室のコンピュータにはそういうソフトが入っていないので無理です。そういうネットワークになっていないので,次期システム更新までは無理だと思います。
質問ですが、変数MARITALの型に関して、R上では二つ略されていますが今後は全部書いたほうがいいのでしょうか?
型としては"Factor w/? levels"という部分,即ち「?個の水準からなる要因型である」ということだけで十分で,個々の水準名を答える必要はありません。ちなみに,個々の水準名を知りたい場合,データをdatというオブジェクトに付値したとすると,table(dat$MARITAL)またはxtabs(~MARITAL, data=dat)と打てば,すべての水準名と,それぞれの水準に属する人の人数が表示されます。度数分布表といいます。要因型のカテゴリ変数について度数分布を求めるための関数の代表的なものがtable()xtabs()です。

リンクと引用について