群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
2010年2月1日
(注)前回の課題の解答例は,http://phi.med.gunma-u.ac.jp/medstat/it2009-12r.htmlに示してあります。
pcancer.txtは,大橋,浜田(1995) の付録A.3に掲載されている膵臓癌データを入力してタブ区切りテキストファイルとして公開してあるものである。以下は,このデータを読み込んでデータの型などを設定し,生存時間分析ライブラリsurvivalをロードしてから,survfit()関数でカプラン=マイヤ法により観察打ち切りを考慮しつつ術中放射線照射の有無別に生存曲線の推定を行い,最後にログランク検定により術中放射線照射の有無により生存時間に差はでないという帰無仮説を検定するRのプログラムである。
dat <- read.delim("http://phi.med.gunma-u.ac.jp/medstat/pcancer.txt") dat$CENSOR <- 1-dat$CENSOR dat$SEX <- factor(dat$SEX, labels=c("男性(Males)","女性(Females)")) dat$TREAT <- factor(dat$TREAT, labels=c("照射なし(without irradiation)","照射あり(with irradiation)")) dat$CH <- ordered(dat$CH,labels=c("CH0","CH1","CH2","CH3")) dat$STAGE <- ordered(dat$STAGE,labels=c("III","IV")) dat$PS <- ordered(dat$PS,labels=c("0,1","2","3","4")) # data from 大橋・浜田(1995)「生存時間解析 SAS による生物統計」東京大学出版会付録A.3 # 膵臓がんデータ(Nishimura et al. 1988. の一部) # 手術中放射線照射の延命効果をみる目的のデータだがランダム割付ではない。 # 入力 Minato Nakazawa 20/1/2007 * R では死亡が1 なのでCENSOR のカテゴリに注意。 # *** 変数リスト*** # CASENO 患者番号 (Number of patient) # TIME 生存時間(月) 連続量 (Survival time in months) # CENSOR 打ち切りの有無を示すフラグ # (元データでは打ち切りが1,死亡が0 でR と逆なので1 から引く) # (The flag indicates the record being censored (0) or not (1)) # (* Original data takes opposite coding, so subtracting from 1 in this code) # AGE 手術時の年齢 連続量 (Age at operation) # SEX 性別 0 が男性,1 が女性 (Sex, 0 is male, 1 is female) # TREAT 処置法 0 が術中照射無し,1 が術中照射あり # (Treatment, 0 without irradiation during operation, 1 with it) # BUI 占拠部位 0 が頭部,1 が頭部以外 # (Occupied area, 0 head. 1 other) # CH 膵内胆管への浸潤 順序尺度 1:CH0,2:CH1,3:CH2,4:CH3 # (extent of invasion into intrapancreas bile tract) # P 腹膜播種性転移 0 がなし,1 があり # (metastasis spreading over peritoneum, 0: no, 1: exist) # STAGE TNM 分類のステージ 順序尺度 3:III 期,4:IV 期 # (stage of TNM criteria) # PS Performance Status(活動度) 順序尺度 1:0,1,2:2,3:3,4:4 library(survival) print(KM <- survfit(Surv(dat$TIME,dat$CENSOR) ~ dat$TREAT)) plot(KM, lty=1:2) legend("topright",lty=1:2,legend=levels(dat$TREAT)) survdiff(Surv(dat$TIME,dat$CENSOR) ~ dat$TREAT)
このコードをRで実行し,下のフォームに,学籍番号・氏名とともに出力結果の解釈を記入して送信せよ。なお,検定の有意水準は5%とする。
pcancer.txt is a tab-separated text file, based on the pancreas cancer data (cited from Appendix A.3 of the book "Survival Analysis: Biostatistics using SAS", Ohashi Y, Hamada C, 1995, University of Tokyo Press). The program listed above is to read this data file, to set the type of variables, to load survival library, to estimate survival curves by whether irradiation during operation was conducted or not, compare Kaplan-Meier estimate with considering censoring data, and to test the null-hypothesis of "There is no difference of survival times by whether irradiation during operation was conducted or not" by log-rank test.
Discuss the results in the form below (let the significance level of the test 0.05). Never forget to write the student ID and name in each field.