群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
survivalライブラリに入っているデータovarianは,卵巣がんに対する2種類の治療法を比較する無作為化臨床試験の結果である。Eastern Cooperative Oncology Groupの研究であり,含まれている変数は以下の通りである。
このデータから,治療種類の違いによって卵巣がんの生存時間に差が出たか,年齢と残留疾病の有無を共変量として調整して分析せよ。
プログラムは下記の通り(it13kadai-2005.Rとしてダウンロードもできる)。
require(survival) data(ovarian) res <- coxph(Surv(futime,fustat)~age+factor(resid.ds)+factor(rx),data=ovarian) summary(res) png("it13kadai-2005.png",width=480,height=360) plot(survfit(res),xlab="time (days)",ylab="survival rate") dev.off()
結果として,下記の出力と,右図が(ディスプレイには出てこないがpng形式画像ファイルとして)得られる。
Call: coxph(formula = Surv(futime, fustat) ~ age + factor(resid.ds) + factor(rx), data = ovarian) n= 26 coef exp(coef) se(coef) z p age 0.129 1.137 0.0473 2.718 0.0066 factor(resid.ds)2 0.696 2.006 0.7585 0.918 0.3600 factor(rx)2 -0.849 0.428 0.6392 -1.328 0.1800 exp(coef) exp(-coef) lower .95 upper .95 age 1.137 0.879 1.036 1.25 factor(resid.ds)2 2.006 0.498 0.454 8.87 factor(rx)2 0.428 2.337 0.122 1.50 Rsquare= 0.475 (max possible= 0.932 ) Likelihood ratio test= 16.8 on 3 df, p=0.000789 Wald test = 14.6 on 3 df, p=0.00216 Score (logrank) test = 20.8 on 3 df, p=0.000118
この結果から,まずLikelihood ratio testの結果をみると,p=0.000789と0.05よりずっと小さいので,このモデルはデータに適合しているといえる。Rsquareの値から,このモデル(年齢と治療種類を独立変数とするコックス回帰)によって,生存時間の約47.5%が説明されると考えられる。
次に各独立変数の効果の有意性をみると,年齢(age)は共変量として5%水準で有意に影響していて,exp(coef)が1.137なので,残留疾病の有無と治療種類が同じなら,年齢が1歳上がると平均して生存時間が1.137日伸びているといえる。
factor(resid.ds)とfactor(rx)についてはexp(coef)の95%信頼区間が1を跨いでいるので,残留疾病の有無によっても生存時間に有意差はないし,治療種類間でも生存時間に有意差はないと考えられる。効果が有意でない独立変数が含まれていても,根拠があれば機械的に変数選択をしないで,モデル全体として評価することもあることに注意されたい。