Top
個別メモ
Latest update on 2012年3月5日 (月) at 10:54:46.
【第1707回】 まだ申請書作成継続中(2010年10月21日)
- 5:30にELECOMの新スピーカーから流れるOlivia Ongの"Lost in emotion - Stand by me"で起床。ちなみにソフトウェアはTClock Lightである。木曜は剪定枝葉の回収日かつ可燃ごみの日なので,それを運んで行ったり,その他家事もろもろをしていて,7:30に出発。天気は良くないが,まだ雨ではないので自転車で長野駅へ。往路あさま510号。新前橋から自転車に乗ろうと思ったらポツポツと降ってきたので,改札を入り直して両毛線に乗り,前橋からバス。
- UNFPA東京事務局から昨日届いていたメールで,世界人口白書2010が発表されていたことを知った。とりあえずメモ。今日こそは申請書を形にしなくては。
- ソロモン諸島からメールがあり,2月ワークショップについての質問だったが即答できないのでO先生に相談メールを打ってみた。
- Rcmdrのプラグインで,"RcmdrPlugin.survival"をロードして使ってみた。サンプルデータとしてsurvivalパッケージに入っているamlを使ったが,アタッチされたパッケージからデータを読み込むところで,"aml (leukemia)"ではなくて,"leukemia"の方を選ばないとうまくいかなかった。Kaplan=Meier推定は,統計量>Survival analysis>Estimate survival functionと進み,"Time or star/end times"として[time]を選び,"Event indicator"として[status]を選ぶ。次にStrataだが,amlデータでMaintained群とNon-maintained群別々にKaplan=Meier推定したいときは,ここに表示されている[x]をクリックする。全データを一括して推定したい場合は何もしない(間違って一度クリックしてしまうと,たぶん解除できないので,その場合は諦めてウィンドウを閉じ,やり直すのが無難である)。この関数は生存曲線も描いてくれる。"Confidence Intervals"として"Log","Log-log","plain","none"を指定できる。デフォルトは"Log"である(つまり,survfit()関数で,"conf.type="オプションを付けなければ,summary()で出力される各イベント発生時点の信頼区間は,"conf.type="log"として計算される)。大橋・浜田『生存時間解析』(東京大学出版会)のp.68の出力を見ると,SASバージョン6の計算は,conf.type="plain"とした場合と一致したし,生存時間解析入門で,Statistics in Medicineに1997年に掲載されていたチュートリアル論文での計算は,conf.type="log-log"とした場合と一致した。"Plot confidence intervals"は,常に生存曲線に信頼区間をつけて描画する[Yes]と常に信頼区間は描画しない[No]の他に,[Default]が指定できる。[Default]は,Strataが指定されている場合は[No],Strataが無い場合は[Yes]が指定された場合と同じ動作をする(なお,描画しない場合でも,アウトプットウィンドウには,summary()の結果として,各イベント発生時点での生存確率の信頼区間の値は表示される)。"Confidence level"は信頼水準であり,デフォルトは.95,つまり95%である。ここを.99とすれば99%信頼区間が求められる。"Mark censoring times"にはデフォルトでチェックが入っており,生存曲線のグラフの打ち切り発生時点で短いティックマークがプロットされる。このチェックを外すと打ち切りレコードは描画されない。"Method"は[Kaplan-Meier]の他にも2つ選べ,"Variance Method"も[Greenwood]でない方法も選べるが,ここはデフォルトのままでいいと思う。"Quantiles to estimate"のボックスに[.25,.5,.75]と入っているが,アウトプットウィンドウで.5のところに表示される値が生存時間の中央値として推定されるカプラン=マイヤ推定量である。日本語環境で使う場合に重要なのは,一番下の"部分集合の表現"のボックスに表示されている[<全ての有効なケース>]という文字列を消してから[OK]ボタンをクリックすることである。これはたぶん,このプラグインパッケージのバグだと思う。
- 同様に,ログランク検定をしたい場合は,統計量>Survival analysis>Compare Survival Functionsでできる。leukemiaデータの場合,"Time or start/end times"を[time],"Event indicator"を[status],"Strata"を[x]にして(色が反転した選択された状態にして),"rho"を0のまま,"部分集合の表現"ボックスの中を削除して[OK]ボタンをクリックすると,ログランク検定の結果がアウトプットウィンドウに表示される("rho"を1にすると,Peto-Peto流の一般化ウィルコクソン検定の結果が得られる)。コックス回帰なら,統計量>モデルへの適合>Cox regression modelを選ぶ。まず"Time or start/end times"は[time],"Event indicator"は[status],"Strata"と"Clusters"は選択しない("Strata"を指定すると,その層ごとにベースラインハザードが異なると仮定して推定してしまう)。次に,"Method for Ties"はデフォルトが[Efron]になっているが,[Breslow]や[Exact]も選べる。"Robust Standard Errors"は[Default],[Yes],[No]から選べる。"変数"としてハザード比を求めたいグループ変数や共変量を"+"でつないで指定するが,leukemiaデータでは"x [因子]"しか候補がないので,それをクリックすると,"~"の右側のボックスには[x]と入る。"部分集合の表現"の下のボックスの中を削除してから[OK]をクリックすれば,コックス回帰の結果が得られる。以上メモ。そのうち,大学院統計演習テキスト(日本語版 | English version)に取り入れる予定。
- いやしかし,こんな先のことよりも,明日の講義の課題を作らなくてはいけないんだが。
- 15:00頃までかかって,漸く研究目的に目鼻がついてきたので,明日の講義の方を先に済ませよう。あと,さっき書かなかったが,R-2.12.0にアップデートして,libraryをR-2.11.1のディレクトリから移動してからupdate.packages(ask=FALSE)という手口では,時々,パッケージがちゃんとインストールされていないので起動できないというエラーに遭遇してしまう。たぶん,システムバイナリがbin直下からbin\i386またはbin\x64の下に移動したのが原因ではないかと思われる。これまでのところ,当該パッケージを,例えばdateパッケージだったら,install.packages("date",dep=TRUE)などとしてインストールし直すだけで問題解決している。
- 17:30からの教室セミナーは論文紹介だったが,統計学的な説明が不十分だったために,やや時間がかかった。とくに,2つのリスク因子が単独で寄与するハザード比と両方がある場合のハザード比(ベースラインハザードはどちらもない場合)から計算されるRERIという値の信頼区間の計算にDelta methodを使っていたので,それは何ぞやということで文献を探したりしたので,セミナー終了後も時間をとってしまった。
- その後,明日の講義の課題が完成したら,21:00を過ぎていた。一瞬泊まってしまいたくなったが,やはり帰ることにした。バスで前橋に出て21:49の両毛線で高崎に行き,復路あさま553号で長野まで眠って帰った。
- 今日も吉見から高橋,浅尾と完封リレーだったらしい。2連勝で王手とは強すぎる。まさか明日は山井で完全試合とか?
▼前【1706】(申請書作成継続中(2010年10月20日;2011年1月13日修正)
) ▲次【1708】(講義の後で申請書作成の続き(2010年10月22日)
) ●Top
△Read/Write COMMENTS
Notice to cite or link here | [TOP PAGE]