Top
個別メモ
Latest update on 2012年3月5日 (月) at 10:54:46.
【第1932回】 台風接近中(2011年7月19日)
- 起きてみると雨だったが,7:00頃には止んでいたので自転車で長野駅へ。しかし群馬側は雨だったし,台風接近中ということで前橋からバスにした。
- 週刊医学界新聞が届き,今日から使える医療統計学講座【Lesson 3】サンプルサイズとパワー計算が目にとまった。とてもわかりやすく書かれていただけでなく,ヴァンダービルト大学医療統計学部で開発された無料のソフトであるPower and Sample Size Calculator(対応OSはWindows2000以降)が紹介されていて実践的であった。インストールはダウンロードしたファイルを実行してインストール先ディレクトリの指定などを適当にして行くだけで終わる。Windowsのスタートメニューから実行すると,Survival,t-test,Regression1,Regression2,Dichotomous,Mantel-Haenszel,Logとタブが表示され,多くの検定の種類についてサンプルサイズを計算できるようになっている。試しに「週刊医学界新聞」記事の通りに,[t-test]を選び,OutputとしてSample sizeを選び,DesignとしてIndependentを選び(独立2標本のt検定になる。Pairedも選べる),αを0.05,Powerを0.8,δ(検出したい2群間の差)を5,σ(アウトカムに期待される標準偏差)を10,m(対照群のサンプルサイズを実験群の何倍にするかを示す値)を1と入力して[Calculate]ボタンをクリックすると,確かに64と計算できる。これは,Rでpower.t.test(delta=5,sd=10,sig.level=0.05,power=0.8)と入力して得られるn=63.76576と同じ結果である。PSでは対照群を実験群の何倍にするかを指定できるという利点があるが,片側検定を指定することができない。Rでは片側検定も指定できるという利点があるが,対照群と実験群のサンプルサイズが同じであるとして各群のサンプルサイズを求めることしかできない。ちなみに,PSでm=2としてCalculateすると,実験群のサンプルサイズが48,対照群のサンプルサイズが96となる。以前も書いた自治医大さいたま医療センター血液科のEZR on Rcmdr(β版)では,[統計解析]→[必要サンプル数の計算]→[2群の平均値の比較のためのサンプル数の計算]と選んで表示されるウィンドウで,2群間の平均値の差として5,2群共通の標準偏差(SD)として10を入力して[OK]をクリックすると,結果として63が得られる。「サンプル数」という表現だと標本抽出回数と紛らわしいので「サンプルサイズ」の方が表現は良いと思うが(参考:心理学研究の基礎(fpr)というメーリングリストで2011年6月末にあった「標本数」スレッドの議論),EZRでは2群のサンプルサイズの比も指定できるし,片側検定も指定できるので,機能的にはPSとpower.t.testの両方を包含している。63となっているのは,『実用SAS生物統計ハンドブック』に基づいて定義された関数SampleMeanの中で,計算結果をceiling関数により小数点以下切り捨てているためである。サンプルサイズと検出力の関係を示すグラフまで描画される。素のRでは,割合の差の検定をする場合ならpower.prop.testだとか,関数名を知らないと計算できないが,EZRでは統計解析→必要サンプル数の計算から選ぶだけで割合の差はもちろん,2群の生存曲線の比較に必要なサンプルサイズなども計算できる。なお,生存曲線の比較の場合,EZRとPSでは若干オプション指定の方法が異なっていた。EZRでは,登録期間(enrol),試験期間(observe),予測生存率を評価する年数(followup),群1の予測生存率(group1),群2の予測生存率(group2)を与えるが,PSでは登録期間(A:accrual time),登録後追跡期間(F)と,対照群の予測生存期間の中央値(m1,もしm1が直接推定されていなければ,ある期間tを対照群が生存する確率pを使って,m1=t*ln(1/2)/ln(p)で推定するように,Helpに書かれている)と実験群の予測生存期間の中央値(m2)を与える。EZRでgroup1=0.3,group2=0.1,enrol=5,observe=10,followup=5とすると各群に必要なサンプルサイズは45となるが,PSでA=5,F=5,m1=1.50515(=5*ln(0.5)/ln(0.1)),m2=2.878583(=5*ln(0.5)/ln(0.3))で[Calculate]ボタンをクリックすると,各群に必要なサンプルサイズとして42が得られる。微妙に違うが誤差範囲であろう。EZRはβ版だし,漢字変換ミスがあったりするのも若干不安なのだが,使いやすさという点では素晴らしいと思う。群馬大学の大学院教育では英語と日本語で同内容の講義をするため,今のところRcmdrを使っているが,英語版さえあれば,EZRにした方がいいかもしれないと思ったほどだ。
- なお,念のために書いておくと,Rでは自然対数lnはlog()関数で計算する。
- 疫学勉強会終了後,教室webサイトの更新作業などをしてから,帰ろうとしたら雨だった。バスで前橋に出たら両毛線には大幅な遅れが出ていたが,20:32の前橋始発上野行きは定刻に発車してくれた。しかしこれだと高崎で40分以上の待ちになる。復路あさま549号は混んでいたが運良く座れたので長野まで眠って帰った。長野はちょうど雨上がりで,自転車で帰れてラッキーだった。
- 帰宅後,メールで届いていた日本人口学会仕事を済ませ,北大の院生からのメールに返事を打ったら,ちょうど日付が変わった。
▼前【1931】(女子サッカー優勝(2011年7月18日)
) ▲次【1933】(今日も台風接近中(2011年7月20日)
) ●Top
△Read/Write COMMENTS
Notice to cite or link here | [TOP PAGE]