最終更新:June 11, 2012 (Mon)
名著『宇宙怪人しまりす 医療統計を学ぶ』(書評)の待望の続編である。
疾風編とか多変量解析編という噂もあったが,6年半の歳月を経て登場した本書は,まあ穏当にというか,「検定の巻」であった。保健医療分野で統計学絡みのことを教えていると,「このデータで有意差が出るような検定方法を教えてください」といった「ゆーい差決戦主義(C)久保拓弥さん」な相談が良くあるのだが,実は検定の意味をよくわかっていなかったりする人も多い。わかっていなくても統計ソフトを使えばp値だけはソフトが出してくれてしまうので,意味を考えようとする動機付けが弱いのであろう。経験的には,数式が出てくるとダメという人も多いが,理解しておくべきは数式ではなく(人によっては数式の方が理解しやすいが),考え方なので,数式を使わずに,帰無仮説,検定,第一種の過誤,検出力,サンプルサイズ,ランダム化の意味,バイアスが入ったデータが如何に使えないか,実験計画の大切さ,計画通りに実験ができなかったときに何故ITTが標準なのかといったことが,対話形式で説明されている本書は,そういった数式が苦手な人にとっては福音となるだろう。
前著に比べると,先生としまりすの対話だけではなく,ゼミにおける発表場面が設定されたおかげで司会さんという新たな登場人物もいるし,会話文の頭にそれぞれの顔アイコンが配置され,かつ状況に応じて表情が変わるという芸の細かさは,本書をより親しみやすいものにしていると思う(ただ,欲を言えば顔アイコンはもう少しサイズを大きくしていただけると,表情の違いがもっと見やすかったのではないかと思うが)。
数式がなく対話形式で進むからといって,内容には妥協が無いのが素晴らしい。p値が出てきた後,信頼区間の説明の中で出てくるのは,ロスマン大先生ご推薦のp-value functionである(ただし,その名称は出てこない)。差別的誤分類(differential misclassification)が起こってしまうと,補正不可能なバイアスがかかって結果が大きく歪んでしまうことも明示されている。交絡がある場合は,交絡因子で層別化すると,交絡因子を無視した解析とはまったく異なる結果になる場合があること(いわゆるシンプソンのパラドックス)もクリアな数値例を出して説明してくれている。さらに,ITT(何があっても割り付け通りに解析すること;リンク先は佐藤先生のサイトにあるpdfファイル)によって通常の帰無仮説の下ではバイアスを避けられる理由といった,医療統計の中でもある程度専門的な内容(ITTが標準であることは国試レベルだが,その理由をちゃんと理解している医学生は少ないと思う)まで触れられている。これらの内容が,数式も専門用語もほとんど使わずに(専門用語が出てくるときは噛み砕いた解説とともに導入される)説明されているのは凄いと思う。複雑な数式を出す代わりに統計ソフトでやったことにしているが,確かにSASやRのコードを書ければ複雑すぎる数式を覚えている必要はない。後書きによると,これらの内容をしまりす本という水準で説明できるスキルを身につけるのに6年掛かったということだが,それがとても頷ける仕上がりになっている。
本書の最後の展開からすると,次はいよいよ疾風編だろうか。エドガー・ライス・バローズの火星シリーズや金星シリーズのように,「りすりす星の医療統計学者」みたいなタイトルになるのかなあ,などと妄想するのも楽しい(いやしかし,エンダーシリーズを踏まえているのだとすると,むしろ,りすりす星に行ってみたらバガーやピギーが出てきたりするのか?)。
【2012年6月11日記】