テキスト『シンプル衛生公衆衛生学2009』には独立した項としての記載がないが,疫学の実践には生物統計学が欠かせない。疫学ばかりでなく,他の多くの科学研究のバックグラウンドとなっている。
生物統計学は英語で言うとbiostatisticsあるいはbiometricsである。R.A. Fisherがロザムステッドの圃場で実践した実験計画法であり,医学分野では主として毒性試験の用量反応関係と,臨床試験がそれに当たる。
処理の違いに基く差が偶然である可能性が極めて低く,偶然ではありえない(有意)かどうかを判定するために必要な計画の原則として,R.A. Fisherが提唱した,以下の3つをFisherの3原則という。
ある特定の処理条件を圃場の特定の場所にかためてしまうと,その場所がたまたま水はけがよかったり肥沃だったりした場合,処理効果によるものか場所の効果によるものかの判別ができなくなる。このようなある特定の場所による効果を系統誤差(systematic error)というが,無作為に処理条件を配置させることにより,系統誤差を偶然誤差(random error)に転化させることができる。(岸野,2004)
本当かどうか知らないが,実験計画の始まりについては,次のようなエピソードが知られている。ティーの席での話題として,ミルクティーを作るときにミルクを先にカップに入れたのか,紅茶を先にカップに入れたのかを,飲んでみれば見分けられる(これをミルクティー判別能力と呼ぶことにしよう)という女性の話が出たときに,多くの学者が化学的には差がないのだから見分けられるわけがないとか,いや見分けられるかもしれないとかいう中,実験してみれば? といったのがR.A. Fisherであった。どちらを先にして作ったのかを知らせずに,この女性にミルクティーを飲んでもらって当てさせてみれば,本当にミルクティー判別能力があるのかわかるというのだ。しかし,1度だけ試して当たっただけでは偶然かもしれないので,何度か繰り返して試さなくてはいけない。それに,ミルクが先という場合だけで試すと,偶々片方だけ言い続けた人が全問正解してしまうことになるので,両方の条件を試さなくてはいけない。つまりは,どういう順番で何回試してみれば,得られた結果からその女性にミルクティー判別能力があるのかが判定できるような条件を考える必要がある。
この条件を考える方法のことを実験計画法と呼び,何度繰り返さなくてはいけないかがサンプルサイズの設計に当たり,どういう順番で試すかが試験配置法に当たる。
ミルクを先に入れて作ったミルクティーを1杯飲んだとき,まったくの山勘で答えると,ミルクが先と答えるか紅茶が先と答えるかは確率1/2なので,偶然当たってしまう確率が1/2もあることになる。2杯飲んだときに2杯とも当てる確率を考えると,当たりを○,外れを×と表記すると,○○,○×,×○,××が等確率で起こるので1/4となる。1/4というのはそれほど珍しいことではないので,2杯では,どういう結果が出ようがミルクティー判別能力があるのかどうか判定不能である。では,最低何杯試したらいいのだろうか。ある水準より多く偶然当たる確率が0.05未満のときに,それはありえないことと判断して,偶然ではない(=ミルクティー判別能力がある)と結論できるとすると,3杯試して偶然で全て当たる確率は1/8,4杯では1/16,5杯では1/32となるので,最低5杯は試す必要があることになる。このとき,0.05という判断基準(有意水準)は,裏を返せば,本当は差がないけれども間違って差があると判定してしまう確率になるので,第一種の過誤と呼ばれる。
サンプルサイズを計算するには,まず臨床試験の主要なエンドポイント(評価項目)と統計解析の方法が決まっていなくてはいけない。統計解析の方法によって(割合を比較したいのか,生存時間を比較したいのか,など)必要なサンプルサイズは変わってくる。その上で,割合を比較する場合なら(1)有意水準,(2)検出力,(3)コントロール治療での臨床イベント発生割合,(4)試験治療のイベント発生割合がコントロール治療よりどれくらい小さければ臨床的に意義があると考えられるか,その最小の値(しかしそれで計算すると必要なサンプルサイズが非実用的なほど大きくなることが多いので,(4')試験治療により期待できるイベント発生割合)が必要。
割合を比較する統計手法はFisherの直接確率(または近似としてカイ二乗検定)なので,その式が決まっていて,例えば有意水準が片側5%,検出力が80%,コントロール治療でのイベント発生が30%,試験治療により期待できるイベント発生が15%の場合なら,各群95人となる。(Rで計算する場合は,power.prop.test(p1=0.15, p2=0.3, sig.level=0.05, power=0.8, alternative="one.sided")でOK。
試験配置にはいろいろあるが,コストや調べたい対象などによって,どういう試験配置が適しているかが変わってくる。良く用いられる配置法としては,乱塊法(randomized block design),分割区法(split-plot design),ラテン方格法,要因試験などがある。
化学物質などについて、人や生物に好ましくない作用の有無またはその強さの程度を調べるための試験。
試験は、評価する毒性の項目(一般毒性、特殊毒性)、使う生物の種類(哺乳動物、魚など)と形態(全体、組織、細胞など)、曝露経路(経口、吸入、経皮など)、曝露期間(長期、短期など)によって様々な種類がある。目的によって、適切な試験方法を選定する必要がある。 (http://www.eic.or.jp/ecoterm/window.php?ecoterm=%C6%C7%C0%AD%BB%EE%B8%B3)より,「暴露」を「曝露」に修正
とくに,用量反応関係(量-反応関係ともいう。dose-response relationship)については多くの方法が開発されてきた。LOAEL(最低毒性量),NOAEL(無毒性量),NOEL(無反応量)を求めることや,ロジット分析とかプロビット分析によってLD50(半数致死量)あるいはED50(半数影響量)を求めることが多い。横軸に用量,縦軸に反応割合をとってプロットするのは基本であり,通常はシグモイド(S字状)曲線になる(テキストpp.135-137,http://phi.med.gunma-u.ac.jp/pubhealth/ph15.htmlも参照されたい)。