群馬大学 | 医学部 | トップ | 公衆衛生学

疫学

最新の更新: May 22, 2009 (FRI) .

1. 文献
◆テキスト『シンプル衛生公衆衛生学2009』第3章「疫学」(p.29〜46)
◆佐藤俊哉・松山裕「疫学・臨床研究における因果推論」 In: 『統計科学のフロンティア5 多変量解析の展開 隠れた構造と因果を推理する』(岩波書店,2002)
◆Rothman KJ(矢野・橋本訳)「ロスマンの疫学」(篠原出版新社,2004)(原著は"Epidemiology: An Introduction" Oxford University Press, Oxford, 223 pp. ISBN 0-19-513554-7)
2. 疫学(epidemiology)とは?
◆国際疫学会「疫学辞典」第4版の定義『特定された集団(specified populations)における健康に関連した状態(states)あるいは事象(events)の分布(distribution)と決定因子(determinants)の研究,及び,この研究の健康問題(health problems)の制圧(control)への応用(application)』
◆『明確に規定された人間集団の中で出現する健康関連のいろいろな事象の頻度と分布およびそれらに影響を与える要因を明らかにして,健康関連の諸問題に対する有効な対策樹立に役立てるための科学』(柳川洋「疫学の定義と歴史」,日本疫学会編「疫学 基礎から学ぶために」,南江堂, 1996)
◆『明確に特定された人間集団の中で出現する健康に関する様々な事象の頻度及び分布並びにそれらに影響を与える要因を明らかにする科学研究をいう』(2002年6月17日[その後4回の改訂があった],文部科学省・厚生労働省「疫学研究に関する倫理指針」(http://www.lifescience.mext.go.jp/files/pdf/37_139.pdf)における「疫学研究」の用語定義)
(特徴)
3. 有名な疫学研究
◆Snow J (1813-1858)のコレラの研究:当時コレラ菌は未発見であり,ロンドンでは頻繁にコレラが流行していた。1854年にロンドンのブロードストリートで大流行があった際に,Snowはコレラ死亡者の発生地図,死亡の日別分布表を作成し,詳細な症例検討を加えて,流行の原因となった共同井戸のコレラ菌汚染を突き止めた。記述疫学研究。
◆Panum PL (1820-1885)の麻疹の研究:デンマーク領ファロー島はそれまで65年間なかった麻疹が1846年に大流行したので,Panumは数千人の患者を診察して,大流行の原因,感受性と終生免疫,接触から発症までの期間,感染可能期間などを明らかにした。
◆Gregg NM:1941年にシドニーなどで多発した先天性白内障の観察から,その前年に起こった風疹流行と母親の当該児妊娠初期が一致することを発見した。
◆高木兼寛 (1849-1915)の脚気の研究:1884年に脚気の原因が食事の欠陥にあると見当をつけ,脚気が多発していた海軍の軍艦乗組員の遠洋航海の際の食事を変えて,大麦,大豆,牛肉を増やすことによって,炭素に対する窒素割合を増やしたら,脚気が減った。真の原因がビタミンB1不足であることまではわからなかったが,この介入研究によって食事に原因があることが明らかになった。
◆フラミンガム研究:1948年10月米国ボストン郊外のフラミンガムで心血管疾患の原因を探るために開始された長期の観察疫学研究。Framingham Heart Studyと呼ばれる。この研究によって,血圧・コレステロール値が高いこと,喫煙,座りがちの生活が心血管疾患のリスクを増大させることがわかった。多くの文献が出ている(例えば下記)。
  1. 嶋康晃. 世界の心臓を救った町―フラミンガム研究の55年. ライフサイエンス出版. 2004
  2. DAWBER TR, MOORE FE, MANN GV. Coronary heart disease in the Framingham study. Am J Public Health.1957; 47: 4-24.
  3. DAWBER TR, KANNEL WB, REVOTSKIE N, STOKES J, KAGAN A, GORDON T. Some factors associated with the development of coronary heart disease: Six years' follow-up experience in the Framingham study. Am J Public Health.1959; 49: 1349-56.
  4. Kannel WB, Eaker ED. Psychosocial and other features of coronary heart disease: Insights from the Framingham Study. Am Heart J. 1986; 112: 1066-73.
◆久山町研究:福岡県久山町の40歳以上の一般住民を対象として1961年から継続している大規模疫学調査。参加率80%,追跡率99%以上。全死亡例の8割を剖検して死亡状況を調査しているのが特徴。1961年から13〜14年ごとに断面調査を実施して追跡中。40歳以上の住民を5年ごとに集団に新しく加えているため,生活習慣の移り変わりの影響や,危険因子の変遷をも知ることができる。1960〜2000年の40年間に脳卒中による突然死が約1/7に激減し,心疾患による突然死が急増していることがわかった。降圧薬による高血圧管理が進んだ一方,生活習慣の変化で肥満や糖尿病などの代謝性疾患が増えつつあることが背景にあるようだとの報告がある。
(注)循環器疫学については,http://www.epi-c.jp/に様々な情報が集まっている。上のフラミンガム研究と久山町研究についての説明文も同サイトからの情報をかなり引用・改変している。フラミンガム研究については動画もあるので,是非参考にされたい。
4. 観察疫学研究の黎明:ロンドンのコレラ
当時コレラ菌は未知だったが,ロンドンではコレラが日常的に流行していた。1854年の大流行時,John Snowはコレラ死亡者の発生地図(spot map)と発症日別のコレラ死者数の度数分布を作成。コレラ流行の原因が1つの共同井戸利用にあったことを突き止め,水会社間の供給人口当たりのコレラ死亡数の比(L社:461/173748に対してS&V社:4093/266516と約5.8倍)を計算して,S&V社から水供給を受けている人が危険なことを示した。黎明期の観察疫学研究の金字塔とされる。
5. 疫学研究のフレームワーク
◆"5-W-Bridge":疾病について,いつ,どこで,誰が,どんな病気に,何故罹ったかを明らかにできれば,原因も突き止められるということ。そのために必要な手順として,
6. 疾病分類
◆疾病分類:ある一定の基準により疾病を分類する体系。疾病の単位を明確にし,異なる調査結果を比較することを可能にする。すべての疾病について漏れが無く重複もないのが理想。
◆国際疾病分類(International Classification of Diseases=ICD):WHOの前身である国際会議の協議により1900年に制定され,約10年毎に改定され,1995 年から第10回修正国際疾病分類(ICD-10)が使われている。ICD-9では4桁(3桁+小数点+1桁)の数字で分類,ICD-10では最初の文字をU以外のアルファベットにしたので最大24999種類まで分類できる。実際の項目数も約7000から約14000に倍増。既存資料に基づいて死亡率や罹患率の長期的な変化を調べるときは,分類に使われているICDの回の違いによるカテゴリの違いの影響を受けないように工夫する。この細かい分類を基本分類といい,それに対して,とくに死因に対しては,個々の疾病を約130項目にまとめた死因分類というものを用いるのが普通である(ICD-9では死因簡単分類と呼ばれた)。国連やWHOの統計資料は基本分類でなくて死因分類や死因簡単分類でまとめられている
◆死亡診断書:人口動態統計データを利用する上では,その元になる死亡診断書の内容を把握すべきである(テキストp.32,図3-1を参照)。人口動態統計に死因として記載されるのは,周産期死亡を除き原死因であることに注意(それでは不都合な場合はある一定の準則により修正される)。
○海堂尊『死因不明社会』講談社ブルーバックスによると,日本では3%程度しか死因についての病理診断が行われないため,治療中だった疾患についての所見をもとにして医師の臨床診断により推定された死因が死亡診断書に記載されることが多いが,病理診断と臨床診断の一致率は高々88%だという。欧米のデータでは一致率が70%という報告もある。この点からすると,死因についての統計データを鵜呑みにしてしまうのは危険かもしれない。
7. 病因論 (etiology)
◆因果関係を推論するとき,集団内での疾病のダイナミクスに着目することは必要。個人レベルでの因果関係とは別に集団レベルで感染環が維持される条件が存在するので,感染環の1ヶ所を断ち切ることができれば,疾病の流行は予防できることになる。
◆疾病の自然史:個人レベルで疾病のダイナミクスを観察すると,まずその疾病とまったく関係がない時期(逆にいえば,その後その疾病に罹る可能性がある時期であり,その意味で感受性期(stage of susceptibility)と呼ばれる)があり,その後何らかの理由で異常が発生するが臨床症状がない時期(前臨床期(preclinical stage),感染症の場合は潜伏期(latent period)がこれに相当する)があり,そのまま回復する場合もあるが,臨床症状が出現して疾病と診断される(臨床期(clinical stage))という経過を辿る。この経過を疾病の自然史という。疫学研究では集団全体を対象とするので,疾病の自然史の各ステージにある人を丸ごと観察できる。
8. 病因論モデル
◆その疾病の自然史の成り立ちを丸ごと捉えることは,その疾病の病因論(etiology)のモデルを構築することと同値である。このようなモデルを病因論モデル(etiological model)といい,次のようなものがある(ただ,たぶんwebは織物というよりも網と訳すべきではないかと思う)。
9. 疫学研究の対象
◆調査をするにせよ,既存資料を使うにせよ,まずリスク曝露人口(population at risk)の特定が必要。リスク曝露人口は疾病の程度を示すための分母となる。例えば,子宮ガンでは女性全員。国民全体を対象とする場合は,国勢調査による日本人口を使うのが普通。厳密に考えれば7月1日時点の人口を年央人口として使いたいところだが,国勢調査では10月1日時点の推計人口が提示されるので,それを年央人口として使うのが普通である。
◆厳密なリスク曝露人口の把握が困難な場合は,別の測定しやすい値で代用することもある。
◆既存資料を使う場合は,どのように実施された調査の結果を,どのような指標を使ってまとめた資料なのかという点を吟味して扱う必要がある。
10. 疫学研究の変化
◆観察疫学研究の他にも,無作為割付けを伴う介入研究など,いろいろな疫学研究がある。
◆元来,epidemiologyは感染症の流行,すなわちepidemicsに関する理論を明らかにすることを目的として発達したが,今日の先進国では,慢性疾患の予防やQOLの向上にまで目的が拡大している。
◆主な研究対象の変化に伴って,つきとめるべき原因も単因子から多因子で複雑なものに変わってきた。
11. 病気の原因の例(結核)
病因(agent):結核菌は,必要条件だが十分条件ではない
宿主要因(host):BCG接種を受けて免疫をもつ人は結核にかかりにくい。他の病気で弱っている人はかかりやすい
環境要因(environment):患者の多い地域に住む人はかかりやすい。患者の同居家族はかかりやすい。多くの患者と接触する職業の人はかかりやすい
12. 疫学の応用
◆疾病発生要因の追究:リスク因子の特定と評価,因果推論
◆疾病自然史の解明:検診計画や治療効果判定には必須
◆疾病予後要因の解明
◆疾病頻度の将来予測=数学モデルを利用した理論疫学研究
◆疾病対策の企画・評価
◆治療効果の判定
◆健康水準の測定
◆地区診断=対象集団の居住する地域特性にマッチした施策が必要
13. 疫学要因
◆疫学要因は,宿主要因と環境要因に分けて考えることができる。感染症の場合は,先に示した結核の例のように,生物的要因である病原微生物を「病因」として,環境要因とは分けて考える場合もある。
◆宿主要因には,先天的特性(遺伝形質,染色体,性差など)と後天的特性(年齢,体格・体型,性格・性質,行動型,既往・受療,成熟)があるが,必ずしも明確に区分できるとは限らない
◆環境要因には,生物的要因,化学的要因,物理的要因,社会的要因がある
◆宿主要因と環境要因は独立ではなく,相互作用するのが普通である(例:ポリネシア人の肥満傾向)
14. 疾病量の把握
◆測定すべき要因の決定(研究目的にかなうか?/交絡要因や交互作用をみる要因はないか?/要因の対象集団内でのばらつきは十分か?/信頼できる測定方法はあるか?)
◆要因曝露の情報源(既存資料/個人の提供情報/医学的検査・測定/環境測定)
◆個人から提供される情報を得るには,質問紙調査を行うのが普通。自記式調査と面接調査があるが,いずれの場合も,質問紙は,平易な文章であるとか1つの質問で1つの答えを得るなど,いくつかの点に留意して作成しなければならない(詳細は社会調査の教科書などを参照)
15. 標本抽出
◆疫学調査で得られた結果を適用したい集団(介入研究でいう参照集団にあたる。統計的に考えるならば母集団)の全数を調査する悉皆調査(しっかいちょうさ)は,費用や時間などの制約,あるいはその必要がないなどの理由で実施されないことが多い。
◆その代わりに,集団全体を代表する適当なサイズの標本をうまく選んでやればよいことになる。
◆如何にうまく集団全体を代表するような標本を選ぶかという目的で考案されたさまざまな方法を総称して標本抽出法と呼ぶ。
◆悉皆調査には欠点がある(費用や対象への負荷の大きさ,選択的欠落のバイアスの危険等)
◆集団には多様性がある。代表性をもった部分を標本として抽出できれば,その部分を調べることによって全体の性質を推測できる(統計的推測の考え方)。
◆記述疫学では母集団が確定していないと無意味。分析疫学や介入研究では,必ずしもそうではない。
◆標本の種類:area sample / cluster sample / grab sample / probability sample (広義のrandom sample)
単純無作為抽出法: まず母集団の全員をリストし連番を割り振る(戸籍,住民基本台帳等に基づいた全員の名簿が必要)。次に乱数表,さいころ,コンピュータなどを使ってランダムな番号を必要な個数選ぶ。統計ソフトを使うと簡単。N人からなる母集団からp人を抽出するとき,Rならrank(runif(N))の出力結果の左からp個分の番号に当たる人を標本とすればよい。
層別抽出法: 年齢別,性別,職業別など,既知の階層毎に単純無作為抽出する層によって調査指標が異なることが既知の場合は単純無作為抽出より代表性がいい,層ごとの集計ができる,などが利点。ただし,サンプリング以前に階層の情報がわかっていなければならない(が,予備的にその集団について階層を調べたりすると,それ自体が本調査に影響するかもしれない)のが欠点。他に,階層の出現頻度が事前にはわからない,時間と金がかかる,総サンプル数が決まっている場合には階層毎のサンプル数が減ってしまうのも欠点。
集束抽出法: 集落抽出法ともいう。Cluster sampling。多段抽出の1つで,最終段階では全数を標本とする。最終段階の1つ前で選ばれる集団を単位として抽出する方法と考えられる。途上国の調査ではよく使われる。例えば,複数の村を含む州の調査などで,村をランダムに選んで,選ばれた村は全数調べる。比較的安上がりで同意を得やすく短期間で調査できる場合が多いのが利点。
確率比例抽出法: Probability Proportionate Sampling (PPS)。母集団が不均質なとき,均質と考えられるブロックに分け,各ブロックの人口に比例した確率でいくつかのブロックが選ばれた後,各ブロックからは同数のサンプルを抽出する方法。逆にブロックサイズによらず等確率でいくつかのブロックが選ばれた後,各ブロックからそのサイズに比例した数のサンプルを抽出する方法を副次抽出法という。
◆どの標本抽出法を選ぶかのガイドライン
◆標本サイズ:標本は大きければいいというものではない。最適なサイズが存在する。目的によって計算式が異なるが,一般論としては,測定値に関する予測(先行研究などから)が得られ,有意水準と検出力を決めれば,最適な標本サイズが計算できる。
16. 疫学指標としての「頻度」
◆全体の中でどれくらいの部分か? 即ち,全体を分母,部分を分子とした割合
◆全体をきちんと定義することが大事
◆もちろん,部分もきちんと定義しなくては無意味
◆部分を定義する上で大事なのは……
17. 有病割合 (prevalence)
◆「ある集団のある一時点で疾病ありの人数」を「ある集団の調査対象人数」で割った値
意味:集団における病気の負荷(disease burden)を示す。急性感染症で有病割合が高いなら患者が次々に発生していることを意味するが,慢性疾患の場合はそうとは限らない。
応用:行政施策として必要な医療資源や社会福祉資源の算定に役立つ。
例:集団健診をしたら高血圧や高コレステロール血症の有病割合が高かった。
18. 罹患率 (incidence rate)
◆発生率。個々の観察人年の総和で発生数を割った値。次元は1/年。
“A Dictionary of Epidemiology, 4th Ed.”に明記されているようにincidenceは発生数だが,文脈上,incidenceだけで発生率を意味している場合もある。
◆通常,感受性の人の中で新たに罹患する人が分子となる。再発を含む場合はそう明記する必要がある。
意味:瞬時における病気へのかかりやすさ。つまり疾病罹患の危険度(リスク)を示す。
◆疾病発生状況と有病期間が定常ならば,平均有病期間=有病割合/罹患率という関係式が成り立つ。
19. 死亡率 (mortality rate)
◆総人口のうち,ある一定期間に死亡した人数の割合。
◆分母分子ともカテゴリ分けしてカテゴリごとに計算した死亡率はカテゴリ別死亡率(category-specific mortality rate)となる。死因別死亡率(disease-specific mortality rate)は分子のみカテゴリ別。
◆一般に期間は1年間とするので,分母は1年間の半ばの人口を使い,それを年央人口と呼ぶ(日本の人口統計では10月1日人口を用いる)。
意味:疾病がもたらす結果のなかで最も大きい,死亡という事象の発生率を示す指標。
◆年齢によって大きく異なるので,年齢で標準化(あるいは年齢調整)することが多い。
20. その他の指標
◆累積罹患率 (cumulative incidence) :期首人口のうち観察期間中に病気になった人数の割合であって「率」でないが慣習的にこう呼ばれる。たんにriskといえばこれを指す。定義から明らかなように,観察期間に依存するので,期間を定めなくては無意味。無次元。追跡調査でしか得られない。脱落者は分母から除外する。無作為割付けの介入研究でよく使われる指標。
◆致命率 (case fataility rate):ある疾病に罹患した人のうち,その疾病で死亡した人の割合(%で表す)。意味としては,疾病の重篤度を示す。慢性疾患では有病期間が長いので,観察期間の設定が重要。致命率=死亡率/罹患率
◆死因別死亡割合(PMR; proportional mortality ratio):ある特定の死因による死亡が全死亡に占める割合。増減はその疾患の増減だけでなく,他の疾患の増減とも連動する。
◆50歳以上死亡割合(PMI; proportional mortality indicator):全死亡数に対する50歳以上死亡数の占める割合(%表示)。計算に必要なのは年齢2区分の死亡数のみなので,小集団でも信頼性が高い指標。ただし無文字社会などでは50歳という年齢には意味がない場合もある
21. 標準化・年齢調整
◆異なる年齢構造をもつ集団間で罹患率や死亡率を比較すると,相対的にそれらの率が高い年齢層の人口が大きい集団で過大評価になりがちなので,年齢構造の違いを補正して比較する方法が要求される。死亡率の場合なら,直接法年齢調整死亡率と間接法年齢調整死亡率がそれにあたる。
◆直接法年齢調整死亡率は,対象集団の年齢構成が基準集団と同じだった場合に対象集団の年齢別死亡率に従って死亡が起こったら全体としての死亡率はどうなるかと考えて推定される指標。情報としては対象集団の年齢別死亡率が必要。
◆間接法年齢調整死亡率は,対象集団が基準集団の年齢別死亡率に従って死んだ場合に期待される死亡数で実際の対象集団の死亡数を割って標準化死亡比(SMR)を出し,それに基準集団の死亡率を掛けて得る。対象集団についての情報としては,年齢別人口と総死亡数がわかっていれば十分
22. 主な生命予後の指標
◆生存確率,平均年間死亡率,期待生存年数など
◆生存関数S(t):少なくとも時点tまで生存する確率。
◆生存関数の分析を生存分析(または生存時間解析; survival analysis)という。通常,統計ソフトで実行。
◆期待生存年数の計算法としてDEALE法ではS(t)=exp(-mt)を仮定し1/mを期待生存年数とする。
◆生存関数の分布型を仮定する方法を加速モデルという。DEALE法は指数関数を仮定した加速モデルといえる(但し1つのデータ点を通る関数のパラメータを求めるので,極端に単純な加速モデルである)
◆分布を仮定しない生存時間解析として有名なものにカプラン=マイヤ法(2年情報処理演習の最終回の資料を参照)がある。メディアン生存時間を推定することができる。
23. 生命表
◆離散型の生存時間解析。年齢別死亡率から平均余命を計算する(ExcelワークシートRコードを参照)
◆表の形にして計算するので生命表と呼ぶ。
◆1歳階級で大集団を計算する場合は問題ないが,5歳階級の死亡率を使う場合は補正が必要(さまざまな方法が提案されている)
◆年齢別死因別死亡がわかれば,特定死因による死亡がなかった場合の仮想的な年齢別死亡率が計算できるので,それから平均余命を計算し,元の平均余命との差を出せば,「その特定死因による死亡が平均余命をどれだけ短縮させたか」,すなわち損失余命が計算できる。
24. リスクと影響の区別
◆疫学の考え方:ある「病気」について,何らかの原因がある。原因といっても,それがあると100%その病気になる,という場合は稀で,その病気への罹りやすさを高めるという場合が多い(因果パイモデルと構成要因群という考え方については後述)。
◆一定の観察期間でどれだけの割合になるかが「リスク」。確率として扱える。
◆「原因」と思われる因子の有無によって,一定の観察期間でどれだけ「リスク」に差(比)が出たかが,その「原因」の「影響」
◆「影響」が統計学的にゼロでないとき,その「原因」はその病気の原因であると判断できる
25. リスクをもう少し厳密に定義する
◆現在では一般に「危険」と訳すが,本来は損失の可能性だけでなく,利益の可能性も意味した。“The probability that an event will occur, e.g., that an individual will become ill or die within a stated period of time or a certain age. Also, a nontechnical term encompassing a variety of measures of the probability of a (generally) unfavorable outcome” (Last JM [Ed.] "A Dictionary of Epidemiology. 3rd Ed.", Oxford University Press, 1995)
◆あるリスクをもたらす要因を危険因子と呼ぶ。
◆もう少し限定的に定義すると,「疾病の発生あるいは他の特定結果の起こる確率を増加させる属性または曝露」が危険因子である。この確率の増加を,その危険因子の影響(または効果)と呼ぶ。影響の指標としては,相対危険,過剰危険(=寄与危険)などがあり,疫学的に重要である。
26. 相対危険(relative risk)と過剰危険(excess risk)
◆前者は比で後者は差である
◆要因Xによる病気Dへの影響を評価したいとき,一般に,Dの患者を調べて,それがどの程度Xによるものかどうかを知ることは困難。
◆Dによる死亡率やDの罹患率について,曝露群の対照群に対する比を計算すると,相対危険が得られる
◆リスクとして累積罹患率をとると,累積罹患率比(cumulative incidence rate ratio)またはリスク比(risk ratio)
◆リスクとして罹患率をとると,罹患率比(incidence rate ratio)
◆リスクとして死亡率をとると,死亡率比(mortality rate ratio)
◆罹患率比と死亡率比を合わせて率比(rate ratio)という
◆要因Xに曝露された群(曝露群)と曝露されていない群(対照群)の間で,Dによる死亡率やDの罹患率の差を計算すると,過剰危険が得られる。リスク差,寄与危険(Attributable Risk)ともいう。
◆対照群における,Dによる死亡率やDの罹患率をバックグラウンドリスクと呼ぶことがある
※相対危険や過剰危険は,Dがどの程度Xによるかを示す指標になっている。
◆寄与割合(Attributable Proportion)=曝露群の罹患率のうちその曝露が原因となっている割合。つまり罹患率差を曝露群の罹患率で割った値になる。罹患率比から1を引いて罹患率比で割った値とも等しい。
◆人口寄与割合(Attributable Population=Attributable Fraction)=母集団の罹患率のうちその曝露が原因となっているものを取り除くとどれくらいの割合,罹患率を下げられるか? という値。
27. オッズ比(Odds Ratio)
◆オッズ(ある事象が起きる確率の起きない確率に対する比)の比
◆2種類のオッズ比(コホート研究における累積罹患率のオッズ比と患者対照研究における曝露率のオッズ比)は数値としては一致する。
◆オッズ比は(稀な疾病の場合)率比の近似値として価値がある
◆交絡因子(原因と病気の両方に影響する,その研究で影響を明らかにしたい要因以外の要因)を調整してオッズ比を出すにはロジスティック回帰分析などの統計手法がある
◆ある要因への曝露の有無と病気の有無を調べて,次のような2×2クロス集計表が得られたとする。
病気あり病気なし
曝露ありa人b人
曝露なしc人d人

この場合,オッズ比はad/bcとなる。もしこれがコホート研究で,最初に曝露ありの人がn1人,曝露なしの人がn2人いて,観察期間中に曝露ありの人のうちa人,曝露なしの人のうちc人が発症したならば,相対危険(a/n1)/(c/n2)や過剰危険(a/n1)-(c/n2)を求めることができるが,断面研究や症例対照研究ではn1,n2がわからないので相対危険や過剰危険を求めることができない。その場合でも要因への曝露の影響を評価できる指標がオッズ比である。稀な疾病の場合に検出効率がよく有効。
28. 生涯リスク
◆生涯リスクとは,ある要因Xによる過剰危険の,生涯に渡る積算値である。
◆PYLL (Potential Years of Life Lost)は,リスクの増加に伴って失われる余命の指標である。所与の生存目標年齢に達する前に死亡した場合に死亡年齢と生存目標年齢の差を求め,それを合計した値になる。
◆ゼロ歳における損失余命(Loss of Life Expectancy at Age Zero)は,生存目標年齢を平均寿命にした場合のPYLLの一つである。
29. 観察的疫学研究と介入研究の違い
◆観察的疫学研究では,研究者自身が対象集団に対して意図的に介入し,疾病に関する状態を能動的に変えることはない。
◆介入研究では,研究者自身が集団に対して意図的に介入し,能動的に割付けを行って,介入の結果によって疾病改善効果が見られるかどうかを検討する。
◆疫学研究においては,アプローチの違いというよりも,段階の違いと考えるべきである。観察的疫学研究を行わずに(つまり疾病の自然史について確かな情報がないままに)いきなり介入研究をすることは,まずありえない。
30. 記述疫学
◆descriptive epidemiologyの訳語(Last JM編A Dictionary of Epidemiology 4th Ed.ではdescriptive study,つまり記述研究という項目になっている)
◆変数の分布を記述することのみに関心があり,そのためにのみデザインされた研究をいう。その研究デザインには因果関係あるいは他の仮説検証を含まないが,得られたデータは状況把握と仮説構築に用いられる。その意味で疫学研究の第一段階といえる。上記分類で言えば,観察的疫学研究に含まれる。
◆既に触れたように,ロンドンでのコレラ流行状況をまとめたSnowの研究は,すぐれた記述疫学研究である。
31. 生態学的研究(地域相関研究)
◆ecological studyの訳語
◆集団を単位として,異なる地域に共通する傾向があるかの検討または一つの地域での経時的傾向を調べる(生態学の中ではアレンの法則やベルグマンの法則を想起されたい)。通常は二次資料の解析になるので,観察的疫学研究になる。
◆交絡因子(撹乱要因)の影響を受けやすい欠点がある(ecological fallacyがありうる)
◆汚染物質の分布,汚染物質の食物連鎖,リスク評価などに用いられる。
◆多因子の交互作用も含めて考えるためには,重回帰モデル,多重ロジスティックモデル,対数線型モデル,比例ハザードモデルなど,多変量の統計モデルを用いるのが普通だが,生態学的誤謬には注意する必要がある。
32. 生態学的誤謬(ecological fallacy)
◆ecological fallacyは,通常,生態学的誤謬と訳される。交絡が生じている場合に,集団を単位とすると,個人レベルでの真の関係とは違う関係が見え,間違った推論をしてしまうことを指す。例えば下表(1)のデータからでは(2)「X=1でX=0に比べY=1となるリスクは2倍,X=1でもX=0でもA群でB群に比べY=1となるリスクは7/8倍」なのか(3)「X=1でX=0に比べY=1となるリスクは1/2,X=1でもX=0でもA群でB群に比べY=1となるリスクは8/7倍」なのか判別不能(出典:Greenland S (2001) Int. J. Epidemiol., 30: 1343-1350.)
A群B群
Yの値X=1X=0X=1X=0
(1)地域相関研究データ(A群とB群でY=1のオッズは同じに見える)
Y=1560560
Y=060401004060100
オッズ5.65.6
(2)共変量Xで層別すると各層でA群がB群よりY=1のオッズが低い場合
Y=1420140560320240560
Y=060401004060100
オッズ7.03.55.68.04.05.6
(3)共変量Xで層別すると各層でA群がB群よりY=1のオッズが高い場合
Y=1240320560140420560
Y=060401004060100
オッズ4.08.05.63.57.05.6
33. 横断的研究(断面研究,cross sectional study)
◆対義語は縦断的研究(longitudinal study)
◆本来の意味は,時間軸と空間軸を考えたとき,1つの時間で広い空間の断面を切って観察するのが横断的研究。1つの空間を固定して時間軸に沿って長期間観察するのが縦断的研究。
◆一般に観察的疫学研究である。
34. 症例対照研究
◆患者対照研究ともいう。case control studyの訳語
◆ある時点で疾病をもっている人を患者群として捉え,その時点でその疾病をもっていない人を対照群として捉え,過去に遡ってリスク因子への曝露の有無を調べ,曝露状況が患者群と対照群とで異なっているかどうかを調べる研究デザイン。
◆つまり多くの場合,後ろ向き研究(retrospective study)となる。広義の縦断研究には含まれる。
35. コホート研究
◆コホート(cohort。人口学ではコウホート,疫学ではコホートと書く)とは,何らかの共通特性をもった集団として一時点を共有するものをさす。
◆人口学では普通,同時出生集団をさし,例えば「1980年生まれ女子コウホート」のように使う。
◆疫学のコホート研究は,あるリスク因子に曝露した集団を,その後,コホートとして追跡調査(follow up study)し,疾病の発生率を観察するデザインが多い。そのリスク因子への曝露だけが異なる対照があると理想的だが,現実には難しい。
◆相対危険(=リスク比や率比)を求めることができ,リスク因子の複数の疾病発生への影響を調べられるが,研究に時間と費用がかかる
36. ケースコホート研究とコホート内症例対照研究(nested case-control study)
◆対照が症例と同じコホートから選択されるが,その選択が症例の発症前に行われる症例対照研究をケースコホート研究という。ケースコホート研究の対照群には後に発症する人も含まれうる。
◆ケースコホート研究のオッズ比は,稀な疾患でなくても累積罹患率の推定値となる。
◇これに対して,コホート内症例対照研究(nested case-control study)は,追跡中のコホートから発生した患者を症例群とし,同じコホート内の非患者の中から適切な対照群を選択する(選択が症例の発症後に行われる)
◇コホート内症例対照研究のキモは,コホートの過去の情報に遡って症例対照研究を実施するということである。コホート全体について予め定期的に情報は得ておく必要があるが,比較的低コストで(場合によっては別の大きなコホート研究の一部として)バイアスの少ない研究をすることができる。元のコホートがあるので,欠損値をそこから推定することも行われる場合がある。
(参考)RのNestedCohortというライブラリを使えば,コホート内症例対照研究のデータから適切な生存時間解析を行うことができる。
37. 介入研究
◆介入研究では,研究者自身が曝露をセッティングすることにより,曝露以外の要因について差がないと期待される対照群を作り出すことができる。通常は曝露群と対照群にランダム割付する。
◆薬を開発する際の臨床試験(clinical trial)で盛んに行われる。病院で行われる場合は,デザインは製薬会社の疫学者が行い,CRC(治験コーディネータ)が疫学者と医師の橋渡しをしながら,実際に患者に接してインフォームドコンセントを得たり投薬したり治療成績を得たりという現場段階を医師が担う場合が多い。
◆臨床試験には第1相から第4相まである。
◆中でもRCT(Randomized Controlled Trial; ランダム化統制試験)は,最も科学的に厳密な仮説検定の方法とみなされている。
◆第3相臨床試験では,通常RCTが行われる。
○この項については,午後の「生物統計学」で詳しく説明する。
38. 疫学研究倫理指針
◆2002年に文部科学省と厚生労働省が合同で発表した指針
◆疫学研究は人間を対象とするので,倫理面での配慮が不可欠
◆とくに介入研究では曝露条件をセッティングするので,十分に統制された実験をする必要がある
◆観察的研究や記述疫学研究であっても,プライヴァシーへの配慮が必要
◆文書によるインフォームドコンセントは必須(侵襲を伴わない場合は不要とされるが,得ておくほうが無難)
◆倫理審査委員会による審査を通らないと研究できない
39. 誤差
◆誤差=真値との差
◆標本誤差=標本抽出の偶然変動に伴う母集団の真値との差(標本サイズが大きいほど小さい)
◆非標本誤差=標本誤差以外の誤差(例えば不適切な標本抽出による誤差)
◇ランダムな誤差(偶然誤差)
◇ランダムな誤差が小さい=精度(precision)が高い
★系統的な誤差=バイアス。研究デザイン,データ収集,分析,レビュー,出版など,研究のさまざまな段階で起こりうる。
★系統的な誤差が小さい=正確さ(accuracy)が高い
40. バイアス(bias)の種類
◆選択バイアス(selection bias):観察する集団が母集団を正しく代表していないときに起こる偏り
◆情報バイアス(information bias):観察するときに得られる情報が正しくないために起こる偏り
◆交絡バイアス(confounding bias):分析疫学で起こる特殊な偏り。要因と疾病の両方と関連する交絡因子の存在によって起こる
41. バイアスの制御
◆無作為化(randomization):ランダムに群分けをする(ランダム割付をする)ことで介入以外の条件を確率的に均質化
◆マッチング(matching):交絡因子の条件が似るように対照群を選ぶこと。ただし後述するように,コホート研究では有効だが,患者対照研究では要注意である。
◆層化(stratification):交絡因子のカテゴリ別に解析することで交絡因子の影響を除く
◆標準化(standardization):基準集団を決めて交絡因子のカテゴリ別割合を調整することで交絡因子の影響を取り除く
◆限定:交絡因子の1つのカテゴリに属する者だけを対象として分析することで,交絡因子の影響を取り除く
42. 因果関係
◆疫学の目的は,集団の健康を増進し守り保つことであり,そのために健康に影響する要因を明らかにするのだから,要因→影響の関係をはっきりさせることが大事である。
◆しかし,相対危険と過剰危険のところで触れたように,そこをはっきりさせることは難しい。
◆要因と影響の間に何らかの関連があることは,数学的には相関関係で表される。が,因果関係があるかどうかは別物である。
◆もっとも強い因果関係は,生物学的に,要因が影響を起こすメカニズムが明らかであり,それが常に成り立つ場合にいえる(生物学的因果関係)。
*因果関係のモデル:
43. 関連の種類
◆真の関連ではない場合(不適切な研究デザイン,バイアス,交絡因子の未調整,身勝手・気まぐれ・見かけの関連)
◆生態学的相関(集団が異なっているので因果関係はわからない〜あるかもしれないしないかもしれない)
◆単なる偶然(第一種の過誤を犯している。逆に数値的に関連が見られなくてもサンプルサイズが小さいなどの理由で第二種の過誤を犯している場合もある)
◆二次的関連である場合
◆生物学的因果関係がある場合
44. 生物学的因果関係を導く指針(どれも絶対ではない)
◆科学的常識
◆Henle-Kochの4原則【1.〜3.を3原則という】
  1. その病原体が当該感染症患者から分離される
  2. その病原体は他の疾病患者には見出されない
  3. 患者から分離培養された病原体が実験動物に同一疾患を発生させる
  4. 当該罹患動物から再び同一の病原体が分離される
◆動物実験・実験室的事実
◆病理学的事実
◆観察疫学的事実=Hillの基準:(1)関連の特異性(2)関連の強さ(3)用量−反応関係(4)一貫性(5)整合性(6)蓋然性=もっともらしさ(7)時間的前後関係
◆介入研究・実験疫学・臨床試験
◆メタアナリシス
45. 個人レベルで因果関係は立証できるか?
◆例えば,メキシコに旅行することが「新型」インフルエンザ,つまりinfluenza A (H1N1) Mexico City 2009への罹患の要因となるかどうかを知りたいとする。
◆Aさんという個人に着目すると,Aさんはメキシコに旅行するかしないかどちらかの行動しかとりえないし,「新型」インフルエンザに罹るか罹らないかのどちらかの結果しかありえない。
◆つまり,Aさんがメキシコに旅行して「新型」インフルエンザに罹ったという事実があるときに,その旅行が罹患の因果的な原因であることを立証するためには,もしメキシコに旅行しなかったら「新型」インフルエンザに罹らなかったという事実を示さなくてはいけないが,事実としてメキシコに行ってしまっていて,行かなかったという事実がありえないので,個人レベルでの因果関係は立証不可能である。
◆こういう考え方を反事実(counterfactual)モデルという。
◆すると,目の前の患者さんの病気について,因果関係を明らかにすることはできないのか?
46. 集団レベルでなら立証可能
◆喫煙していて肺がんにかかったAさんが喫煙しなかった場合の観察事実はありえないが,喫煙という曝露条件をもつ集団Aに対して,喫煙以外の条件がほとんど同じ集団Bを設定して,集団Aと集団Bの間で肺がんの発生率を比較することはできる。
◆集団レベルの因果関係がいえれば,個人でもその可能性が高いだろうと推論できる
◆実は,この集団AとBが,喫煙という要因が肺がんという疾病に影響する関係における,曝露群と対照群である。◆「喫煙以外の条件がほとんど同じ」になるように対照群を選ぶ操作をマッチングと呼ぶ。
◆ただし,患者対照研究ではマッチングに注意が必要である(というのは,それが選択バイアスの原因になることがあるからである。患者対照研究における対照は母集団における要因への曝露の分布を正しく代表している必要があるのに,もしマッチングに使った要因が曝露と相関していたら,母集団における曝露を正しく代表するサンプルにならないことは明らかである)。患者対照研究におけるマッチングは層別解析の効率を上げることには寄与するが,バイアスの制御には全く寄与しないことに注意されたい(出典:Rothman KJ, Greenland S, Lash TL: Chapter 11. Design strategies to improve study accuracy. In: Rothman KJ, Greenland S, Lash TL [Eds.] Modern Epidemiology, 3rd Ed., Lippincott Williams & Wilkins, 2008, pp.168-182.)
47. 因果パイモデル
◆複数の因子を含む因果関係では,その因子の組み合わせは一通りとは限らない。
◆それらの因子が揃えば必ず疾病が起こるという条件の組を十分要因群(sufficient causes)という。十分要因群を構成する個々の要因を構成要因(component causes)という。
◆十分要因群の組を円グラフの形で表したものを因果パイモデルと呼ぶ(下図は,ある疾病を引き起こす3種の十分要因群;出典はRothman, 2002)
因果パイモデル(Rothman, 2002)
48. 交絡要因とその調整
◆注目している要因ではないが,注目している要因と結果としての健康影響の両方と因果的に関連している要因が交絡要因(例:肥満を要因とする高血圧という関係における年齢など)
◆交絡要因は,先に述べたマッチングのほか,交絡要因が同じ集団ごとに層別して分析する「限定」や,交絡要因の割合が注目している要因が異なる群間で確率的に同じになるように割り付ける「ランダム化」(ランダム割付)などで調整する必要がある
◆交絡要因の判別には因果グラフ(とくに有向非巡回グラフ:DAG)を利用すると便利である(佐藤・松山,2002を参照)。

リンクと引用について