山口県立大学 | 看護学部 | 中澤 港 | 疫学

疫学第5回:二次的データの解析

既存資料の利用,疾病登録,スクリーニング,サーベイランス,メタアナリシスなど,自分で標本調査をするのではない疫学研究法のいろいろについて概説する。Evidence-Based Medicineの考え方にも触れる。

1.既存資料の利用

テキスト第11章の内容に相当する。

既存資料を用いる際の留意点
●(1)診断の精度が一様でない,(2)登録漏れや重複登録がある,(3)地域調査資料がある場所が限られている,などの偏り。
●国の調査の個票を目的外使用するときの手続きは面倒だし高価。
●しかし,規模が大きく精度が高いと思われるので価値は大きい。
既存資料の種類
●現在では,Googleなどで検索するとWEBサイトから入手できるものが多い(既に厚生労働省統計表データベースシステムから市区町村別生命表も全部ダウンロード可能になっていた)
●人口統計:国勢調査,その他の人口静態統計,人口動態統計,日本の将来推計人口等。移動統計は国勢調査に含まれているが人口動態を示すものであることに注意(人口動態統計には含まれていない)。
●疾病統計:傷病に関する統計資料。伝染病統計(テキスト「疫学」の説明には,伝染病予防法とあるが,1998年に性病予防法,エイズ予防法と統合されて「感染症の予防及び感染症の患者に対する医療に関する法律」(感染症予防医療法)となって1999年から施行されているので注意。参考:公衆衛生学第9回講義資料),食中毒統計(参考:公衆衛生学第12回講義資料),感染症サーベイランス事業,患者調査等
●死亡統計:人口動態統計に含まれる。市区町村別の資料は,都道府県発行の「衛生統計年報」参照。死因分類については後述。
●保健行政統計:疾病等の分布の背景因子として。医療施設調査・病院報告,老人保健施設実態調査等
●生活環境,栄養に関する統計(疾病等の分布の背景因子として。生活環境統計や国民栄養調査等
既存資料を利用した解析の例(多くは地域相関研究になる)
●長野県と山口県の市町村を単位とした一人当たり老人医療費と他の統計指標(例えば離婚率)の関係。
長野県と山口県の市町村別1人あたり老人医療費と離婚率の関係
長野県の市町村別老人医療費は老人医療事業年報(Excelファイル),山口県は県国保医療指導室による市町村別老人医療費支給状況(Excelファイル)から,離婚率は人口動態統計から入手した(統計表データベースから,例えば長野県の人口動態総覧第2表のようなものが使える)。
●この場合,離婚率が低い市町村の方が家庭における介護機能がしっかりしているからという解釈が一応できるが(参考:国保中央会による報告(PDF形式)),生態学的誤謬に注意しなくてはいけない。
死因について
●死因分類はふつうInternational Classification of Diseases (ICD)による。日本では1995年からICD-10を採用(多少独自細分類の追加あり)。
●複数年のデータを使うときは,適用されているICDが同じかどうかチェック。違った場合は整合性を確認。
●日本ですべての死亡が記録されているのは戸籍法の規定による。
●死因は医師により死亡診断書(死体検案書)に記入され,市区町村役場で人口動態調査死亡票作成。
●周産期死亡を除き,原死因が記載されていることに注意。

2.スクリーニング

3.疾病登録

4.サーベイランス

5.メタアナリシス

メタアナリシスとEBM
●メタアナリシスとは,系統的に集めた複数の研究結果のデータを統合して分析する手法である。Evidence Based Medicine (EBM)の考え方においては,メタアナリシスの結果がもっとも強い証拠となる。
●EBMとは,証拠(科学的な根拠)に基づいた医療という意味だが,中山書店発行「EBMジャーナル」Vol.2 No.5所収の西條長宏氏の説明によると,

EBM (evidence-based medicine )という言葉は ACP Journal club March/April 1991, A-16 に Gordon H.Guyatt が Editorial として最初に記載した。同じ年にSackett は教科書 Clinical Epidemiology, a Basic Science for Clinical Medicine の中で EBM の定義を「個々の患者をケアーする際の意思決定をその時点で得られる最善のエビデンスに基づいて行うこと」としている。

EBM は(1) 疑問を定式化する formulation 、(2) エビデンスの search 、(3) エビデンス内容の妥当性、臨床的適応性の critical appraisal 、(4) 実際の application, の過程からなる。

●同じ西條氏のEBMジャーナルVol2. No.6の文によれば,

(1) エビデンスの質の分類

Level 1ランダム化比較試験(あるいはメタ分析)による
Level 2非ランダム化比較試験による
Level 3コホート研究や症例対照研究などの分析疫学的研究による
Level 4ケースシリーズやそのほかの記述的研究による
Level 5上記の種類のエビデンスに言及しない,専門委員会やエキスパートの意見


とあり,メタアナリシスの結果は,RCTの結果と同様の証拠を提供すると考えられている。
メタアナリシスの事例
●ちょっと古い話だが,精子数減少を提唱した論文の話を5年前に書いたウェブ日記から,若干改訂して再掲する。
●デンマークのコペンハーゲン大学病院発達生殖学部に,ニルス・スキャケベクという教授がいる。彼は,子どものホルモン障害や男性不妊の研究に長年取り組んできた。あるとき一人の健康な男性の精液検査を行った結果,それまでの1億個/mLという常識からすると少なすぎる値で,異常精子も多かったことから,「常識」の方を疑ったのであろう,普通の男性の精子数にかんする文献収集をはじめた。先行研究で報告されている値を一定の基準でまとめて分析すれば,もしかしたら精子数にかんする常識が覆るかもしれないという発想で,メタアナリシスを行ったのである。
●メタアナリシスでは,先行研究を系統的に集めることが肝要である。彼らの文献の集め方は次の通りである。[1]Silver Platter社のMEDLINEを使って1966年から1991年8月までに出版された論文から,sperm count, sperm density, sperm concentration, male fertility, semen analysisをキーワードにして検索し,1930年から1965年についてはCumulated Index Medicus,1957年から1959年についてはCurrent Listで,それぞれspermatozoa, semen, fertilityをキーワードにして検索し,これらの引用文献にあるものからいくつかを追加し,まず網羅的なリストを作る。[2]このリストからヒトを対象とした研究だけを選択し,かつ次のどれかに当てはまったら除外した:乏精子症あるいは他の生殖機能異常とされる男性あるいは不妊のカップルの男性を含む/精子数が高いか低いものとして選択された男性を含む/精子数の測定法がコンピュータ支援システムまたはフローサイトメトリーによるもの。こうして集められた文献は,61篇であった。少ないような気もするが,この程度の数で分析されることはよくある。総サンプル数は約15000であり,文献毎に精子濃度の平均値をサンプル数で重み付けして分析している。
●これらの論文から抜き出した精子濃度(1 mLあたりの精子数)を,論文発表年次を横軸にしてプロットしたところ,減少傾向があって,単回帰分析をしたところ精子濃度は年次によって有意に説明され,1940年から1990年までの50年間でほぼ半減していることがわかった,というのが,彼らの研究の眼目である(Carlsen et al., 1992)。この結果で最も恐ろしいのは,「世界中で」「直線的に」減少している,という点である。スキャケベックたちは,同じ手口で精巣ガンの発生率が上昇傾向にあることを見出し,これらが互いに関連していて,どちらも環境内分泌撹乱物質の影響であるという可能性を示唆している(Skakkebaek et al., 1998)。
●1992年の論文結果については,当然のことながら各方面から批判が続出した。彼らの解析自体についても,単回帰では分散をたかだか40%くらいしか説明しない点と,回帰を有意にすることに大きく寄与している前半30年間のデータが少ない点を中心に多くの批判があったし(例えば,Olsen et al., 1995),一つの地域で長期間とられたデータの経時的な比較では変化していないという反証も多く発表された(例えば,Fisch et al., 1996)。論戦が続いているところで出てきたのが,Shanna H. Swanらによるメタアナリシスのやり直しである(Swan et al., 1997)。彼女たちは61篇中56篇の元論文を読みなおして(除外した5つのうち3つは英語でないという理由である),研究が行われた場所(合州国かヨーロッパ・オーストラリアか非欧米か),サンプル前禁欲期間,対象者の年齢,授精能力があるとわかった男性の割合,サンプル採集法を追加抽出して,これらを共変量としてコントロールした重回帰分析を行った。さらに,回帰モデルとして,直線のほかに,階段型(1970年まで一定値,1970年に減少してそれ以降はまた一定値),スプライン(1970年前後で2本の回帰直線),2次式(年次の2乗の項も含める)についても検討している。情報の不足から残るであろう交絡とバイアス(メタアナリシスでは不可避)についても検討しており,メタアナリシスのお手本のような論文になっている。
●しかし,「直線的な減少」と結論付けることには無理がある。スプラインモデルでも分散は79%説明されているし,その場合1970年以降は横ばいであることとか,彼女たちの分析でもいくつかの撹乱とバイアスの可能性は残ることとかを無視するのは,科学者として正しい態度ではない。Swanらは,非欧米で有意な傾向が見られなかった原因を,いろいろな地域のデータが混ざっていることと,観察期間が短いことに帰しているが,前半30年間のデータが合州国のみで,しかも数が少ないことを併せて考えれば,「この50年間にわたって世界中で減少し続け」というプロパガンダは明かにやりすぎである。
●FischとかPaulsenの論文をみると,合州国でも減っていないデータがあるし,最近でも1 mLあたり1億個を超える場所もある。地域差が大きいことは本質的に重要である。場所が違えば傾向が違うことがデータで示されていることを意図的に無視してはいけない。
●なお,Swan論文への批判として出たBecker and Berhane (1998) では,傾きがずっと緩やかな回帰になっている。
参考文献
○Elisabeth Carlsen, Aleksander Giwercman, Niels Keiding, and Niels E. Skakkebaek (1992) Evidence for decreasing quality of semen during past 50 years. British Medical Journal, 305: 609-613.
○Geary W. Olsen, Charles E. Ross, Kenneth M. Bodner, Larry I. Lipshultz, and Jonathan M. Ramlow (1995) Have sperm counts been reduced 50 percent in 50 years? A statistical model revisited. Fertility and Sterility, 63(4): 887-893.
○Niels E. Skakkebaek, E. Rajpert-De Meyts, N. Jorgensen, Elisabeth Carlsen, P. M. Petersen, Aleksander Giwercman, A. G. Andersen, T. K. Jensen, A. M. Andersen, and J. Muller (1998) Germ cell cancer and disorders of spermatogenesis: an environmental connection? APMIS, 106: 3-11.
○Shanna H. Swan, Eric P. Elkin, and Laura Fenster (1997) Have sperm density declined? A renanalysis of global trend data. Environmental Health Perspectives, 105(11): 1228-1232.(全文
○Stan Becker and Kiros Berhane (1998) Re: "Have Sperm Densities Declined? A Reanalysis of Global Trend Data." Environmental Health Perspectives, 106(9): 420-423.(全文
○コクラン共同計画「システマティックレビュー」(福井直仁)

Correspondence to: minato@ypu.jp.

リンクと引用について