群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
第11回に出てきた関数と文の主なものはこちらを参照されたい。
http://phi.med.gunma-u.ac.jp/medstat/it2010-11.txtは,3つの変数JOB,HEALTH,WEALTHからなる架空のデータである。JOBは就業状態を意味し,workingとretiredの2つの値からなる。HEALTHは主観的健康状態を意味し,goodとbadの2つの値からなる。WEALTHは主観的な裕福さを意味し,richとpoorの2つの値からなる。HEALTHとWEALTHのクロス集計表を作成し,それら2つが独立であるという帰無仮説をフィッシャーの正確な検定で検定したところ,有意水準5%で帰無仮説が棄却されたので,JOBで層別して有職者(working)と退職者(retired)で別々にHEALTHとWEALTHが独立であるという帰無仮説をフィッシャーの正確な検定で検定したところ,いずれも有意でなかった。しかしマンテル=ヘンツェルの要約カイ二乗検定を行ったところ,有意水準5%で統計学的に有意な結果が得られた。以上の解析を実行するコードと解釈を以下に示す。
http://phi.med.gunma-u.ac.jp/medstat/it2010-11.txt is the tab-delimited text file, which is composed of 3 variables as JOB, HEALTH, and WEALTH. JOB means the status of "working" or "retired", HEALTH means subjective health status of "good" or "bad", and WEALTH means subjective wealth status of "rich" or "poor". This is imaginary data.
After reading the data, we made cross tabulation between HEALTH and WEALTH, then test the null-hypothesis that those 2 variables are independent each other, using Fisher's exact test. Consequently, the null-hypothesis was rejected at 5% level. Then we stratified the data by JOB, and tested the null-hypothesis that HEALTH and WEALTH is independent in either of "working" or "retired" by Fisher's exact test. The results were not significant in either of "working" or "retired". However, the pooled analysis using Mantel-Haentzel chi-square test resulted to reject the null-hypothesis. The code and result with its interpretation are shown below.
学籍番号・氏名とともに,下のフォームと解釈文を穴埋めして送信せよ。
Please write the registry number and name, fill the boxes by adequate characters.
コードは以下の通り。
(The code is shown below.)
x <- read.delim("http://phi.med.gunma-u.ac.jp/medstat/it2010-11.txt") # read data into x
TAB <- xtabs(~+, data=x) # make a cross table of HEALTH and WEALTH
fisher.test(TAB)
TABS <- xtabs(~++, data=x)
fisher.test(TABS[,,"working"])
fisher.test(TABS[,,"retired"])
(TABS)
以上の結果から,就業状態は主観的健康状態と主観的裕福さの関連について交絡因子になっていると(1:いえる, 2:いえない)
Based on the above results, we (1: can, 2: cannot) say that the job status is confounding the relationship between subjective health status and subjective wealth.
項目 | 入力欄 |
---|---|
HEALTH | |
WEALTH | |
JOB | |
mantelhaen.test | |
2 |
(注)クロス集計表を作る場合,通常,原因(要因曝露)を左(行の変数)に,結果(疾病)を上(列の変数)にとるので,(A)がWEALTH,(B)がHEALTHという考え方もありうる(それでもよい)。ここでは2つの理由から,どちらが上でどちらが左でも問題ない。第1の理由は,ここで検討しているのが「2つの変数の間に関連が無い」という帰無仮説であって,相関関係と同じく,数学的には向きを考慮しないからである。第2の理由は,WEALTHもHEALTHも同時に取られた「主観的」な値なので,必ずしも豊かさが健康に影響するという関連に限らず,健康だと感じているほどしっかり働けて豊かにもなるという因果の向きも想定可能だからである。
(注2)交絡要因は,原則として,原因と結果の両方に影響を与えている第3の要因である。結果を説明するモデルに,その要因を入れるか入れないかによって他の原因と結果との関係が違ってくるなら,一般に,その要因は交絡要因とみなすべきである。