Latest update on 2018年3月7日 (水) at 15:42:47.
【第1398回】 家で洗濯しながらレポートを見る(2016年9月11日-12日)
- 今日も二度寝してしまって10:00起床。洗濯物が溜まったので洗濯機を回しながら朝食をとり,レポート評価の続き。我ながら効率悪い。
- 一日中レポート評価をしていて深夜2時過ぎに就寝。
- 月曜は6:00に起きてレポート評価の続き。7:00頃漸く完了。冷凍豚小間切れと冷凍野菜を茹でて湯を切って塩で味付けしたおかず+ご飯で朝食を済ませて出勤。
- 10:00から院生の相談に乗っていたのだが,拡張マクネマー検定(McNemar test for symmetry,あるいは,Agrestiのテキスト"Categorical Data Analysis"のpp.424によると,Bowker's testともいうらしい)を使ったらRのmcnemar.test()がNaNを返してくるというエラーに遭遇した。通常の2x2のMcNemarの検定の場合は,N12(1回目はカテゴリ1で2回目はカテゴリ2に変化した人数;以下同様)とN21の両方がゼロだったら2回の間でまったく変化していないということだから,検定する必要がなくなり問題はない。しかし,カテゴリ3つ以上の場合は,例えば,N13はゼロでないがN23とN32がゼロ,という状態だと,(N23+N32)が分母になる項で"Division by zero"エラーがでてしまって,カイ二乗値の計算結果自体がNaNになってしまうのだ。この問題への対処としては,その項をスキップするか(カイ二乗検定をするときにスキップした項数だけ自由度を減らせば良いはず),あるいは全部のセルに極めて小さい数字を足すかすれば計算できるし,実際に"Division by zero"を避けるために全部のセルに0.01を足したと書いてある文献を1つ見つけたのだが,有名どころのテキストにはどうすべきか書かれていないのだった。これはどうするのが良いのだろうか?
- ちなみに,共立出版「Rで学ぶデータサイエンス」シリーズの藤井良宜『カテゴリカルデータ解析』には,丁寧に拡張マクネマーの考え方が書かれているけれども,やはり分母がゼロの項をどうすべきかについては触れられていなかったし,「Wonderful R」シリーズの奥村晴彦『Rで楽しむ統計』では,拡張マクネマーについては触れられておらず,そもそも連続量をカットオフで二値化したものならば連続量のままt検定した方が良いという説明がされていて,それはその通りなのだけれども,今回の場合は元々4水準の名義尺度なので,そういう王道はとれないのだった。
- 結局,今回はカテゴリを併合して2x2にした方がすっきりして,かつdivision by zeroの問題も消えたので良かった。けれども,一般論としてこの場合にどうしたら良いのかは知っておきたいところだなあ。
- ご恵贈御礼。月刊トレーニング・ジャーナルの10月号が届いた(いつもありがとうございます)。表紙はリオ・オリンピックでの内村航平選手の跳馬の写真で,特集は「コンディショニングの工夫」。コンディショニングには準備と栄養と睡眠が重要という視点はその通りと思った。
- 11:55頃に研究室を出て六甲へ移動。瀧川記念で科研費説明会を聴いて戻ってきたが,外が暑いのに閉口した。夕方から再び院生の相談に乗ってから若干の書類仕事をしたら20:00近い。
- 名谷駅まで急いだが終バスを逃してしまったので,新長田から海岸線に乗り換えて神戸駅に出て,成城石井でサラダとかを買って帰宅した。
△Read/Write COMMENTS
▼前【1397】(まだ成績評価が終わらないがGOLE1への物欲に駆られたりとか(2016年9月10日)
) ▲次【1399】(東京出張前にゼロ割対応版拡張マクネマー検定の関数を書いてみた(2016年9月13日)
) ●Top
Notice to cite or link here | [TOP PAGE]