Top
個別メモ
Latest update on 2012年3月5日 (月) at 10:54:46.
【第443回】 実習処理とか学会業務とか(2005年12月21日)
- 6:40起床。眠い。このうえ寒さまで感じたら起きだせないに違いないと読んで,厚着をして眠ったのは正解だった。さてしかし。昨日以上にアイスバーンで,昨夜の帰り道のツルツルだったり氷がうねっていたりする恐ろしさを思い出すと,とても帰りに自転車に乗る気はしないので,日和って長野電鉄に乗った。結果として往路あさま512号。高崎から水上行き上越線は2分待ちで発車するので,効率はよい。
- 研究室に着いてみると,『The R Tips』の舟尾暢男さんの新しい著書(高浪洋平さんという方と共著),『データ解析環境「R」』工学社,ISBN 4-7775-1184-7(Amazon | bk1)が届いていた。ご恵贈ありがとうございます>舟尾さん。
- R関係の本は,これまで,コンピュータにも統計にもある程度触れたことがある人を対象としたものばかりだったが,この本は本当に初心者用だと思う。スクリプトエディタやデータエディタの使い方にも触れられているし(つまり他のソフトを使わなくても,この本を見ればRだけでデータ入力もプログラミングもできるわけだ),データの読み込みとデータフレームの扱いにも1章が割かれ,丁寧に図解されている。CD-ROMが付いているので,ネットにつながっていなくても,買ってすぐに使えると思う。その分,グラフィックスも1章,統計解析も1章しかなくて,本当の初歩というか導入編しか書かれていないけれども(fisher.test()の出力の説明でも,オッズ比の点推定量と信頼区間は,名前が書いてあるだけで説明はない。その辺を知りたい人には『宇宙怪人しまりす』を薦める。ただし,グラフィックスについては,低水準作図関数も紹介されている),進んだことが知りたければRjpWikiなり青木先生のサイトなり,これまでに出た本を参照すればいいし,それらは巻末にそのように紹介されているので,実に初心者向きに考え抜かれた構成になっていると思う。残念ながらぼくは初心者ではないので,本当に初心者がこれを読んでR使いになれるかどうかは判断できないが,この本でわからなければ他の本でも駄目だろうし,サイトに出ている情報でも駄目なんじゃないかと思う。Rに触りたいけれどもコンピュータにも統計ソフトにもあまり慣れていないという方には最適の本だろう。
- オセアニア学会からニューズレターが届いた。そういえばその原稿が添付ファイルでメールされてきていたような気がするので,あれはwebサイトにアップロードしなくてはいけないんだな。
- 昨夜このメモに,『R-helpのMLにchisq.testのバグレポ(というか改良コードの提示)があった。ad-bcの絶対値がN/2より小さいときはカイ二乗値はゼロとすべきなんだけれども,Rのchisq.testはそういう場合でも連続性の補正を機械的にやってしまうらしい。通常の使い方ならこのバグはあっても問題にならないが,このコードも2.3.0では取り入れられるといいなあ。』(引用が間違っていたので若干修正。実は引用元もdevelopでなくてhelpだったことに気づいたので再修正)と書いたが,その後Prof. Brian Ripleyからの返答があり,2ヵ月前にも同じ指摘があってYatesの元文献を読んでチェックしたところ,Rのコードは元文献の指定を完全に満たしているし,カイ二乗分布はゼロという値は取らないのでバグではないという判断で不採用になった(ので,昨日のメモからこっちに持ってきた)。『Rによる統計解析の基礎』にも「ad-bcの絶対値がN/2より小さいときは,補正の意味がないのでカイ二乗値はゼロとする」と書いたのだが,これは元を辿ると,学生のときに受けた「データ解析法演習」という講義の中でそのように(「ゼロにするのが決まり」と)習ったので,とくに原典に当たることもなく書いたものである。手元の多くの統計のテキストを読んでみても,ad-bcの絶対値がN/2より小さい場合についての言及はなく,根拠を見つけることができなかった。連続分布に近づけるための補正なんだから,そもそもゼロ付近ではあまり意味がないようなものだとは思うが,もし第5刷が出るようなことがあったら,この記載は削除しておこうと思う。サポート掲示板にも掲載した。(追記)このメモに対しメールでコメントいただき,prop.test()ではこういう過剰修正はされず,abs(a*d-b*c) <= N/2ならカイ二乗値はゼロになることを知った。とすると,Prof. Ripleyの主張は弱いな。実は連続修正を巡っては,やらない方が正しいという話も含め,いろいろな議論があって難しい内容を含んでいるので,とりあえず入門書では触れない方がいいかもしれない。どちらが良い近似になるかシミュレーションして評価するか,とも考えたが,どちらにしてもあまり良い近似ではなさそうなので,ゼロの近傍でのこの近似についてちゃんとした数学的な根拠がわかるまでは触れないでおこう。
- 復路は今日もあさま551号+553号。今日の551号の車内にはどういうわけかマンガ本がたくさん放置されていて,息子が好きな少年ジャンプもあったので拾って帰った。
- 帰宅して食後,風呂に入ってから,オセアニア学会仕事の続きをする。これが終わったらメールを何本か打って眠る予定だが,はて何時間眠れるだろうか。
▼前【442】(アイスバーン(2005年12月20日)
) ▲次【444】(大掃除・残務処理・忘年会(2005年12月22日)
) ●Top
△Read/Write COMMENTS
Notice to cite or link here | [TOP PAGE]