Latest update on 2018年3月7日 (水) at 15:42:47.
【第576回】 院生指導後に東京で講義(2014年1月21日)
- 6:00起床。中山さんのtweetで佐久間正英さんがとうとう亡くなったことを知った。昨年末のNHKのドキュメンタリーを見て,その音楽への思いの強さに圧倒され,SAKUMA DROPSは絶対買おうと思ったが,発売日まで保たなかったのは大変残念だ。佐久間さんがキーボードを弾いていたPlasticsのCOPY(リンク先はYouTubeでみつけたライブ映像。今見てもハイセンスで格好いい)でのデビューは,たしか中学生の頃だったと思うが,実に衝撃的だった。合掌。
- 今日は9:00から院生とのアポがあり,午後は東京で非常勤の人口学講義があるのでSKYMARKで往復予定。
- 院生とのディスカッションは1時間半以上かかり,終わってすぐ,11時過ぎに研究室を出た。名谷から三宮に出て,ポートライナーで神戸空港に着いたのが12:05頃だった。SKYMARKの自動チェックイン機でボーディングパスを発券後,3階のレストランで昼飯。空腹だったせいもあると思うが,ここで頼んだロイヤルカツカレーが信じがたいほど美味だった。カツも分厚く,衣がサクサクで肉は柔らかいのに弾力があり旨みもあったのだが,それ以上に,何が具に入っているのかわからないほどトロトロのルーが複雑かつ絶妙なバランスのとれた味であった。ただ,一口目に熱すぎるのをガブッと口の中に入れてしまったせいで,若干やけどをしてしまったのは想定外だったが。
- 羽田空港に予定通り着き,東京駅に着いたのが15:00頃だったか。16:40からの講義には早すぎるので,本郷三丁目ではなく御茶ノ水で丸ノ内線を降りた。ついでに駿河台方面を見ておこうと思ったら,いつの間にかすっかり楽器街になっていて驚いた。今年の人口学会が行われる明治大学の建物の巨大さに圧倒されつつ,ただ坂を上がるのではつまらないのでスキー用品店が並ぶ通りを神田方面に歩き,途中で左折して秋葉原の裏道を通って神田明神を横目に見ながらさらに進み,坂を登り切ったところで右折して,本郷三丁目郵便局がある細い通りを歩いて東大龍岡門に着いたのが16:00頃だった。講義に使う機材の都合などで16:40を少し過ぎてから講義を始めたので,予定の18:10を少し超えてしまったが,たぶん正味90分くらいには収まったと思う。数理人口学というネタは,さわりだけとはいえ,90分で講義するにはいろいろ無理があるのだが,雰囲気くらいはわかってもらえたと思う。後は講義中に紹介した資料で自習して貰えたら嬉しい。
- 18:25頃帰途に就き,バスで御徒町に出てから山手線で浜松町乗り換え,モノレールで羽田空港第一ターミナルに19:10頃到着。SKYMARKの自動チェックイン機での発券は一瞬で済み,手荷物検査場を通ってから晩飯を食べようと思ったが,お茶漬けの店でお茶漬けが品切れだったので,仕方なく売店でお握り1個とまい泉のカツサンドを買って食べた。
- 復路飛行機も予定通り。ポートライナーを貿易センター前で降り,バス停に歩いたら,ちょうどいいタイミングでバスが来て,22:30頃帰宅できた。Door to doorで片道4時間は便利といえば便利だが,それでも疲れた。
- 飛行機とかバスで移動が長かったので,昨日も触れた,石田基広『とある弁当屋の統計技師(2)因子分析大作戦』共立出版,ISBN 978-4-320-11082-3(Amazon | honto | e-hon)を読了(まだ発売日より前だが)。因子分析と主成分分析の違いの説明の仕方はお見事。因子分析のモデルという面倒くさいものを,よくここまで噛み砕いて,しかも面白く説明したものだと感服した。回転の説明も厳密にやろうとすると難しいのだが,イメージとしての与え方はうまいと思った。もちろん,実際に因子分析をするときには(英語だけれども以前簡単にまとめた説明pdf参照),いくつの因子を選び出すのが適切かというのも大問題で,スクリープロットとかパラレル分析とか固有値が1を超えるといった方法はあるけれども,こうすればいいという決まったやり方はないので,本書では最初から因子数2が決まっているという設定だし,バートレットの球面性検定により関連の乏しい変数が入っていないかのチェックをするという話も入っていないし,サンプルサイズ40というのも因子分析には小さすぎるのだけれども(KMOサンプリング適切性基準での判定とかの話も必要),説明の都合上の例題だから,これはこれでありだと思う。ストーリーの骨格として,試験のクラス平均点を上げる目的で全体を底上げするのではなく少数の高位外れ値を作るという戦略と,そのために前回の試験6科目の点数から生徒一人ずつの理系因子と文系因子を抽出し,因子得点(実はその計算法も1つではないのだが,共立出版の本書の紹介ページからリンクされているサポートサイトの説明に従ってパッケージMisakiをインストールしてみたところ,factanal()関数のoptionとしてscores="regression"だった)をプロットすることで生徒の潜在能力特性を可視化する(本人が気づいていない潜在的得意科目に気づけるようにする)ところまではいいとして,ちょっと無理があったかなあと思うのは,平均点の伸び代が大きく他クラスとの差別化をしやすい科目が数学と英語なので,数学集中組と英語集中組を選ぶというところ。数学は理系因子しか影響していないので理系因子の因子得点が大きい生徒を選ぶ戦略が自明だからまだいいとしても,英語は理系・文系両方の因子が影響し,かつ独自性(uniqueness)が大きいため,英語集中組の選抜基準が曖昧なまま決めさせているのに,そこを登場人物が突っ込まない。結城浩さんの『数学ガール』シリーズならば,テトラちゃんは絶対に納得しないところだ。この物語のヒロインである美咲ちゃんは,そこまで拘らない人物造形がなされているので,物語としては成り立っているが,理詰めで納得したい読者がいたら不満に思うだろう。もっといえば,本当に点数を上げたいなら伸び代を知る必要があるし,高校の期末試験の点数など一夜漬けで結構変わるので,一度の試験結果から潜在能力を検出するというデザイン自体に無理があり,それまで何回分かの試験結果の推移と,試験ごとに各科目の勉強に費やした時間を調べてコントロールした反復測定多段階混合モデル(という言い方があるのかどうか知らないが)にでもしないと,たぶん本当の潜在能力は検出できないだろう。まあしかし,そこは本書のスコープ外だし,因子分析がこんなことに使えるよ,という入門的な説明としてはよくできていたと思う。ちなみに表紙は第1巻の主要登場人物である正規乱子&二項文太ではなく,乱子の高校のクラスメートである,渕上美咲&荻窪直樹であり,イラストレータが変わったから別人のように描かれたのではないのだけれども,p.140のイラストを見ると,乱子の絵も若干違っていた。その他細かい気になった点は以下箇条書きする。
- p.14「一般化線型モデル」を「イ ッ パ ン セ ン ケ イ カ モ デ ル」と読み間違えるのは不自然
- p.42-43で欠損値処理の方法の説明はうまい。「もう少し厳密にやるなら,豊崎くんが英語で取りそうな点数を他の科目から予測するという方法もある」は,完全情報最尤推定法や多重代入法を示唆していると思うが,欲を言えばMCARとかMARとかの前提条件の話まで触れて欲しかったところ。この物語では,結局,再度聞き取ってNAを無くすという王道で解決したので問題ないのだが。
- p.81手書きフォントのcCrはnCrの誤記
- p.94で,平均を引いて標準偏差で割るという話までしているのだから,高校生への会話なら,それに10を掛けて50を足したのが偏差値という話に広がるのが自然では?
- p.107での「えーと第1象限と言ったっけ?」という発言は不自然な気がした。中学で習うんでは?
- p.117中程の会話は何とも言えない味わいがあった。あれは「死語」なんだな。
- データ解析学会会員になっている数学の先生の名前が印象的な提示の仕方なので,モデルでもいるのかと思ったが,検索してみたら北海道の中学の美術の先生に同姓同名の方がいたが,関係なさそうだなあ。フィクションでの人物名の名付け方って,難しいと思うんだが,石田先生はどうやって付けたんだろうか? まあ,正規乱子と二項文太という名前の人は世の中にいないと思うが。
- family-wiseと思われる同時信頼区間を描いているところ,分散分析というよりもTukeyのHSDによる多重比較という説明にしなくてはいけないと思う。
- Lancet Global Healthの新着論文は興味深い。世界144ヶ国のデータから年齢階級別妊産婦死亡を調べて,世界をまとめてみるとJ型(20-24歳の死亡率が最低で,それより低くても死亡率が高いし,30歳以上で最も高くなる)だが,国によって違っていて,20歳未満の方が死亡率が低い国もあるが(ただし,だからといって10代の妊娠を減らす努力から国際保健のフォーカスをそらすべきではない,と注記している),その違いが何によっているのかグルーピングすることは困難で,経済発展度とか人口構造とか地理的区分のようなわかりやすい要因では説明できないという結果のようだ。
△Read/Write COMMENTS
▼前【575】(会議とか講義とか(2014年1月20日)
) ▲次【577】(会議とか講義準備とか(2014年1月22日)
) ●Top
Notice to cite or link here | [TOP PAGE]