Latest update on 2012年3月5日 (月) at 10:54:46.
教育基本法案について。新旧対照表をみても,なぜ今やらねばならないのかピンとこないのだが,「教育振興基本計画」を作るというのがポイントなのか? ここから参考資料を辿っていくと全国的な学力調査の具体的な実施方法について(報告)という資料があるのだが(リンク先はpdf形式),この文書の用語解説で,中央値について『小さい規模の集団における典型的な代表値として信頼性が高いと考えられる』,四分位偏差について『小さい規模の集団における典型的な分布の散らばりの度合いを表す代表値として信頼性が高いと考えられる』と書かれているのは本当か? と思ってRでシミュレーションしてみた(念のため書いておくと,中央値の説明でこの前に書かれている,外れ値の影響を受けにくいというのは疑問の余地なく正しい)。そもそもが『小さい規模の集団』というのが,母集団のことなのかサンプルのことなのかわからないが,この解説が全国調査に付されたものであることを考えれば,母集団は大きいけれどもサンプルサイズが小さい場合と捉えるべきであろう。とすれば,以下のコードで確かめられるはずである。
RNGkind("Mersenne-Twister") set.seed(1) # 平均70,標準偏差7点の正規分布に従う得点についての1000人の架空の母集団データを生成 pp <- as.integer(rnorm(1000,70,7)) x <- 1:500 dim(x) <- c(5,100) for (i in 1:100) { x[,i] <- sample(pp,5) } # xはppからの5人のサンプルを100回取ったもの xmean <- 1:100 xmedian <- 1:100 for (i in 1:100) { xmean[i] <- mean(x[,i]); xmedian[i] <- median(x[,i]) } xsd <- 1:100 xsiqr <- 1:100 for (i in 1:100) { xsd[i] <- sd(x[,i]); xsiqr[i] <- (fivenum(x[,i])[4]-fivenum(x[,i])[2])/2 } png("./mmss_sim.png",width=640,height=480) par(mfrow=c(2,2)) hist(xmean,main="平均値の分布") hist(xmedian,main="中央値の分布") hist(xsd,main="標準偏差の分布") hist(xsiqr,main="四分位偏差の分布") dev.off()
結果を図示すると以下が得られる。中央値や四分位偏差がとくに「小さい規模の集団」で「信頼性が高い」とは言えないと思われる。どこかの教科書にそういう記載があるんだろうか? それとも,何かぼくが勘違いしているんだろうか。
▼前【547】(情報倫理講義と一木会(2006年5月18日) ) ▲次【549】(会議とか懇談会とか(2006年5月22日) ) ●Top
△Read/Write COMMENTS