群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
Rに元々組み込まれているデータairqualityは,1973年5月1日から9月30日まで154日間のニューヨーク市の大気環境データである。含まれている変数は,次のとおりである。
このデータについて,月別にオゾン濃度の記述統計量(サンプルサイズ,平均値,標準偏差,第1四分位,中央値,第3四分位)を求めるコードは以下のように書ける。ただし,わざとBoxで穴をあけてある。
descstat <- function(X) {
XX <- X[!is.na(X)] # 欠損値を除去する(excluding missing values)
Q5S <- (XX)
res <- c((XX), (XX), sd(XX), Q5S[2], Q5S[3], Q5S[4])
names(res) <- c("N","Mean","SD","Q1","Median","Q3")
return(res) }
tapply(airquality$Ozone, airquality$, descstat)
それぞれのBoxに入る正しい関数名または変数名を解答せよ。また,求めた記述統計量からいえることを文章で記せ。さらに,もしあれば感想・要望・質問などとともに下のフォームから送信せよ。学籍番号と氏名の入力を忘れないこと。
(The program listed above is to calculate descriptive statistics (sample size, mean, unbiased standard deviation, 1st and 3rd quartiles, and median) of body mass index (BMI) for married and single subjects, separately. Please fill appropriate functions or variables in the boxes. In addition, please explain what the results mean.)