山口県立大学 | 看護学部 | サイトトップ | 統計学

統計学補足(1)

最終更新: 2002年 9月 3日 (火曜日) 17時16分

同順位がある場合の中央値の計算式

Grimmのテキストの説明がおかしい点
●78個サンプルがあるときに中央値が78/2=39番目だという説明は明らかにおかしい。
Grimmの考え方の大事な点
●それぞれの値を,表示単位によって規定される区間の中点と考え,同順位の値があるときは,それが区間内に均等に散らばると考えるのは合理的。
(例1)1 1 1 2 2 2 3 3 3という,表示単位1のデータがあるとき,真の値がそれぞれ等間隔に散らばっているならば,0.67 1.00 1.33 1.67 2.00 2.33 2.67 3.00 3.33と考えるのが自然である。これなら,それぞれの値が1/3間隔になっているし,中点1で示される値0.67 1.00 1.33の平均は1となるので,どこにも矛盾がない。
同順位の真の値を与える式
●上の例から帰納的に考えて,その区間の下限の値をLとし,階級幅をhとし,同順位の個数をfm個とし,1つ下の区間までにF個のサンプルがあるとすれば,
F+1番目, F+2番目, ..., F+fm番目 の値はそれぞれ,
L+1/(2fm)*h, L+3/(2fm)*h, ..., L+(2fm-1)/(2fm)*hとなる。
つまり,F+x番目の値は,L+(2x-1)/(2fm)*hとなる。
●この式から第4回講義配布資料の例題9の3つの8の真の値がいくつになるか計算すると,
4番 5番 6番
7.67 8.00 8.33
となって,5番と6番の間が8.17となるGrimmの答えが正しいことになる。
●同じく例題10で真の値を計算すると,
6.67 7.00 7.33 7.60 7.80 8.00 8.20 8.40 8.75 9.25 9.75 10.25
となるので,中央値は8.00と8.20の間で8.10となり,やはりGrimmが与えている答えは正しい。
●1 1 2 2 3 3という表示単位1のデータでは,0.75 1.25 1.75 2.25 2.75 3.25となるので,中央値は1.75と2.25の平均で2となり,もっともらしい。
度数分布から中央値を求める式はどうなるか?
(1) サンプル数Nが奇数のとき,(N+1)/2番目が中央値なので,F+x=(N+1)/2を解いてL+(2x-1)/(2fm)*hに代入すれば,
L+(N+1-2F-1)/(2fm)*h = L+(N/2-F)/fm*hとなってGrimmの式と一致する。
(2) Nが偶数のとき,中央値はN/2番目とN/2+1番目の間なので,F+x=N/2とF+x=N/2+1を解いてL+(2x-1)/(2fm)*hに代入したL+(2(N/2-F)-1)h/(2fm)とL+(2(N/2+1-F)-1)h/(2fm)の平均となって,やはりL+(N/2-F)/fm*hで良いことになり,Grimmの式と一致する。
ゆえに,中央値がN/2番目だというGrimmのテキストの説明はおかしいにもかかわらず,Grimmが示している度数分布から中央値を求める計算式は正しいといえる。

▼しかし,一般に,ここまで厳密に中央値を考える必要はない。


リンクと引用について

Correspondence to: minato@ypu.jp.