顺序统计量

维基百科,自由的百科全书

统计学中,样本的第顺序统计量(英語:Order Statistics)即它从小到大排列时的第个值,常用于非参数估计推断中。常见的顺序统计量包括样本的最大值最小值中位数等。

记号

任给样本,将其从小到大排成一列,记为:

则其第一顺序统计量(即最小值)为,第顺序统计量(即最大值)为

概率

随机变量累积分布函数由下式给出[1]

将累积分布函数求导可得其概率密度函数

連續均勻樣本

单位区间上的連續型均勻分布取得的樣本,其各順序統計量的边缘分布屬於Β分布族。此外,任意幾個順序統計量的联合分布也有簡單的表示。本節將作介紹。藉賴累积分布函数(cdf),該些結果亦可推廣到任意連續分佈。

本節中,表示以為cdf的一組隨機樣本。記,則是從標準連續均勻分布抽取的對應樣本。由的單調性,後者的順序統計量為

順序統計量的概率密度函數(pdf)等於[2]

換言之,均勻分佈的第順序統計量遵循Β分布[2][3]

證明如下:欲使介乎之間,樣本須恰有個元素小於,並至少有一個介乎之間。該區間包含多於一個元素的概率已是(使用了大O符號),故衹需計算三區間分別恰有個元素的概率。此即三項分佈英语multinomial distribution概率

故上述pdf公式成立。該分佈的平均值為

参考文献

  1. ^ Order Statistics. www.math.uah.edu. [2016-07-28]. (原始内容存档于2017-08-13). 
  2. ^ 2.0 2.1 Gentle, James E. Computational Statistics. Springer. 2009: 63. ISBN 9780387981444 (英语). 
  3. ^ Jones, M. C. Kumaraswamy's distribution: A beta-type distribution with some tractability advantages. Statistical Methodology. 2009, 6 (1): 70–81. doi:10.1016/j.stamet.2008.04.001. As is well known, the beta distribution is the distribution of the m’th order statistic from a random sample of size n from the uniform distribution (on (0,1)).