峰度
峰度(英語:Kurtosis),亦稱尖度,在統計學中衡量實數隨機變量概率分佈的峰態。峰度高就意味着方差增大是由低頻度的大於或小於平均值的極端差值引起的。
定義
總體峰態系數定義為:
在更通常的情況下,峰度被定義為四階累積量除以二階累積量的平方,它等於四階主動差除以概率分佈方差的平方再減去3:
這也被稱為超值峰度(excess kurtosis)。「減3」是為了讓正態分佈的峰度為0。
假定為個獨立變量之和,且這些變量和具有相同的分佈,那麽:, 但如果峰度被定義為:,公式可變得更加複雜。
更一般地說,假定為方差相等的獨立隨機變量,那麼:
而定義中如果不包含「減3」就無法成立。
如果超值峰度為正,稱為高狹峰(leptokurtic)。如果超值峰度為負,稱為低闊峰(platykurtic)。
樣本峰度
對於具有個值的樣本,樣本峰度為:
其中是四階樣本主動差,是二階主動差(即使樣本方差),是第個值,是樣本平均值。注意此處計算方差的時候除數是,而不是單獨計算樣本方差的。
有時候也使用公式:
- ,
其中,為樣本大小,為事先計算的方差,為第個測量值,為事先計算的算術平均數。
在一些統計軟件中,其公式有所差別。如EXCEL,計算樣本的峰度公式如下:
參見
參考資料
- Joanes, D. N. & Gill, C. A. (1998) Comparing measures of sample skewness and kurtosis. Journal of the Royal Statistical Society (Series D): The Statistician 47 (1), 183–189. doi:10.1111/1467-9884.00122
- Are the Skewness and Kurtosis Useful Statistics? (頁面存檔備份,存於互聯網檔案館)