置換檢驗

維基百科,自由的百科全書
在兩個樣本容量分別為4與5的樣本之間進行置換檢驗的說明圖。此處置換檢驗的檢驗統計量為兩樣本間平均數之差。置換檢驗中,首先將兩個樣本混合打亂後,再分別抽出4個數與5個數,重新計算平均數之差,之後再計算出有多少次置換中得到的新樣本間平均數之差大於置換前兩樣本間平均數之差(圖中的縱向黑線即表示置換前兩樣本間平均數之差)

置換檢驗permutation test)是統計學上一種基於反證法重抽樣原則的非參數性檢驗,由羅納德·艾爾默·費希爾Ronald Aylmer Fisher)與E・J・G・皮特曼英語E. J. G. PitmanE. J. G. Pitman)於20世紀30年代最早提出[1]

置換檢驗的零假設(虛無假設)為,即所有樣本都服從同一分佈。置換檢驗通過對比樣本置換後的檢驗統計量與置換前的檢驗統計量來決定是否拒絕零假設、接受備擇假設

方法

進行置換檢驗前,首先計算兩樣本(樣本容量設為)之間原本的檢驗統計量。檢驗統計量可以是兩樣本間平均數之差、方差之差,或t值卡方檢驗中的值等,但這一統計量原則上在重新抽樣後應大致符合某一統計學分佈(如正態分佈、t分佈、f分佈等)[2]:355-360。隨後,將兩個樣本打亂後再重新選出兩組容量等於之前兩樣本的新樣本(即兩個樣本容量同樣為的樣本)並計算新的檢驗統計量。如接受零假設,即樣本源於同一分佈,則隨機抽樣計算出的新檢驗統計量應不難大於最初置換前算出的兩樣本間檢驗統計量(如為雙側檢驗,則是其絕對值應不難大於置換前算出的兩樣本間檢驗統計量),即這個概率應大於設定的I型錯誤(假陽性)概率。反之,則拒絕零假設,接受備擇假設,即樣本來自不同的分佈。實際計算時,當兩個樣本容量都很大時,窮舉所有置換並計算新的檢驗統計量所需的計算量過於龐大,因此常採用蒙特卡羅模擬的辦法進行置換檢驗。蒙特卡羅模擬中,只做一定次數的打亂重選(置換)並計算檢驗統計量,再用這些計算出的檢驗統計量與置換前原本的檢驗統計量進行對比[3][4]

優勢與不足

置換檢驗能用於兩個分佈不明且都不符合正態分佈的樣本之間的統計檢驗,是對較常用的t檢驗、方差分析(ANOVA)等參數檢驗的一個補充[5]。即使實驗是非均衡設計(即樣本容量不同),依然能夠對樣本進行置換檢驗[6]

另一方面,和其他基於秩的非參數檢驗相似,置換檢驗是一種相對保守的檢驗。如果對兩個差別較小的小樣本進行置換檢驗,則很容易接受零假設、拒絕備擇假設(即檢驗功效相對較低)[7][8]

參見

參考文獻

  1. ^ Boik, Robert J. The Fisher-Pitman permutation test: A non-robust alternative to the normal theory F test when variances are heterogeneous. British Journal of Mathematical and Statistical Psychology (Wiley). 1987, 40 (1): 26–42. ISSN 0007-1102. doi:10.1111/j.2044-8317.1987.tb00865.x. 
  2. ^ Robert V. Hogg; Elliot A. Tanis; Dale L. Zimmereman. Probability and Statistical Inference Ninth Edition (International). Pearson. 2015. ISBN 978-1-292-06235-8. 
  3. ^ Randomization Tests. Oklahoma State University. Ordination Methods for Ecologists. [2022-12-04]. (原始內容存檔於2023-06-08). 
  4. ^ Wilcox, Rand R. COMPARING TWO INDEPENDENT GROUPS. Applying Contemporary Statistical Techniques. Elsevier. 2003: 237–284. doi:10.1016/b978-012751541-0/50029-8. 
  5. ^ Collingridge, Dave S. A Primer on Quantitized Data Analysis and Permutation Testing. Journal of Mixed Methods Research. 11 September 2012, 7 (1): 81–97. S2CID 124618343. doi:10.1177/1558689812454457. 
  6. ^ Invited Articles (PDF). Journal of Modern Applied Statistical Methods. Fall 2011, 1 (2): 202–522. (原始內容 (PDF)存檔於May 5, 2003). 
  7. ^ Allison, D.B.; Page, G.P.; Beasley, T.M.; Edwards, J.W. DNA Microarrays and Related Genomics Techniques: Design, Analysis, and Interpretation of Experiments. Chapman & Hall/CRC Biostatistics Series. CRC Press. 2005: 261 [2022-12-07]. ISBN 978-1-4200-2879-9. (原始內容存檔於2022-12-07). 
  8. ^ Berger, Vance W. Pros and cons of permutation tests in clinical trials. Statistics in Medicine (Wiley). 2000-05-30, 19 (10): 1319–1328. ISSN 0277-6715. doi:10.1002/(sici)1097-0258(20000530)19:10<1319::aid-sim490>3.0.co;2-0.