女士品茶

统计实验设计中女士品茶羅納德·愛爾默·費雪(Ronald Fisher)设计的随机实验,并在他的《实验设计》(The Design of Experiments,1935)一书中得到记录。[1]該實驗是費雪對虛無假設「從未被證明或建立,但可能在實驗過程中被推翻」概念的原始闡述。[1]

实验询问,当一杯茶备好时,受试者能否分辨出是否在冲茶之前添加了牛奶
罗纳德·费舍尔(Ronald Fisher),1913年

受试者是费舍尔的同事,也是一位藻类学家缪丽·布里斯托尔英语Muriel Bristol,她声称能够辨别冲茶时先放的是茶还是牛奶。费舍尔提出随机给她8杯茶,其中4杯先放茶,4杯先放牛奶,然后便可知道她碰巧猜对特定杯数的可能性。

费舍尔的描述只有不到10页,以其在术语、计算和实验设计方面的简洁和完整而著称。[2]该示例大致基于费舍尔生活中的一个事件。使用的测试是费希尔精确检验英语Fisher's exact test

實驗內容

事先準備八杯奶茶,其中四杯先加牛奶再加入茶,另外四杯先加茶再加牛奶,共有兩種沖泡方式。之後由受試者以隨機順序試喝八杯奶茶。過程中,受試者可以多次試喝同一杯茶以前後比較,並已經明確知曉兩種沖泡方法的茶各有四杯。最終由受試者回答每杯茶分別屬於何種沖泡方式。

這項檢驗的零假设是受试者並沒有任何能力區別沖泡方法。在費雪的方法中並沒有對立假說[1]不同於內曼-皮爾遜引理的方法。

統計檢定量的形式很簡單,是受试者正確地選出其中一項沖泡方式(例如先加牛奶再加茶)的次數。也就是說,受试者從八杯中選出四杯屬於先加牛奶者,再事後比對該四杯中有幾杯確實屬於先加牛奶。在此例中要求受试者從八杯茶選出四杯茶,可利用組合數計算所有可能組合数:

 

並可區分為0至4杯正確,共五種情況:

各種正確次數對應的組合數。
正確次數 组合 組合數
0正確 oooo  
1正確 ooox, ooxo, oxoo, xooo  
2正確 ooxx, oxox, oxxo, xoxo, xxoo, xoox  
3正確 oxxx, xoxx, xxox, xxxo  
4正確 xxxx  
總和 70

上述正確次數所對應的組合次數有以下關係;若是0次正確,很明顯地僅對應一種情況,即受试者完全錯誤地挑出其中四杯茶;若是1次正確,表示受试者僅正確挑出四杯中的一杯(共 種情況),同時錯誤地挑出四杯中的三杯(共 種情況)為獨立事件,故共有4 × 4 = 16種情況;以此類推。這顯示了正確次數的機率分布X屬於超幾何分布

 

若虛無假說(即受试者不能區別沖泡方式)為真,在型一錯誤率上限5%的設定下,此例應拒絕虛無假設(受试者無法區別沖泡方式)的拒絕域僅包括了受试者達成「4正确」結果。這是因為在所有70種情況下,發生「4正确」結果的機率為1/70(约1.429%),但發生「4正确」或「3正确」的機率則有(16 + 1) / 70≈24.286%,超過先前設定的型一錯誤率上限。换句话说,唯有當受试者完全正確地挑出屬於先加牛奶再加茶的4杯茶,費雪才会有信心认为受试者有區別沖泡方式的能力(因为在实际上受试者不能区别冲泡方式时,这个结论错误的几率只有1.429%),尽管量化这一能力不在他考虑范围之内。

費雪在書中亦討論了增加測試杯數與重複測試對檢驗的益處。例如,增加茶杯數至12杯(二種沖泡方式各6杯),或是原本8杯的實驗重覆進行二次,則可以提高檢驗的檢定力而更敏感地偵測出能夠區別沖泡方式的受试者。[1]

戴維·薩爾斯伯格英语David Salsburg的的著作《女士品茶:統計學如何變革了科學和生活英语The Lady Tasting Tea》中,費雪的同事費爾菲爾德·史密斯(H. Fairfield Smith)透露了故事的結尾:这位叫缪丽的女士确实地猜中了全部8杯茶的冲泡方式[3][4],成功地证明了自己。

反響

德巴布拉塔·巴蘇英语Deb Basu认为“女士品茶”这一知名案例是实验数据随机化分析的两大支柱之一。[5][6]

参见

参考文献

  1. ^ 1.0 1.1 1.2 1.3 Fisher, R. A. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment. The Design of Experiments 9. ed. New York: Hafner Press. 1974. ISBN 0-02-844690-9. OCLC 471778573. 
  2. ^ Newman, James R. Mathematics of a Lady Tasting Tea. The world of mathematics. Mineola, N.Y.: Dover Publications. <2000-> [2022-12-20]. ISBN 978-0-486-41153-8. OCLC 43555029. (原始内容存档于2022-05-05). 
  3. ^ Salsburg, David. The lady tasting tea: how statistics revolutionized science in the twentieth century. New York: W.H. Freeman. 2001. ISBN 0-7167-4106-7. OCLC 45129162. 
  4. ^ Box, Joan Fisher. R.A. Fisher : the life of a scientist. New York, NY. 1978: 134. ISBN 0-471-09300-9. OCLC 3649815. 
  5. ^ Basu, D. Randomization Analysis of Experimental Data: The Fisher Randomization Test. Journal of the American Statistical Association. 1980-09, 75 (371) [2022-12-20]. ISSN 0162-1459. doi:10.1080/01621459.1980.10477512. (原始内容存档于2023-04-02) (英语). 
  6. ^ Ghosh, J. K. The Fisher Randomization Test. Ghosh, J. K. (编). Statistical Information and Likelihood 45. New York, NY: Springer New York. 1988: 271–289. ISBN 978-0-387-96751-6. doi:10.1007/978-1-4612-3894-2_15.