眾數 (數學)

一組數據中出現次數最多的數據值

眾數(英語:mode)指一組數據中出現次數最多的數據值。例如{8,7,7,8,6,5,5,8,8,8}中,出現最多的是8,因此眾數是8,眾數可能是一個數(數據值),但也可能是多個數(數據值)。若數據的數據值出現次數相同且無其他數據值時,則不存在眾數。例如{5,2,8,2,5,8}中,2、5、8出現次數相同且沒有其他數,因此此數據不存在眾數。

離散概率分佈中,眾數是指概率質量函數有最大值的數據,也就是最容易取様到的數據。在連續概率分佈中,眾數是指概率密度函數有最大值的數據(峰值)。

在統計學上,眾數和平均數中位數類似,都是總體隨機變量有關集中趨勢的重要資訊。在高斯分佈正態分佈)中,眾數為峰值所在的位置,和平均數中位數相同。但若分佈是高度偏斜分佈,眾數可能會和平均數、中位數有很大的差異。

分佈中的眾數不一定只有一個,若概率質量函數或概率密度函數在x1, x2……等多個點都有最大值,就會有多個眾數,最極端的情形是離散型均勻分佈,所有的點概率都相同,所有的點都是眾數。若概率密度函數有數個局部最大值,一般會將這幾個極值都稱為眾數,此連續概率分佈會稱為多峰分佈英語Multimodal distribution(和單峰性英語Unimodality相反)。

若是對稱的單峰分佈(例如正態分佈),眾數和平均數中位數會重合[1]。若一隨機變量是由對稱的總體中產生,可以用取樣的平均值來估計總體的眾數。

特徵

 
任意概率密度函數的眾數、中值和均值的幾何可視化.[2]

用眾數代表一組數據,適合於數據量較多時使用,且眾數不受極端數據的影響[3],並且求法簡便。在一組數據中,如果個別數據有很大的變動,選擇中位數表示這組數據的「集中趨勢」就比較適合。

當數值或被觀察者沒有明顯次序(常發生於非數值性資料)時特別有用,由於可能無法良好定義算術平均數中位數。例子:{蘋果,蘋果,香蕉,橙,橙,橙,桃}的眾數是橙。

使用

主要用於分類數據,也可用於順序數據數值型數據

歷史

眾數的英文mode最早是由卡爾·皮爾森在1895年開始使用[4]

參見

參考文獻

  1. ^ 現代統計學的發展. [2017-02-02]. (原始內容存檔於2017-02-25). 
  2. ^ AP Statistics Review - Density Curves and the Normal Distributions. [16 March 2015]. (原始內容存檔於2 April 2015). 
  3. ^ 魏和清; 羅良清. 实用统计学. 中國財政經濟出版社. 1 July 2011: 107–. ISBN 978-7-5095-2899-0. 
  4. ^ Pearson, Karl (1895). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material", Philosophical Transactions of the Royal Society of London, Ser. A, 186, 343-414