自適應多速率音頻壓縮

自適應多速率音頻壓縮Adaptive multi-Rate compression,簡稱AMR)是一個使語音編碼最佳化的專利。AMR被標準語音編碼 3GPP在1998年10月選用,現在廣泛在GSMUMTS中使用。它使用1-8個不同的位元率編碼。

自適應多速率(AMR)
副檔名
.amr
網路媒體型式
audio/amr, audio/3gpp, audio/3gpp2
格式類型音頻

AMR 也是一個檔案格式,儲存AMR 語音編碼檔案. 很多手機允許用戶儲存短時間的AMR 格式錄音,而部分開源(參看外部連結)和商業軟件有和其他格式轉換的程式。但是AMR是一個語音格式,並未針對其他聲音進行最佳化。普通副檔名.amr

使用

為保證每20毫秒160採樣點的取樣率,AMR使用ACELP、DTX、VAD和CNG等不同的技術,從中選擇最好的編碼模式適應局部信道和通路頻帶要求。如果廣播條件差,源編碼減少,信道編碼增加。此舉可提高網絡連接的質素,但必須犧牲語音的清晰度。在特別情況下AMR 增加大約S/N = 4-6 dB。

以下列出共計14種方式的AMR編碼,包含8個全頻(FR)和6個半頻(HR)。

Mode Bitrate (kbit/s) Channel 相容
AMR_12.20 12.20 FR ETSI GSM enhanced full rate
AMR_10.20 10.20 FR
AMR_7.95 7.95 FR/HR
AMR_7.40 7.40 FR/HR TIA/EIA IS-641 TDMA enhanced full rate
AMR_6.70 6.70 FR/HR ARIB 6.7 kbit/s enhanced full rate
AMR_5.90 5.90 FR/HR
AMR_5.15 5.15 FR/HR
AMR_4.75 4.75 FR/HR
AMR_SID 1.80 FR/HR

特點

  • 取樣率 8 kHz/13-bit (160 採樣點每20ms),濾波後只保留 200-3400 Hz 範圍內的訊號。
  • 編碼器使用8個位速:12.2、10.2、7.95、7.40、6.70、5.90、5.15和4.75 kbit/s。
  • 生成的幀長度為95、103、118、134、148、159、204或244bit,對應的位速分別為4.75、5.15、5.90、6.70、7.40、7.95、10.2或12.2 kbit/s。
  • AMR利用 Discontinuous Transmission (DTX), Voice Activity Detection (VAD)和Comfort Noise Generation (CNG)減少在無聲時候的頻寬。
  • 演算法延遲是每幀20ms。位速是12.2的時候,沒有前瞻延遲。其他速率的前瞻延遲是5 ms. 注有5 ms 的仿前瞻延遲,允許準確的幀寬模式轉換其餘速率。
  • AMR是使用 Algebraic Code Excited Linear Prediction (ACELP)的混合語言編碼器。
  • 運演算法則的複雜性是5的話,則 G.711 是1 G.729a 是15。
  • PSQM在理想條件下測試失真Mean Opinion Scores AMR(12.2 kbit/s)是 4.14,相比G.711 (u-law) 是 4.45。
  • PSQM在網絡條件下Mean Opinion Scores AMR(12.2 kbit/s)是3.79,相比G.711 (u-law) 是4.13。

專利許可

AMR編解碼器數個專利:

參見

外部連結