位元組

电脑、手机及智能手表等设备上的信息计量单位,代表八个比特

位元組(英語:byte)是通常用在電腦手機智能手錶等裝置上的資訊計量單位,不分資料類型。[1][2] 。一個位元組代表八個位元。從歷史的觀點上,「位元組」表示用於編碼單個字元所需要的位元數量,因此它是許多電腦架構中最小的可定址主記憶體單元。歷史上位元組長度曾基於硬件為1-48 bit不等,最初通常使用6 bit或9 bit為一位元組。今日標準以8 bit作為一位元組。為了消除常見8 位定義中任意大小的位元組的歧義,八個位元在一些規範(例如工業標準、電腦網絡電信技術等)中常被稱為八位組(octet)。Internet 協定RFC 791 ) 將 8 位位元組稱為八位位元組。[3]

位元組的次方單位
十進制字首
(SI)
名字 符號 倍數
千位元組 kB 103
百萬位元組 MB 106
吉位元組 GB 109
兆位元組 TB 1012
拍位元組 PB 1015
艾位元組 EB 1018
皆位元組 ZB 1021
佑位元組 YB 1024
羅位元組 RB 1027
昆位元組 QB 1030
二進制字首
(IEC 60027-2)
名字 符號 倍數
kibibyte KiB 210
mebibyte MiB 220
gibibyte GiB 230
tebibyte TiB 240
pebibyte PiB 250
exbibyte EiB 260
zebibyte ZiB 270
yobibyte YiB 280

國際電工委員會(IEC) 和電氣與電子工程師協會(IEEE) 將位元組的單位符號指定為大寫字母 B。例如MB表示百萬位元組(megabyte);位元bit)可縮寫成b,例如Mb表示兆位元( megabit英語megabit),與位元組進行區分。 國際上,單位八位位元組(octet,符號 o)明確定義了八位的序列,消除了術語「位元組」的潛在歧義。  

位元組的大小歷來取決於硬件,並且不存在強制規定大小的明確標準。曾經使用過的位元組的大小包含 1 到 48 位。六位字元代碼是早期編碼系統中常用的實現方式,使用六位和九位位元組的電腦在 20 世紀 60 年代很常見。這些系統通常具有 12、18、24、30、36、48 或 60 位的記憶體字,對應於 2、3、4、5、6、8 或 10 個六位位元組。在術語「位元組」變得普遍之前,指令流中的位分組通常被稱為syllable[a]或slab 。

ISO/IEC 2382-1:1993 中記錄的現代事實上的標準(8位元)是相對方便的2 的冪,因為 2 的 8 次方是 256,允許一個位元組使用 0 到 255的二進制編碼值。 國際標準IEC 80000-13定義了這一常見含義。許多型態的應用程式使用可用八位或更少位表示的資訊,並且處理器設計者通常針對這種用法進行最佳化。主要商業計算架構的普及有助於 8 位位元組的普遍接受。現代架構通常使用 32 位字或 64 位字,分別由 4 個或 8 個位元組構成。

歷史

位元組一詞是Werner Buchholz於1956年6月在IBM Stretch電腦的早期設計階段發明的,該電腦的定址為位和可變欄位長度(VFL)指令,指令中編碼了位元組大小。這是為了避免意外突變為位元而特意重寫的。

註釋

  1. ^ 術語「syllable」用於包含指令或指令組成部分的位元組,而不是數據位元組。

參考資料

  1. ^ Blaauw, Gerrit Anne; Brooks, Jr., Frederick Phillips; Buchholz, Werner, 4: Natural Data Units, Buchholz, Werner (編), Planning a Computer System – Project Stretch (PDF), McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA.: 39–40, 1962 [2017-04-03], LCCN 61-10466, (原始內容 (PDF)存檔於2017-04-03), […] Terms used here to describe the structure imposed by the machine design, in addition to bit, are listed below.
    Byte denotes a group of bits used to encode a character, or the number of bits transmitted in parallel to and from input-output units. A term other than character is used here because a given character may be represented in different applications by more than one code, and different codes may use different numbers of bits (i.e., different byte sizes). In input-output transmission the grouping of bits may be completely arbitrary and have no relation to actual characters. (The term is coined from bite, but respelled to avoid accidental mutation to bit.)
    A word consists of the number of data bits transmitted in parallel from or to memory in one memory cycle. Word size is thus defined as a structural property of the memory. (The term catena was coined for this purpose by the designers of the Bull fr computer.)
    Block refers to the number of words transmitted to or from an input-output unit in response to a single input-output instruction. Block size is a structural property of an input-output unit; it may have been fixed by the design or left to be varied by the program. […]
     
  2. ^ Bemer, Robert William, A proposal for a generalized card code of 256 characters, Communications of the ACM, 1959, 2 (9): 19–23, doi:10.1145/368424.368435 
  3. ^ Postel, J.. Internet Protocol DARPA INTERNET PROGRAM PROTOCOL SPECIFICATION. September 1981: p. 43 [28 August 2020]. RFC 791 (英文). octet An eight bit byte. 

延伸閱讀

參閲

外部連結