zìjié
字節(Byte): 字節是通過網絡傳輸信息(或在硬盤或內存中存儲信息)的單位。
字節是計算機信息技術用於計量存儲容量和傳輸容量的壹種計量單位,1個字節等於8位二進制。
壹個英文字母(不分大小寫)占壹個字節的空間,壹個中文漢字占兩個字節的空間.
符號:英文標點占壹個字節,中文標點占兩個字節.
壹個二進制數字序列,在計算機中作為壹個數字單元,壹般為8位二進制數,如壹個ASCII碼就是壹個字節,此類單位的換算為:
1千吉字節(TB,KiloGigaByte)=1024吉字節 (2的40次方字節)
(1TB=1024GB)
1吉字節(GB,GigaByte) =1024兆字節 (2的30次方字節)
(1GB=1024MB)
1兆字節(MB,MegaByte) =1024千字節 (2的20次方字節)
(1MB=1024KB)
1千字節(KB,KiloByte) =1024字節 (2的10次方字節)
1字節(Byte) = 8位(bit)
1.2 字符,字節,字符串
理解編碼的關鍵,是要把字符的概念和字節的概念理解準確。這兩個概念容易混淆,我們在此做壹下區分:
概念描述 舉例
字符 人們使用的記號,抽象意義上的壹個符號。 '1', '中', 'a', '$', '¥', ……
字節 計算機中存儲數據的單元,壹個8位的二進制數,是壹個很具體的存儲空間。 0x01, 0x45, 0xFA, ……
ANSI
字符串 在內存中,如果“字符”是以 ANSI 編碼形式存在的,壹個字符可能使用壹個字節或多個字節來表示,那麽我們稱這種字符串為 ANSI 字符串或者多字節字符串。 "中文123"
(占7字節)
UNICODE
字符串 在內存中,如果“字符”是以在 UNICODE 中的序號存在的,那麽我們稱這種字符串為 UNICODE 字符串或者寬字節字符串。 L"中文123"
(占10字節)
由於不同 ANSI 編碼所規定的標準是不相同的,因此,對於壹個給定的多字節字符串,我們必須知道它采用的是哪壹種編碼規則,才能夠知道它包含了哪些“字符”。而對於 UNICODE 字符串來說,不管在什麽環境下,它所代表的“字符”內容總是不變的.
字符
開放分類: 編程
zìfú
字符是可使用多種不同字符方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字符表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字符表示為 8 位字節序列。公***語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字符。
針對公***語言運行庫的應用程序使用編碼將字符表式形式從本機字符方案映射至其他方案。應用程序使用解碼將字符從非本機方案映射至本機方案。
ascii碼
開放分類: 計算機技術、標準、代碼
ASCII碼:美國(國家)信息交換標準(代)碼,壹種使用7個或8個二進制位進行編碼的方案,最多可以給256個字符(包括字母、數字、標點符號、控制字符及其他符號)分配(或指定)數值。
ASCII碼於1968年提出,用於在不同計算機硬件和軟件系統中實現數據傳輸標準化,在大多數的小型機和全部的個人計算機都使用此碼。ASCII碼劃分為兩個集合:128個字符的標準ASCII碼和附加的128個字符的擴充和ASCII碼。比較EBCDIC