當前位置:編程學習大全網 - 編程語言 - mysql數據庫壹個漢字到底占幾個字節

mysql數據庫壹個漢字到底占幾個字節

壹個漢字占多少長度與編碼有關:

若采用UTF-8編碼,則壹個漢字=3個字節。

若采用GBK編碼,則壹個漢字=2個字節。

項目中oracle10g數據庫表字段為varchar(n)類型,存英文很簡單,只要字母個數不大於n即可。但是對於漢字,按照同樣的方法就不行了。因為對於漢字不同的字符集,在數據庫占用的字節是不壹樣的。

比如varchar(10)類型的字段,UTF-8的漢字,只能存3個,gbk字符集的漢字卻能存5個。所以在程序中根據表字段varchar的大小,保存或更新時作出必要的校驗否則後臺會報錯。

對於壹個網站、論壇來說,如果英文字符較多,則建議使用UTF-8節省空間。不過現在很多論壇的插件壹般只支持GBK。

GB2312是GBK的子集,GBK是GB18030的子集

GBK是包括中日韓字符的大字符集合

擴展資料

字符最終是以二進制形式存儲在磁盤的,這也是為什麽要有字符編碼的原因,因為計算機最終都要以二進制形式存儲,那麽編碼規則就是用什麽樣的二進制來代表這個字符。

例如,ASCII碼表中,01000011這個二進制對應的十進制是67,它代表的就是英語字母C。準確概述來說,字符編碼方式是用壹個或多個字節的二進制形式表示字符集中的壹個字符。

每種字符集都有自己特有的編碼方式,因此同壹個字符,在不同字符集的編碼方式下,可能會產生不同的二進制形式。

另外,字符集合只是指定了壹個集合中有哪些字符,而字符編碼,是為這個集合中所有字符定義相關編號,而字符集(註意與字符集合的區別)是字符和集合與編碼規則的混合體,這也是有時候編碼方案代表字符集的原因。

  • 上一篇:會計面試常見問題及答案
  • 下一篇:119疏散演練講話稿參考8篇
  • copyright 2024編程學習大全網