當前位置:編程學習大全網 - 網站源碼 - python怎麽知道壹個字符串的編碼方式

python怎麽知道壹個字符串的編碼方式

字符串的編碼,有很多種如utf-8,gb2312,gbk,gb18030,bz2,zlib,big5,bzse64

python 對編碼的處理有兩個方法,decode()和 encode()方法

a?=?'妳好'

b?=?'python'

print?a.decode('utf-8').encode('gbk')##decode方法把字符串轉換為unicode對象,然後通過encode方法轉換為指定的編碼字符串對象

print?b.decode('utf-8')##decode方法把字符串轉換為unicode對象

所以要讓python(或者說機器)來識別字符串的編碼,是壹件很困難的事。編碼就是漢字和整數之間的對應,同壹個整數,可以在不同的編碼中,都有對應的漢字。比如下面的例子,比特流'\xe6\xb0\xb4\xe5\xa3\xb6'在四種編碼中都有對應的漢字,但只有在utf-8編碼下,它對應的漢字才有意義。我們可以壹眼看出這點,可是要讓計算機做到這點,就很難了。

>>>?s?=?'水壺'

>>>?s

18:?'\xe6\xb0\xb4\xe5\xa3\xb6'

>>>?print?unicode(s,?'big5')

瘞遊ㄥ

>>>?print?unicode(s,?'gbk')

姘村6

>>>?print?unicode(s,?'gb2312')

姘村6

>>>?print?unicode(s,?'utf-8')

水壺

  • 上一篇:QQ暫時不能通話,怎麽解決?
  • 下一篇:如何把加密網頁復制下來?加急~!!
  • copyright 2024編程學習大全網