我從自己壹個utf8的爬蟲程序裏面摘的。
程序開頭:
#!/usr/bin/env?python#?-*-?coding:utf8?-*-
import?urllib
import?urllib2
import?string
import?re
import?sys
type0?=?sys.getfilesystemencoding()?#解決中文亂碼問題
後面做抓取程序的時候全部加上decode和encode。
pos1?=?text.find(term.decode("utf-8").encode(type0))在輸入到txt的時候相應的分隔符也要decode和encode:
f.write(info+'!'.decode("utf-8").encode(type0))希望能幫到妳。