當前位置:編程學習大全網 - 網站源碼 - 我在寫壹個python的網絡爬蟲,寫入記事本的內容都是亂碼如何使寫入的數據以utf8或者gb2312的碼制寫入。

我在寫壹個python的網絡爬蟲,寫入記事本的內容都是亂碼如何使寫入的數據以utf8或者gb2312的碼制寫入。

我從自己壹個utf8的爬蟲程序裏面摘的。

程序開頭:

#!/usr/bin/env?python

#?-*-?coding:utf8?-*-

import?urllib

import?urllib2

import?string

import?re

import?sys

type0?=?sys.getfilesystemencoding()?#解決中文亂碼問題

後面做抓取程序的時候全部加上decode和encode。

pos1?=?text.find(term.decode("utf-8").encode(type0))

在輸入到txt的時候相應的分隔符也要decode和encode:

f.write(info+'!'.decode("utf-8").encode(type0))

希望能幫到妳。

  • 上一篇:如何把 discuz 二次開發的不像 DZ
  • 下一篇:壹夢江湖裝修社區在哪
  • copyright 2024編程學習大全網