壹般來說,網頁中有“charset=gbk”來表示不同的代碼頁。
然後重新讀取整個網頁,再用獲取的代碼頁轉換成本地計算機系統的代碼,可以避免亂碼。當然,也可以直接轉換成UTF-8或Unicode代碼,存儲為帶有相應文件頭的TXT文件。
采用的API主要是MultiByteToWideChar等函數。