壹般網頁中有“charset=gbk”等代表不同的CodePage
然後重新讀取整個網頁,然後用得到的CodePage轉換成電腦本地系統的編碼就可以避免亂碼了,當然也可以直接轉換成UTF-8或Unicode編碼並加上相應的文件頭部存儲存儲成TXT文件。
采用的API 主要就是MultiByteToWideChar之類的函數