通常來說:
* 按照字數分割文本的軟件,分割出來的文件可能大小不壹,因為漢字和英文占的大小不壹樣。
* 而按照大小(字節)來分割文本的軟件,可能把文本中的某個漢字分割成半個造成了亂碼。
軟件Replace Pioneer有壹種分割文本的選項,避免了二者的不足,選擇按照字節(bytes)分割文本,它自動避免把單個漢字分為兩半而產生亂碼。詳細步驟:
1. ctrl-o打開待處理文本文件
2. 選擇File->Save As->Split by lines/chars/bytes菜單
3. 在Split by後面輸入需要分割的大小和單位,比如10000後面選bytes,就大概是10k字節。
4. 點擊Next並選擇結果文件的名稱,比如a.txt
確認後,妳會發現文件被分割為a.001.txt, a.002.txt, ... 分割後的文本大小不都是正好10000,而是差1,2個字節,原因是它能自動判斷,防止把某個漢字壹分為二。
另外註意,如果妳的文件是utf-8編碼方式的,在分割之前壹定要選擇settings->encoding->utf8,否則結果不可預知。