目前大家最常用的PDF轉換Word的工具是solid converter PDF。該軟件使用較簡單,轉換以後要自己排版,但是該軟件只針對壹些PDF文檔有效,對於早期的PDF文檔就無能為力了。另壹種工具是Foxit家族的Foxit PDF Text Converter,該軟件功能不如 Solid converter PDF功能強大,只能將PDF轉換為文本文檔,同時同樣存在對壹些早期的PDF文檔不能轉換的弊端。
2、利用office 2003進行轉換
網上流傳壹種利用office 2003進行轉換的方法, 其主要利用Office 2003 中的 Microsoft Office Document Imaging 組件來實現PDF轉WORD文檔。其具體方法如下:
用Adobe Reader 打開想轉換的PDF文件 ,接下來 選擇 “文件→打印”菜單,在打開的“打印”窗口中將 “打印機”欄中的名稱設置為 “Microsoft Office Document Image Writer”,確認後將該PDF文 件輸出為 MDI格式的虛擬打印文件 。
然後, 運行 “Microsoft Office Document Imaging”,並利用它來 打開 剛才保存的MDI文件,選擇“工具→ 將文本發送到Word ”菜單,在彈出的窗口中選中“ 在輸出時保持圖片版式不變 ”,確認後系統會提示“必須在執行此操作前重新運行 OCR 。這可能需要壹些時間”,不用管它, 確認即可。
註:
①如果沒有找到“Microsoft Office Document Image Writer”項,使用Office 2003安裝光盤中的“添加/刪除組件”更新安裝該組件,選中“Office 工具 Microsoft DRAW轉換器”。
②對PDF轉DOC的識別率不是特別完美,轉換後會丟失原來的排版格式,所以轉換後還需要手工對其進行排版和校對工作。
③以上僅在 word2003 中可用,其他版本沒有Microsoft Office Document Image Writer。
3、萬能轉換方法
該方法適用於大多數PDF文檔,原理同樣是利用OCR識別技術,前邊處理和方法2差不多,目的是將PDF轉換為圖片格式,後期利用專業OCR軟件識別。用Adobe acrobat打開pdf文檔,另存為JPG。然後再用漢王(或者其他ocr軟件,如尚書、紫光等)打開JPG ,再點擊版面分析-文字識別,插入word,就可隨便編輯了。識別的時候同樣存在壹些錯誤,要仔細校對。