我曾經也嘗試使用純java技術去解析word文檔,並且使用了apache的jacob,POI等項目,但是由於Microsoft Word使用的doc不是標準DOC文件,而是自己加處理過的,所以現在解析微軟的doc都只能靠破解與猜解,據我所知,現在的技術只能從word中提取出來文字,所以使用純java不太可能實現。
如果使用windows平臺的話,可以選擇使用微軟的壹些word控件來達到目的.