如何讀取PDF文件中的內容信息?PDF是沒有圖片的全英文文本格式。..
如何讀取所有信息並保存在壹個字符串中...?
-解決方案。
下載PDFBox-0.7.3.zip
PDFBox-0.7.3.dll
lucene-demos-2.0.0.dll
lucene-core-2.0.0.dll
BC mail-JDK 14-132 . dll
BC prov-JDK 14-132 . dll
FontBox-0.1.0-dev.dll
ICSharpCode.SharpZipLib.dll
IKVM.AWT.WinForms.dll
IKVM.GNU.Classpath.dll
IKVM.Runtime.dll
ikvm-native.dll
把它放在垃圾箱裏
C#代碼& lt% @ Page Language = " c# " & gt;
& lt% @ Import Namespace = " System " % & gt;
& lt% @ Import Namespace = " org . pdfbox . PD model " % & gt;
& lt% @ Import Namespace = " org . pdf box . util " % & gt;
& ltscript language = " c# " runat = " server " & gt;
受保護的void Page_Load(對象發送方,系統。EventArgs e)
{
string pdfPath = Server。MapPath(" index . pdf ");
PD document doc = PD document . load(pdf path);
PDFTextStripper stripper = new PDFTextStripper();
string txt = stripper . gettext(doc);
回應。寫(txt);
}
& lt/script & gt;
註:不知道網上搜的行不行。樓主,試試吧。看完之後處理起來會輕松很多。