com.aistrong.analysis.pdf.service
public ArrayList<List<WordWithTextPositions>> readWordWithTextPositions(String path)
path - pdf文件存儲路徑
ArrayList<List<WordWithTextPositions>>
每個WordWithTextPositions對象中存儲了1行(參看註意)中所有字符,其中每個字符對應壹個TextPosition對象,每個TextPosition存儲了該字符所有相關信息,包含字符、坐標等,詳細介紹參看pdfBox API文檔 Class TextPosition
輸出: