1.索引塊文件
這個文件包含了索引中的索引塊信息,這個文件包含了每個索引塊的名字以及大小等信息。表 2 顯示了這個文件的結構信息。
表2:索引塊文件結構
2.域信息文件
我們知道,索引中的文檔由壹個或者多個域組成,這個文件包含了每個索引塊中的域的信息。表 3 顯示了這個文件的結構。
表3:域信息文件結構
3.索引項信息文件
這是索引文件裏面最核心的壹個文件,它存儲了所有的索引項的值以及相關信息,並且以索引項來排序。表 4 顯示了這個文件的結構。
表4:索引項信息文件結構
4.頻率文件
表5:頻率文件的結構
5.位置文件
這個文件包含了索引項在每個文檔中出現的位置信息,妳可以利用這些信息來參與對索引結果的排序。表 6 顯示了這個文件的結構
表6:位置文件的結構
到目前為止我們介紹了 Lucene 中的主要的索引文件結構,希望能對妳理解 Lucene 的物理的存儲結構有所幫助。
--------------------------------------------------------------------------------回頁首總結目前已經有非常多的知名的組織正在使用 Lucene,比如,Lucene 為 Eclipse 的幫助系統,麻省理工學院的 OpenCourseWare 提供了搜索功能。