Luke是一款專業的lucene索引查看工具,可以通過document編號或term浏覽索引,訪問Lucene構建的索引文件,顯示和修改Lucene的索引文件內容,從索引中選擇性的刪除文件,分析搜索結果,優化索引。是您研究Lucene的好幫手。推薦有需要的朋友下載!
軟件功能:
1、通過document編號或term浏覽索引
2、查看document內容,可複制到剪貼板
3、對頻率最高的term的索引字段提供排名後的浏覽
4、執行搜索語句並浏覽搜索結果
5、分析搜索結果
6、從索引中選擇性刪除文件
7、重建原始文檔字段,對其進行編輯,然後重新插入的索引
8、優化索引
9、可以打開hadoop文件系統內的索引文件
Luke使用教程
啓動後選擇你的索引文件路徑,選擇read-only打開:
overview界面是用来进行索引的一般性查看和操作的,比如索引目录,域信息,版本,term信息,Rank排名 等信息。注意,索引文件里Analyze却不Store的字段信息还是不可见的,也就是只能看STORE了的内容。
documents界面是用来进行文档的操作和查看的,能根据文档编号和词进行查找,其实这个就是搜索功能 。
search界面是可以进行索引的搜索测试 ,可以编写lucene搜索语句,看到语句解析后的query树,还可以选择进行搜索的分词器、默认字段和重复搜索次数,然后下面的listview中就会列出一个搜索的的文档的所有保存的(store)字段的值,可以看到查询花费的时间
file界面,故名思義,這個就是用來查看每個索引相關文件的一些屬性的界面,具體的話,可以通過這個界面分析下索引文件的多少,是否需要優化或者合並等等
最后一个plugins界面,就是可以看到luke提供的各种插件。比较有用的还是分词工具,提供一个分词的类,然后下面文本框输入一段文本,然后就可以让这个工具帮你分词,你可以看到详细的分词信息,对自定义分词器的调试或者测试。还有一个hadoop插件,支持从hadoop节点中获取节点中文件的相关信息,对分布式搜索引擎搭建有用,算是支持多平台的lucene索引文件块的查看 。
