谢谢你的建议!
>第一,软件对于搜索内容速度非常快,能否再增加对于文件名的搜索?因为所搜索的关键词往往也是文件名的组成部分之一,这样可以更方便地找到所关注的文件。搜索的结果,文件名和内容可分开显示,亦可合并显示。
▲这个一开始的时候就有考虑到,文件名,路径的确也应该是一个被索引的项目(也就是可以检索的),不过当初只是为了测试核心的索引功能,所以“偷懒”只处理了文件的内容……文件名检索我会尽快实现。
>第二,搜索显示的文字太小,不便查看,能否增加字体的调节,便于阅览?
▲可以增加这个选项。不过字体大小的调节,实际上现在发布的版本就已经实现。
具体操作方法是:光标点在文本显示区域,按住Ctrl,同时滚动鼠标的滚轮,就可以调节大小了.向前滚是变大,向后滚是变小.
后面会增加默认大小的设置选项.
第三,能否增加搜索结果的保存项即历史选项?这样可以便于查阅最近的搜索结果。或者也可以输出或打印结果。
▲这个建议很不错!非常感谢!我会实现它~
第四,在抽取某些比较长的office文档,特别是word时,常会出现只抽取一部分的情况,不知何故?有时还会出现只增加标题而不抽取内容的情况,关闭软件重新打开就又正常了。
▲因为调用了Windows系统本身的一些功能,这个问题我问过微软,这个和生成Word的版本以及操作系统有关系,暂时还没什么办法解决……
第五,检索的内容由于没有压缩,体积过大,和原文件体积相当,能否采取压缩保存的办法?或者是能否增加一个选项,过滤一些无法抽取内容的文件格式,例如图片、应用软件、影音的扩展名等?这样可能会大大减少体积。
▲内容实际上2007/10/20发布的版本中已经加入了压缩算法,只是存储的包括本身文件的二进制数据,还有抽取出来的文本信息,以及路径等一些信息,所以最后的结果可能会和原先的差不多,甚至超过原来的大小。基于速度方面的考虑,压缩算法采用了LEO算法,压缩率高的话速度就下降了。所以我这里选择了速度。另外无法抽取的文件的过滤,我会在后面加入这个功能。
Minidx只是我业余时间做的一个东西,最近一段时间杂事很多,所以进度非常慢,可能下一个版本发布还需要一段时间,希望可以给与理解
