接触了一滴滴的lucene库,想做一个文件目标内容收集(比如日志内容,收集出现exception 的所有日志信息内容然后显示)。 目前用lucene能收集目标内容出现的文件位置(不知道能找到具体文件内容位置?)。 然后通过获取的文件路径进行对该文件读入string操作,截取出目标内容以及其附近的小内容,刚试了下实现。觉得当文件很多又很大的时候,时间开销会比较大,一个txt差不多700kb,20多个txt差不多要执行掉200ms。 求大神指导一下,或者给点资料看看~
这个直接用Lucene就可以,不用二次扫描,可以参考FastVectorHighlighter
欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。 温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。