基于Lucene的搜索引擎的设计与实现
我们处在一个大数据的时代,伴随着网络信息资源的庞大,人们越来越多地注重怎样才能快速有效地从海量的网络信息中,检索出自己需要的、潜在的、有价值的信息,从而可以有效地在日常工作和生活中发挥作用。因为搜索引擎这一技术很好的解决了用户搜索网上大量信息的难题,所以在当今的社会,无论是发展迅猛的计算机行业,还是作为后起之秀的信息产业界,都把Web搜索引擎的技术作为了争相探讨与专研的方向。 搜索引擎的定义就是指按照既定的 策略 与方法,采取相关的 计算机程序 ,通过在 互联网 中进行寻找信息,并显示 信息 ,最后把找到的信息进行整理和筛选,为搜索引擎的使用者提供 检索 信息的服务,终极目标是为了提供给使用者,他所搜索信息相关的资料的计算机 系统 。搜索引擎的种类繁多,既可以进行 全文的索引 ,还可以进行 目录的索引 ,不仅有集合式的搜索引擎,还有 垂直搜索的引擎 以及 元搜索引擎 。除此之外,还有门户搜索引擎和免费链接列表等等 经过对搜索引擎的研究同时与Lucene自身的特性相结合,将本次设计所需要实现的功能阐述如下: 支持桌面文件搜索,格式包括txt、doc、xls和ppt; 支持分词查询 支持全文搜索 能够高亮显示搜索关键字 显示查询所用的时间 显示搜索历史、过滤关键字 分词查询与全文搜索这两项功能,我们都可以利用Lucene本身自带的库加上相关算法就可以完成设计了