ElasticSearch入门篇Ⅰ --- 核心知识概括
C01.什么是Elasticsearch 1.什么是搜索 垂直搜索(站内搜索) 互联网的搜索:电商网站,招聘网站,各种app IT系统的搜索:OA软件,办公自动化软件,会议管理,员工管理,后台管理系 2.如果用数据库做搜索会怎么样 数据库在做某些搜索(模糊搜索)时,效率会很差,是不太靠谱的。 3. 什么是全文检索? 数据库搜索的弊端: 数据库里有100万条数据,模糊匹配要扫描100万次,每次扫描都要匹配文本所有字符,还无法拆解开来检索。 全文检索 :会将100万条数据拆分开来,建立 倒排索引 ,搜索的时也许第一次就可以搜素到对应的数据,可能是100次,1000次,上述过程就叫全文检索。 Lucene: 就是一个jar包,里面包含各种建立倒排索引,以及搜索的代码,包括各种算法。我们Java开发时,引入lucene的jar进行开发就可以了。使用lucene,我们可以去将已有的数据建立索引,lucene会在本地磁盘上面给我们组织索引的数据结构。 lucene的弊端 :数据量大,一台机器难以放下,需要多台机器,可用性,可维护性差。 4.什么是Elasticsearch 自动维护数据的分布到多个节点的索引的建立,还有搜索请求分不到多个节点执行 自动维护数据的冗余副本,保证说一些机器宕机了,不会丢失任何的数据 分装了更多的高级功能,以给我们提供更多高级的支持,让我们快速地开发应用