- Lucene + 全文搜索
- 实时的文件存储,每个字段都可以被索引,并可被搜索
- 实时分析搜索引擎
- 可扩展,处理PB级结构化、非结构化数据
- 可以通过简单RESTful API、各种语言的客户端、甚至是命令行与之交互(HTTP 服务的典型优点)
- Java 环境
- Marvel 管理监控工具,一个插件
# 测试
$ curl -XGET 'localhost:9200/?pretty'
- Java API
- JSON 作为文档序列化格式
- 索引(indexing), 存储员工数据的行为。
- 搜索(search),
- 聚合(aggregations)
Ralational DB -> Databases -> Tables -> Rows -> Columns Elasticsearch -> Indices -> Types -> Documents -> Fields 一对多。
- 名称, 一个索引就像传统关系数据库中的数据库,复数为indices / indexes
- 动词【索引一个文档】, 把一个文档存储到索引里
- 倒排索引(Inverted index),传统数据库为特定列增加一个索引,如B-Tree来加速索引
# add person-1
$ curl -XPUT 'localhost:9200/megacorp/employee/1' -H 'Content-Type: application/json' -d'
"first_name" : "John",
"last_name" : "Smith",
"age" : 25,
"about" : "I love to go rock climbing",
"interests": [ "sports", "music" ]
# add person-2
$ curl -XPUT 'localhost:9200/megacorp/employee/2' -H 'Content-Type: application/json' -d'
"first_name" : "Jane",
"last_name" : "Smith",
"age" : 32,
"about" : "I like to collect rock albums",
"interests": [ "music" ]
# add person-3
$ curl -XPUT 'localhost:9200/megacorp/employee/3' -H 'Content-Type: application/json' -d'
"first_name" : "Douglas",
"last_name" : "Fir",
"age" : 35,
"about": "I like to build cabinets",
"interests": [ "forestry" ]
$ curl -XGET 'localhost:9200/megacorp/employee/1'
# 默认返回前10个结果
$ curl -XGET 'localhost:9200/megacorp/employee/_search'
# 搜索last_name 字段
$ curl -XGET 'localhost:9200/megacorp/employee/_search?q=last_name:smith'
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query" : {
"match" : {
"last_name" : "Smith"
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query" : {
"bool" : {
"filter" : {
"range" : {
"age" : { "gt" : 30 }
"must" : {
"match" : {
"last_name" : "Smith"
中文版文档语法版本过时, filtered 已在ES5.0废弃, 使用bool/must/fiter。 gt = greater than。
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query" : {
"match" : {
"about" : "rock climbing"
默认情况下,Elasticsearch 根据相关性评分来对结果集进行排序。是传统数据库很难实现的功能。
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query" : {
"match_phrase" : {
"about" : "rock climbing"
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query" : {
"match_phrase" : {
"about" : "rock climbing"
"highlight": {
"fields" : {
"about" : {}
数据上生成复杂的分析统计,功能类 比SQL GROUP BY, 但更强大
# 基础语法
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"aggs" : {
"all_interests" : {
"terms" : {"field": "interests"}
# 过滤字段
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"query": {
"match": {
"last_name": "smith"
"aggs" : {
"all_interests" : {
"terms" : {"field": "interests"}
# 分级汇总
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
"aggs" : {
"all_interests" : {
"terms" : {"field": "interests"},
"aggs" : {
"avg_age" : {
"avg" : { "field" : "age" }
# 启用
$ curl -XPUT 'localhost:9200/megacorp/_mapping/employee' -H 'Content-Type: application/json' -d '
"properties": {
"interests": {
"type": "text",
"fielddata": true
分布式概念上透明化,不需要知道分布式系统、分片、集群发现等分布式概念,就可以在集群上工作。 Elasticsearch 隐藏分布式系统的复杂性。在底层自动完成:
- 文档分区到不同的容器或者分片,可以存于一个或多个节点
- 分片均匀分配到各个节点,对索引和搜索做负载均衡
- 冗余每个分片,防止硬件故障造成的数据丢失
- 将集群中任意一个节点的请求路由到相应的数据节点
- 无论是增加节点,还是移除节点,分片都可以无缝扩展和迁移