Solr查询语法详解
1. 匹配所有文档
1 | *:* |
2. 强制、阻止和可选查询
Mandatory(强制)
查询结果中必须包括的(例如,只返回包含指定词的条目)
Solr/Lucene语法:
+make
+make +up
+make +up +kiss
Prohibited(阻止)
例如,所有文档除了包含某个词的文档
Solr/Lucene语法:
+make +up -kiss
Optional(可选)
Solr/Lucene语法:
+make +up kiss
3. 布尔操作
AND、OR和NOT布尔操作(必须大写)与Mandatory、optional和prohibited相似。
make AND up
=+make +up
:AND左右两边的操作都是mandatorymake up
=make OR up
=make up
:OR左右两边的操作都是optional+make +up NOT kiss
=+make +up –kiss
make AND up OR french AND Kiss
不可以达到期望的结果,因为AND两边的操作都是mandatory的
4. 子表达式查询(子查询)
可以使用”()”构造子查询。
例子: (make AND up) OR (french AND Kiss)
5. 子表达式查询中阻止查询的限制
例子: make (-up)
只能取得make的查询结果;要使用 make (-up *:*)
查询make或者不包括up的结果。
6. 多字段查询
通过字段名加上分号的方式(fieldName:query)来进行查询
例子: entryNm:make AND entryId:3cdc86e8e0fb4da8ab17caed42f6760c
7. 通配符查询(wildCard Query)
通配符 ? 和 *
*
表示匹配任意字符?
表示匹配出现的位置
例子:
ma?*
(ma后面的一个位置匹配)ma??*
(ma后面两个位置都匹配)
注意事项
- 查询字符必须要小写:
+Ma +be**
可以搜索到结果;+Ma +Be**
没有搜索结果 - 查询速度较慢, 尤其是通配符在首位:主要原因一是需要迭代查询字段中的每个term,判断是否匹配;二是匹配上的term被加到内部的查询,当terms数量达到1024的时候,查询会失败。
- Solr中默认通配符不能出现在首位 (可以修改QueryParser,设置setAllowLeadingWildcard为true)
- 设置
setAllowLeadingWildcard
为true
8. 模糊查询、相似查询
不是精确的查询,通过对查询的字段进行重新插入、删除和转换来取得得分较高的查询结果(由Levenstein Distance Algorithm算法支持)。
一般模糊查询
例子: make-believ~
门槛模糊查询
对模糊查询可以设置查询门槛,门槛是0~1之间的数值,门槛越高表面相似度越高。
例子:
make-believ~0.5
make-believ~0.8
make-believ~0.9
9. 范围查询(Range Query)
Lucene支持对数字、日期甚至文本的范围查询。结束的范围可以使用”*”通配符。
日期范围(ISO-8601 时间GMT)
1 | sa_type:2 AND a_begin_date:[1990-01-01T00:00:00.000Z TO 1999-12-31T24:59:99.999Z] |
数字范围
1 | salary:[2000 TO *] |
文本范围
1 | entryNm:[a TO a] |
10. 日期匹配
YEAR, MONTH, DAY, DATE (synonymous with DAY) HOUR, MINUTE, SECOND, MILLISECOND, 和 MILLI (synonymous with MILLISECOND) 可以被标志成日期。
例子
2年前的现在这个时间:
1
r_event_date:[* TO NOW-2YEAR]
2年前前一天的这个时间:
1
r_event_date:[* TO NOW/DAY-2YEAR]