Tag Archive : 搜索引擎

Solr原子更新

Solr4.0开始支持简单的原子更新和添加字段   参数说明 Solr支持多种修饰符,自动更新文档的值。 set – 更新一个字段 add – 添加一个字段 inc – 在原有值的基础上增加(看下面的例子更清楚) 备注: 所有原始字段必须存储(在fieldTyp …

SOLR优化-filter cache

原文链接:http://java.dzone.com/news/merge-policy-internals-solr?mz=33057-solr_lucene

配置solr自动生成id

schema.xml ==================================================== <field name=”id” type=”uuid” indexed=”true” stored=”true” required=”true” /> <fieldType name=”uuid” class=”solr.UUIDField” indexed=”true” />   …

Solr如何按照年月日facet分层查询

这里假设我们的时间字段是timestamp 在schema.xml配置如下 <field name=”timestamp” type=”date” indexed=”true” stored=”true” default=”NOW+8HOUR” multiValued=”false”/> 查询参数如下: facet=true&facet.date=timestamp&fa …

solr记录时间不准

下面的配置可以自动添加当前时间到timestamp字段,这是按照格林威日时间记录的,我们在东8区

取消document唯一性检查(Disable unique document check)

默认情况下,索引的时候Solr会检查主键是否有重复的,以避免不同的document使用相同的主键。如果你确认你的document不会有重复的主键,将参数allowDups=true加到url上可以取消检查,对于csv文档,使用overwrite=false。

关于Solr评分修改

经常有朋友在群里问,solr要修改打分机制怎么改? 大多数回答:Similarity是个不错的方案. 但是具体怎么弄很少有明确的描述,官方wiki也只是说可以自定义,具体如何做,没有例子. 首先,solr4.0本身提供了多种评分方法: org.apache.solr.search.similari …

Solr Performance Factors(Solr 性能因素)

Schema Design Considerations(数据模型方面考虑) indexed fields indexed fields 的数量将会影响以下的一些性能: 索引时的时候的内存使用量 索引段的合并时间 优化时间 索引的大小 我们可以通过 将 omitNorms=“true” 来减少indexed fields数量 …

SolrCloud分布式检索时显示每个shard的响应速度

想看看每个shards返回的时间,来设置方便设置HttpShardHandlerFactory。 shards.info