Solr 部署及使用
1.环境配置:
本 示 例 中 的 环 境 为 : jdk1.7 以 上 版 本 , tomcat8 以 上 版 本 ,
solr5.5.4 版本,solrj 为 5.5.4 版本。
2.solr 部署步骤:
(1).部署 solr 搜索平台,从 apache 官网下载 solr 对应的版本,
下载地址为:http://archive.apache.org/dist/lucene/solr/
(2).下载完成后解压 zip 文件,解压后的文件结构如下图:
(3).进入到 server\solr-webapp 目录下,将 webapp 目录复制到
tomcat 下的 webapps 目录下,重命名 webapp 目录为 solr,如下:
( 4 ) . 将 server\lib\ext 下 的 所 有 jar 文 件 复 制 到 tomcat 下 的
solr\WEB-INF\lib 目录下,在 tomcat 下的 solr\WEB-INF 目录下新建文
件夹为 classes,将 server\resources 下的 log4j.properties 文件复制到
该目录下。
(5).在任一磁盘新建文件夹 solr_home,本示例是在 F 盘下创建,将
server\solr 下的所有文件夹及文件复制到该目录下,在该目录下创建一
个索引库,本示例创建的索引库为 core,如下图:
(6 ). 进 入 到 tomcat 下 的 webapps\solr\WEB-INF 目 录 下 , 找 到
web.xml 文件,修改其中的配置,如下图:
(7).修改配置信息到此完成,启动 tomcadt,进入浏览器,访问
http://localhost:8080/solr/index.html,如配置没问题,则正常访问到的
页面效果如下图:
(8).启动完成后开始配置索引库,及点击菜单中的 Core Admin,
修改其中的 name、instanceDir 为之前在 solr_home 下创建的 core,
如下图:
(9).如创建失败,可能和你在 solr_home 下创建的索引库名称不一
致,请重新检查一下,创建成功如下图:
(10).创建索引库完成后,点击左侧菜单中的 Core Selector,选
择刚创建的索引库,如下图:
( 11) .下 面 开 始 创 建索 引 , 点 击 左 侧 菜 单 中 的 Documents, 在
Documents 文本框中输入 json 格式的字符串,点击 Submit Document,
如建立索引成功会有返回值,如下图:
(12).创建索引成功后可以进行索引的查询,点击左侧菜单中的
Query,默认选择不用修改,直接点击按钮 Execute Query,查询出
的效果如下图:
(13).到此 solr 索引平台的搭建完成,已经可以正常使用。
3.solr 添加中文分词器:
( 1 ) . 首 先 进 入 到 F:\solr_home\core\conf 目 录 下 , 找 到
managed-schema 文件,打开该文件,在文件的最下方添加文本:
到该文件中,如下图:
(2).修改 field 字段中的 type 字段,即如果该字段需要进行中文
分词,则将该字段的 type 修改 text_ik,field 默认自带分词器,只
是对中文分词效果不是特别理想,本示例修改了 content 字段的 type,
如下图:
(3). IKAnalyzer 中文分词器可以从网上下载,下载时请注意 solr 的
版本,需要下载对应的版本, IKAnalyzer.rar 。将压缩文件解压,解压后
的目录结构如下图:
( 4 ) . 将 IKAnalyzer.jar 文 件 放 到 tomcat 下 的
webapps\solr\WEB-INF\lib 目录中。将其他的配置文件复制到 tomcat
下的 webapps\solr\WEB-INF\classes 目录下。重启 tomcat。
(5).启动完成后进入到 http://localhost:8080/solr/index.html 下,选择
左侧菜单中的 Analysis 菜单,在 Field Vaule(Index)中输入中文段落,
之 后 选 择 Analyse Fieldname/FieldType 为 刚 配 置 的 content , 点 击
Analyse Valuese 按钮,效果如下图:
(6).可以选择其他字段属性进行测试,会发现中文分词器和默认的
分词器的区别。
4.添加 solr 对 word 文档的支持:
(1).进入到 F:\solr_home\core\conf 目录下,打开 solrconfig.xml
配 置 文 件 , 添 加 文 本
text
true
attr_
true
到该文件中,添加完成的效果如下图: