博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Solr整合中文分词组件IKAnalyzer
阅读量:6209 次
发布时间:2019-06-21

本文共 575 字,大约阅读时间需要 1 分钟。

我用的Solr是4.10版本,

在csdn下载这个版本的IKAnalyzer:IK Analyzer 2012FF_hf1.zip

解压后目录如下:

 

 

 (1)这里还用solr自带的example实验分词效果,在如下的WEB-INF目录新建classes文件夹,

将IKAnalyzer.cfg.xml和stopword.dic拷贝到classes文件夹里面

 

(2)将IKAnalyzer2012FF_u1.jar拷贝到lib文件夹里面

(3)修改example\solr\collection1\conf目录下的schema.xml,在最下面添加如下4行

 不要在最上面添加,会报错

(4)重新启动solr

在运行-cmd-切换回D盘的example目录下,执行java -jar start.jar

再登录Solr管理界面,Analysis中的Field Value里输入一句话,FieldType选择刚在xml中配置的text_ik,点击蓝色按钮Analyse Values,

 

停用词的使用:

http://www.tuicool.com/articles/aYJ3Qv3

 

转载于:https://www.cnblogs.com/Donnnnnn/p/6215474.html

你可能感兴趣的文章
java路径Java开发中获得非Web项目的当前项目路径
查看>>
Google API设计指南-资源名称
查看>>
最全React技术栈技术资料汇总(收藏)
查看>>
【工具使用系列】关于 MATLAB 遗传算法与直接搜索工具箱,你需要知道的事
查看>>
Kali-linux Arpspoof工具
查看>>
PDF文档页面如何重新排版?
查看>>
基于http协议使用protobuf进行前后端交互
查看>>
UML设计一个电影票务销售系统(四)
查看>>
AlphaGo Zero用它来调参?【高斯过程】到底有何过人之处?
查看>>
Linux平台Oracle多个实例启动说明
查看>>
bash腳本編程之三 条件判断及算数运算
查看>>
php cookie
查看>>
linux下redis安装
查看>>
弃 Java 而使用 Kotlin 的你后悔了吗?| kotlin将会是最好的开发语言
查看>>
JavaScript 数据类型
查看>>
量子通信和大数据最有市场突破前景
查看>>
StringBuilder用法小结
查看>>
UVa 10252-Common Permutation
查看>>
CSS - 修改input - placeholder 和 readonly 的样式
查看>>
android studio :cannot resolve symbol R
查看>>