本文参考网址:
https://github.com/hankcs/pyhanlp
https://blog.csdn.net/hejp_123/article/details/85334320
HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产
环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
Pyhanlp (Python interfaces for HanLP)是 HanLP 的 python 接口,支持自动下载与升级 HanLP,
兼容 py2、py3。
本教程相关环境:
Python3.6.5
Java 1.8
Win10 系统 64 位
Anaconda3-5.2.0-Windows-x86_64
安装流程
1.安装 java 环境
HanLP 主项目采用 Java 开发,所以需要 Java 运行环境,请安装 JDK。你需要保证 JDK
位数、操作系统位数和 Python 位数一致。pyhanlp 在 64 位系统上通过了所有测试;在 32
位 系 统 上 可 以 运 行 但 不 做 保 证 。 这 一 步 相 对 比 较 简 单 , 可 参 考
https://www.cnblogs.com/ottox/p/3313540.html 进行安装
2.安装 JPypel
在 python 非官方库网站(https://www.lfd.uci.edu/~gohlke/pythonlibs)上下载库 jpype1 的
whl 文 件 。 下 载 后 在 命 令 提 示 符 里 切 换 到 下 载 的 路 径 下 , 执 行 pip
install JPype1-0.6.3-cp36-cp36m-win_amd64.whl 就安装上了。注意版本要一致
3.安装 pyhanlp
在 window 的命令提示符中继续执行:pip install pyhanlp
4.安装 hanlp 对应 jar 包、data 文件和 properties 文件
在 window 命令行提示符中继续执行:hanlp
5.查看 pyhanlp 安装是否成功
大功告成,然后测试一下
常见问题
1.
cygwin
请注意 cygwin 内部的路径都是虚拟的,外部 JVM 访问不到。如果你遇到类似:
出现这个问题时一般是由于重复安装路径冲突所引起,解决方案为找到相关目录,然后
删除 pyhanlp 和名如 pyhanlp.*.info 的两个文件夹。然后再从第 3 步安装 pyhanlp 开始
执行
2. 第 4 步出错,如下图所示
由于 data-for-1.73.zip 文件较大,自动下载速度较慢且不稳定容易中断造成错误。
在 https://pan.baidu.com/s/1Knb9gpjHTTah3Rp7zyQOTw 手动下载 zip 文件,然后将 zip 文
件复制到‘.\anaconda\Lib\site-packages\pyhanlp\static’目录下,并删除.downloading 文件。
然后再在 dos 窗口下执行 hanlp 即可成功。