如何向pyhanlp添加自定义的词典


小编给大家分享一下如何向pyhanlp添加自定义的词典,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!以python 2.7.9为例:
1.安装pyhanlp:pip install pyhanlp2.在字典路径下添加自定义的词典:CustomDictionary主词典文本路径是data/dictionary/custom/CustomDictionary.txt,用户可以在此增加自己的词语(不推荐);也可以单独新建一个文本文件,通过配置文件;CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt; 我的词典.txt;来追加词典(推荐)。具体绝对路径可用hanlp –version获取:#hanlp –versionjar 1.6.3: /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp-1.6.3.jardata 1.6.2: /usr/local/lib/python2.7/site-packages/pyhanlp/static/dataconfig : /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp.properties#cat /usr/local/lib/python2.7/site-packages/pyhanlp/static/hanlp.properties | grep “CustomDictionaryPath”3.建议在该路径下添加自己的词典文件例如 我的词典.txt,并将其加入上面的properties文件里的CustomDictionaryPath下面。#cat 我的词典.txtcodis集群 nz 1000今日头条 nz 1000第一列为词条,第二列为词性(默认为n),第三列为词频4.然后需要删除缓存文件,这样python才会重新加载新增的文件:#rm -f CustomDictionary.txt.bin5.测试新增的词典:python -c “from pyhanlp impo 香港云主机rt *;print(HanLP.segment(‘codis集群,今日头条’))”五月 16, 2018 4:43:14 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes警告: 读取/usr/local/lib/python2.7/site-packages/pyhanlp/static/data/dictionary/custom/CustomDictionary.txt.bin时发生异常java.io.FileNotFoundException: /usr/local/lib/python2.7/site-packages/pyhanlp/static/data/dictionary/custom/CustomDictionary.txt.bin (没有那个文件或目录)报这个错误没有关系,只是个warning,重新加载缓存文件而已。以上是“如何向pyhanlp添加自定义的词典”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注开发云行业资讯频道!

相关推荐: spark中如何实现行列转换即宽表窄表转换

spark中如何实现行列转换即宽表窄表转换,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。注意feature和value是原多列名转换为行数据后,重新定义的最终两列名行转列比较简单,…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 10/03 15:45
Next 10/03 15:45

相关推荐