更多内容请见: python3案例和总结-专栏介绍和目录
一. jieba分词器的基础知识
安装:pip install jieba
安装:pip3 install paddlepaddle-tiny
如果出现超时的情况,指定清华源:pip3 install paddlepaddle-tiny -i https://pypi.tuna.tsinghua.edu.cn/simple
1.1 jieba分词支持4中方式
- 精确模式:将句子最精确的切分开,适合文本分析时使用;
- 全模式:将句子可以生成词语的词都扫描出来,速度非常快,但有歧义的词语也会被扫描出来;
- 搜索引擎模式:会在精确模式的基础上对长词语再进行切分,将更短的词切分出来,适用于搜索引擎分词;
- Paddle模式:利用PaddlePaddle深度学习框架ÿ

数据知道的成长之路
微信公众号
成长进阶、技术分享、资源获取


评论记录:
回复评论: