首页 > 编程语言 > 详细

python——jieba分词过程

时间:2019-04-24 23:14:39      阅读:55      评论:0      收藏:0      [点我收藏+]

标签:print   --   training   空字符串   交通   jieba分词   imp   ini   jieba   

 1 import jieba
 2 """函数2:分词函数"""
 3 def fenci(training_data):
 4     """-------------------------------------------------------
 5     seg_list = jieba.cut("他来到上海交通大学", cut_all=True)
 6     print("【全模式】:" + "/ ".join(seg_list))
 7     他/ 来到/ 上海交通大学
 8     ----------------------------------------------------------"""
 9     seg_list = jieba.cut(training_data)             # 默认是精确模式
10     training_ci = " ".join(seg_list)                # 空字符串中join加入分词后的词            
11     training_ci = training_ci.split()               # 以空格符作为分界线进行分割,保存为list
12     return training_ci
13 training_data="他来到上海交通大学"
14 training_ci=fenci(training_data)
15 print("training_ci1",training_ci)

 

 

1 training_ci 他 来到 上海交通大学
2 training_ci [, 来到, 上海交通大学]

 

python——jieba分词过程

标签:print   --   training   空字符串   交通   jieba分词   imp   ini   jieba   

原文:https://www.cnblogs.com/fpzs/p/10765561.html

(0)
(0)
   
举报
评论 一句话评论(0
0条  
登录后才能评论!
© 2014 bubuko.com 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号