首页 > 其他 > 详细

nltk: Tokenizing text into sentences

时间:2017-01-09 11:35:56      阅读:181      评论:0      收藏:0      [点我收藏+]
  1. 安装 nltk pip install nltk
  2. 下载nltk_data
    方法一: 通过客户端下载

    import nltk
    nltk.download()

    出现如下客户端,选择所需的包下载。(但由于网速原因,我自己没有下载成功)
    技术分享
    方法二: 通过命令行下载 (我自己也没下载成功)

    import nltk
    nltk.download(‘all’)

    方法三: 复制别人下载好的包
    通过盘多多的搜索,查找到python3所需的nltk_data文件夹 http://pan.baidu.com/share/link?shareid=3107283122&uk=270537756&fid=612886180436827 ,下载解压并放置到C://nltk_data的路径下
    技术分享

  3. text to sentences 的小例子

    from nltk.tokenize import sent_tokenize
    a=”Hello World. It’s good to see you. Thanks for buying this book.”
    b=sent_tokenize(a)
    print(b)
    技术分享





nltk: Tokenizing text into sentences

原文:http://www.cnblogs.com/combfish/p/6264213.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!