首页 > 其他 > 详细

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)

时间:2016-08-19 12:58:41      阅读:337      评论:0      收藏:0      [点我收藏+]

使用gensim的word2vec训练了一个词向量。

语料是1G多的维基百科,感觉词向量的质量还不错,共享出来,希望对大家有用。

下载地址是http://pan.baidu.com/s/1pLGlJ7d 密码:hw47

包含训练代码、使用词向量代码、词向量文件(3个文件)

 

技术分享

 

技术分享

 

因为机器内存足够,也没有分批训练。所以代码非常简单。也在共享文件里面,就不贴在这里了。

 

开源共享一个训练好的中文词向量(语料是维基百科的内容,大概1G多一点)

原文:http://www.cnblogs.com/Darwin2000/p/5786984.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!