首页 > 其他 > 详细

综合练习:词频统计

时间:2018-03-27 18:05:05      阅读:208      评论:0      收藏:0      [点我收藏+]
#读取英文歌词文件
file=open(dd.txt,r,encoding=utf-8)
word=file.read()
file.close()
#排除符号
di=‘‘‘.,‘‘""?!:;‘‘‘
for i in di:
    word=word.replace(i,‘‘)
#大写转换小写 空格分割
word=word.lower().split()
#定义字典存放数据
diet={}
for c in word:
    count=word.count(c)
    diet[c]=count
for c in diet:
    print(diet[c],c)
#排除介词等无关词语
de={the,and,i,in,to,in,with,it}
for i in de:
    diet.pop(i)
#排序
count = sorted(diet.items(),key=lambda items: items[1], reverse=True)
#将结果存放在文件夹
f=open("F:text.txt",w)
for i in range(20):
    f.write(count[i][0]+" "+str(count[i][1] )+\n)
f.close()

 

综合练习:词频统计

原文:https://www.cnblogs.com/zzl-0402/p/8658718.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!