首页 > 编程语言 > 详细

软工作业3:个人编程练习--Python统计词频

时间:2018-10-09 20:25:49      阅读:171      评论:0      收藏:0      [点我收藏+]

一、程序分析

1、读文件到缓冲区

 1 def process_file(dst):     # 读文件到缓冲区
 2     try:     # 打开文件
 3         f = open(dst,r)
 4     except IOError,s:
 5         print s
 6         return None
 7     try:     # 读文件到缓冲区
 8         bvffer = f.read()
 9     except:
10         print "Read File Error!"
11         return None
12     f.close()
13     return bvffer

2、缓冲区处理

 1 def process_buffer(bvffer):
 2     if bvffer:
 3         word_freq = {}
 4         # 下面添加处理缓冲区 bvffer代码,统计每个单词的频率,存放在字典word_freq
 5         bvffer.lower()
 6         char={"~@#$%^&*()_-+=<>?/,.:;{}[]|\‘“”"}
 7         for ch in char :    
 8             bvffer=bvffer.replace(ch, )
 9         words=bvffer.strip().split()
10         for word in words:
11             word_freq[word]=word_freq.get(word,0) + 1
12         return word_freq

 

软工作业3:个人编程练习--Python统计词频

原文:https://www.cnblogs.com/benchover/p/9762490.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!