一、程序分析
编译环境:python3.7、pycharm2018
1.读文件到缓冲区

2.处理缓冲区 bvffer的文件,统计每个单词的频率,存放在字典word_freq

3、按照单词的频数排序,输出次数排名前十的单词(output_result(word_freq))

4.主函数输出文章中单词前十的结果

5、用cProfile对代码性能进行测试

二、代码风格分析
python代码在每行末尾不用加“;”
例如:


2.对A_Tale_of_Two_Cities.txt进行词频统计

1.可视化操作:

2.执行次数最多代码:

3.执行时间最长代码:

由图知,执行次数最多且执行时间最多的代码是:
for word in words:
word_freq[word] = word_freq.get(word, 0)+1
程序改进:
将原来的代码:
1 for i in ‘!"#$%&()*+-,-./:;<=>?@“”[\\]^_{|}~‘:
2 bvffer = bvffer.replace(i, " ") # 替换特殊字符
3 bvffer = bvffer.lower() # 把大写字母转换为小写
4 words = bvffer.strip().split() # 分割字符串
变为:
words = bvffer.lower().strip().split()原文:https://www.cnblogs.com/ruio/p/9763859.html