作业地址:【https://edu.cnblogs.com/campus/nenu/2016CS/homework/2110】
程序名称:wf.exe
作用:一个用于统计文本文件(文件名后缀为txt)中的单词出现次数的控制台程序
单词:不以数值开头,由英文字母和字母数字符号组成的字符串视为一个单词。单词以分隔符分割且不区分大小写。
A-Z
,a-z
A-Z
,a-z
,0-9
file123
是一个单词,123file
不是一个单词。file
,File
和FILE
是同一个单词功能列表:
控制台输入格式wf -f 文件名
,以“input.txt”作为文件名为例,如下。total为不重复单词的总数量,例如“she is not she”,则total为3。
输出的单词均为小写字母。
wf -c input.txt
/*
*要求程序统计文本文件input.txt中不重复的单词数量,最终输出
*例:input.txt文件中内容为"Talk is cheap,Show me the code"
*则输出如下
*/
total 7
talk 1
is 1
cheap 1
show 1
me 1
the 1
code 1
控制台输入格式wf -f 文件路径
,以“E:\code”作为文件路径为例,如下。
wf -f E:\code
/*
*要求程序统计目录E盘的code文件夹中,文件名称按照字典序最靠前的文本文件的不重复的单词数量,最终输出
*例:E:\code中有input.txt、output.txt和test.txt三个文本文件,程序应选择input.txt进行词频统计,input.txt文件中内容为"Talk is cheap,Show me the code"
*则输出如下
*/
total 7 words
cheap 1
code 1
is 1
me 1
show 1
talk 1
the 1
控制台输入格式wf -f 文件路径 -n 数量
或者wf -c 文件名 -n 数量
或者wf -n 数量 -c 文件名
或者wf -n 数量 -f 文件路径
。
以“E:\code”作为文件路径,以“input.txt”作为文件名为例,数量为3,如下。
统计文件中各单词的出现次数,最终只输出频率最高的3个。频率相同的单词,优先输出字典序靠前的单词。
wf -f E:\code -n 3
/*
*要求程序统计目录E盘的code文件夹中,文件名称按照字典序最靠前的文本文件的不重复的单词数量,最终输出词频最高的3个单词
*例:E:\code中有input.txt、output.txt和test.txt三个文本文件,程序应选择input.txt进行词频统计,input.txt文件中内容为"Talk is cheap,Show me the code"
*则输出如下
*/
Total words is 7
----------
cheap 1
code 1
is 1
git项目名称为wf,例如:https://git.coding.net/XXX/wf.git
。代码要求在 coding.net 做版本控制。要求push&pull时使用git客户端,而不使用web页面。
推荐git客户端tortoisgit。安装过程可参考链接:https://www.cnblogs.com/ranh941/p/7555082.html。
请注意助教或教师会使用脚本pull每个人的项目,如果你在博客中给出的链接不符合规范而导致脚本无法获取你的项目,那么程序要求得分为0。
【你的博客第一行必须写上作业要求的博客链接】 这样,读者看到学生的博客后,就可以点击到作业要求的博客。
例如:https://www.cnblogs.com/ranh941/p/7999266.html。
反向链接,让读者了解背景。要不然很多人看了,并不了解要求,也是一头雾水。
作业如果没有此项,此次作业无效。
在博客中给出你们git仓库地址。
原文:https://www.cnblogs.com/ranh941/p/9650231.html