作业4:结对项目—— 词频统计
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了作业4:结对项目—— 词频统计相关的知识,希望对你有一定的参考价值。
基于作业3的结果,读取一个较小的文本文件A_Tale_of_Two_Cities.txt,统计该文件中的单词的频率,并将统计结果输出到当前目录下的 Result1.txt 文件。 (第一阶段初稿完成该要求)
命令行格式: 提示符> Myapp.exe -f filename.txt > Result.txt (PS:C++ 程序,Java 程序输出方式类似) filename.txt 为前面下载的文件名。
解释:选项 -f 表示后面跟文件名
- 输出格式规定(参考作业3中的示例): 首先按照频率由高到低排序
- 频率一样的词, 按照字典顺序排序
- 结对对象:赵建(博客园:http://www.cnblogs.com/blocksmz/ GitHub:https://github.com/blocksmz)
- 双方贡献比例:我40% 赵建60%
- 由于我的基础比较差,我能想到的算法比较有限,我只能提供一些基本的帮助。有些时候他会在一些简单的地方卡壳,我会适时的指出他的问题。
- 程序里很多部分的算法都是他来完成的,我负责打字。。
- 但是源程序还有有些问题,不能很好的运行。
- 我就赘述代码了,在他的博客园里有
以上是关于作业4:结对项目—— 词频统计的主要内容,如果未能解决你的问题,请参考以下文章