201671010406 词频统计软件项目报告
Posted dingjiahui
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了201671010406 词频统计软件项目报告相关的知识,希望对你有一定的参考价值。
一.需求分析
- 统计文件中各单词的出现次数
二. 功能设计
程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
三. 环境需求
测试机环境:Windows
开发环境:CFree5
四.设计实现
利用指针功能
打开txt文件,若打开成功则返回文件起始位置给p指针
利用flag做标志统计每个单词出现的频率
将单词按字典顺序排序,即通过比较ascii值来进行冒泡排序
五.测试运行
英文文本:
开发平台:
运行界面:
六.部分代码
检查文件结束:
while(!feof(p)) { for(j=0;j<20;j++) { ? temp[j]=fgetc(p); ? if(temp[j]==' '||temp[j]==','||temp[j]=='.'||temp[j]=='!'||temp[j]=='?') ? { ? temp[j]='