201671010454词频统计软件项目报告

Posted 12zl12

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了201671010454词频统计软件项目报告相关的知识,希望对你有一定的参考价值。


一、课程名称:2016级计算机科学与工程学院软件工程(西北师范大学)

二、课程要求:实验二 软件工程个人项目

三、实验目标:

(1)掌握软件项目个人开发流程。
(2)掌握Github上发布软件项目的操作方法。

四、实验内容:

(一)需求分析

  1. 程序可读入任意英文文本文件,改文件中英文词数大于等于1个,且能读取容纳英文原版《哈利波特》10万词以上的文章。
  2. 指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
  3. 高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
  4. 统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

(二)功能设计

  1. 文件的读入输出功能:针对需求一和需求四。
  2. 键盘输入功能:针对需求二和需求三(用户可从键盘输入查看词频统计个数的的展示)。
  3. 频词统计功能:针对需求二、三、四(运用程序的统计功能进行词频统计)。
  4. 排序功能:针对需求三和需求四(按照词频数降序,按照字典顺序排序)。

(三)设计实现

  1. 该程序共有四个类,包括一个主函数Main.java和三个功能类。主函数Main.java用来控制整个流程(读入文本、单词词频统计、柱状图展示)
  2. WordCount.java:指定单词词频统计,可显示对应单词在文本中出现的次数和柱状图。
  3. HighCount.java:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
  4. WordSave.java:统计文本所有单词数量及词频数,并将单词及词频数按字典顺序输出到文件result.txt。

(四)测试运行

  1. 功能1测试
  2. 技术图片
  3. 功能2测试
  4. 技术图片
  5. 功能3测试
  6. 技术图片
  7. 功能4测试
  8. 技术图片

(五)代码展示

  1. 读入文本,并将文本内容按照正则表达式截取纯单词文本(即不包含其他字符)
        String line = "src/word.txt";
        File file = new File(line);
        InputStreamReader is = new InputStreamReader(new FileInputStream(file), "utf-8");
        BufferedReader buff = new BufferedReader(is);
        List<String> list = new ArrayList<String>();//list中只存放纯单词文本
        String readLine = null;//单词列表初始为空
        while((readLine = buff.readLine())!=null){
            String[] WordsArr = readLine.split("[^a-zA-z]");
            for(String word:WordsArr){
                if(word.length()!=0){
                    list.add(word);//将截取后的纯单词放入list
                }
            }
        }
        buff.close();
  1. 本段代码实现了最后一个功能:将单词及词频数按字典顺序输出到文件result.txt
        File file = new File("src/result.txt");
            if(file.exists()) {
                file.createNewFile();
            }
            FileWriter fop = new FileWriter(file.getAbsoluteFile());
            for(Entry<String,Integer> entry : Map2.entrySet()) {
                fop.write(entry.getKey()+":	"+entry.getValue()+"
");
            }
            fop.close();
            System.out.println("存放成功!");

(六)总结

在程序设计过程中,需求分析必不可少。如果一开始就写代码,能写一两个功能,但是要完整地实现整个程序并运行,必须对每个功能模块进行分析。该程序中,涉及到了文本的读入和输出、单词个数的统计以及排序功能,各个功能模块之间虽然都有联系,但最好保证各模块之间的独立性,便于程序的测试和维护。

(七)PSP

PSP2.1任务内容计划共完成需要的时间(min)实际完成需要的时间(min)
Planning计划88
Estimate估计这个任务需要多少时间,并规划大致工作步骤1010
Development开发200230
Analysis需求分析 (包括学习新技术)1515
Design Spec生成设计文档1012
Design Review设计复审 (和同事审核设计文档)24
Coding Standard代码规范 (为目前的开发制定合适的规范)88
Design具体设计15
Coding具体编码150220
Code Review代码复审1010
Test测试(自我测试,修改代码,提交修改)1515
Reporting报告2020
Test Report测试报告55
Size Measurement计算工作量55
Postmortem & Process Improvement Plan事后总结 ,并提出过程改进计划58

(八)经验分享

编写程序不是单纯的写代码,在正式写代码之前,设计显得尤为重要。而且在设计功能模块时不能将所有功能放在一起,要做到功能模块独立性,模块独立是优秀设计的关键,而设计又是决定软件质量的关键环节。其次,要学会正确的查阅资料。

点此查看项目源代码

以上是关于201671010454词频统计软件项目报告的主要内容,如果未能解决你的问题,请参考以下文章

201671010432词频统计软件项目报告

201671030119 词频统计软件项目报告

201671010431+词频统计软件项目报告

201671010441徐浩杰 词频统计软件项目报告

201671010439-词频统计软件项目报告

201671010406 词频统计软件项目报告