作业4:结对项目——词频统计

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了作业4:结对项目——词频统计相关的知识,希望对你有一定的参考价值。

1. 目标

  • 代码复审练习
  • 结对练习
  • 编写单元测试

2. 要求

  • [必做 2] 读取小文本文件A_Tale_of_Two_Cities.txt 或者 大文本文件Gone_with_the_wind.txt,统计某一指定单词在该文本文件中出现的频率。
  • 命令行格式: 提示符> Myapp.exe -f filename.txt -w word (PS:C++ 程序,Java 程序输出方式类似)
  • 解释:
    • 选项 -f 表示打开某一文件(filename.txt)
    • 选项 -w 表示统计其后单词(word)在打开的文件(filename.txt)中的频率

  结对对象纪杨阳的博客地址 :http://home.cnblogs.com/u/yangyangji/

  编写系统的Github 链接:https://github.com/yangyangji/ex.2

  双方的贡献比例:1:1

  结对编程照片如下:

技术分享

 

源代码如下:

 

#include<iostream>
#include<fstream>
#include<cstring>
#include<string>
using namespace std;

struct Word{      //定义结构体
    int Count;//计数器
     Word() : Str(""), Count(0) {}  
    string Str; //字符串
    char *p;
};


void exchange(Word &word)  //函数,用于交换单词(排序单词)    
{  
    string tStr = word.Str;  
    int tCount = word.Count;  
    word.Str = Str;  
    word.Count = Count;  
    Str = tStr;  
    Count = tCount;  
}  

Words test[100];

void lwr(char x[])     //大写转小写
{   int k = 0;
    while (x[k] != \\0)
    {
        if (x[k] >= A&&x[k] <= Z)
            x[k] = x[k] + 32;
        k++;
    }
}

int identify(char a[])    //判断是否符合单词的定义
{   int m=(strlen(a)>=4)?1:0;
    int n=(a[0]>=a&&a[0]<=z)?1:0;
    if(!m||!n)
        return 0;
    else
        while(a)
        {   for(int i=1;;i++)
           {  
               if(!(a[i]>=a&&a[i]<=z)||!(a[i]>=0&&a[i]<=9))
                        return 0;
               else
                        return 1;
           }
        }
}

void SortWordDown(Word * words, int size)  //以单词出现频率降序排列单词,words 单词数组,size 单词数量
{  
    for(int i=0;i<size;i++)  
    {
        for(int j=0;j <size-1;j++)  
        { 
            if(words[j].Count<words[j+1].Count)  
            {  
                words[j].exchange(words[j+1]);  
            }  
        }  
    }  
}  

int counting(char b[],int num)    //对出现次数计数
{   for(int j=0;j<num;j++)
    {

        if(!strcmp(b,test[j].p))
             test[j].count++;
        else
            return 0;
    }
}


int main()
{   char c[200];
    ifstream fin("D:/A_Tale_of_Two_Cities.txt");   //从文档中获取字符串
    for(int f=0;;f++)
        fin>>c[f];
    fin.close();
    cin.get();
    lwr(c);
    const char *delim = ",”“.‘‘!?";      //分割字符串
    char *q;
    int n=0;
    q = strtok(c, delim);
    SortWordDown(words, wCount);  
    while (q)
    {
        if (identify(q))
        {
            
                strcpy(test[n].p,q);
                n++;
            
        }

       
       q=strtok(NULL,delim);
    }
    cout<<"输入统计出现频数的指定单词:\\n";    
    char r;
    cin>>r;
    int t=0;
    while(!strcmp(test[n].p,r))     //找到指定单词
    {   
        t++;
    }
    cout<< test[n].p << ":" << test[n].count << \\n;    //输出指定单词的统计结果
    return 0;
}

 

实验结果:

技术分享

技术分享

技术分享

 

实验体会:

由于进行了合作,实验效率得到了极大的提高,各自擅长的地方得到了发挥。

以上是关于作业4:结对项目——词频统计的主要内容,如果未能解决你的问题,请参考以下文章

结对项目— 词频统计(语言C++)

作业4:结对项目—— 词频统计

作业4:结对项目—— 词频统计

结对项目— 词频统计2(语言C++)

作业4(必做2)----指定词频统计

结对编程-词频统计