Python语音实现词频统计

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python语音实现词频统计相关的知识,希望对你有一定的参考价值。

需求:

1.设计一个词频统计的程序。

2.英语文章中包含的英语标点符号不计入统计。

3.将统计结果按照单词的出现频率由大到小进行排序。

 

设计:

1.基本功能和用法会在程序中进行提示。

2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。

 

代码如图所示:

1.导入程序所需模块。

技术分享

2.定义readfile类,实现去除文章中标点符号的功能。

技术分享

技术分享

3.定义一个getstr类,对结果输出格式进行定义。

技术分享

4.构造程序主函数。

技术分享

 

测试用例:

测试用例我选择了马丁.路德.金的演讲稿。

技术分享

 

部分测试结果如图所示:

技术分享

 

我也看了杨老师对其他同学提出的要求,例如试着跑一跑《战争与和平》这本英语书籍,可能是由于字码数过大,没有运行处结果。

技术分享

以上是我的程序的展示,不足之处请老师给予批注,谢谢老师。

以上是关于Python语音实现词频统计的主要内容,如果未能解决你的问题,请参考以下文章

经典案例词频统计十种实现方式

用Python统计词频

Python数据挖掘-词频统计-实现

Python 词频统计

如何用python和jieba分词,统计词频?

Python 分词后词频统计