作业8

Posted 曾志伟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了作业8相关的知识,希望对你有一定的参考价值。

 

1.下载一中文长篇小说,并转换成UTF-8编码。

2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。

3.排除一些无意义词、合并同一词。

import jieba

txt=open(\'kobe.txt\',\'r\',encoding=\'UTF-8\').read()
 
for in \',。!?:“”……()\':
    txt=txt.replace(i,\'\')
words=list(jieba.cut(txt))
 
dic={}
for in words:
    if len(i)==1:
        continue
    else:
        dic[i]=dic.get(i,0)+1
 
wc=list(dic.items())
wc.sort(key=lambda x:x[1],reverse=True)
#print(a)
 
for in range(20):
    print(wc[i])

 

以上是关于作业8的主要内容,如果未能解决你的问题,请参考以下文章

HTML5期末大作业:餐饮美食网站设计——咖啡(10页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 咖啡网页设计 美食餐饮网页设计...(代码片段

201521123089 《Java程序设计》第8周学习总结

Xcode 8 Autocomplete Broken - 仅显示有限的用户代码片段 - 知道为啥吗?

201621123062《java程序设计》第九周作业总结

ES7-Es8 js代码片段

有没有办法将2个非常相似的代码片段组合成一个函数并重复?