作业8
Posted 曾志伟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了作业8相关的知识,希望对你有一定的参考价值。
1.下载一中文长篇小说,并转换成UTF-8编码。
2.使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。
3.排除一些无意义词、合并同一词。
import
jieba
txt
=
open
(
\'kobe.txt\'
,
\'r\'
,encoding
=
\'UTF-8\'
).read()
for
i
in
\',。!?:“”……()\'
:
txt
=
txt.replace(i,\'\')
words
=
list
(jieba.cut(txt))
dic
=
{}
for
i
in
words:
if
len
(i)
=
=
1
:
continue
else
:
dic[i]
=
dic.get(i,
0
)
+
1
wc
=
list
(dic.items())
wc.sort(key
=
lambda
x:x[
1
],reverse
=
True
)
#print(a)
for
i
in
range
(
20
):
print
(wc[i])
![](https://image.cha138.com/20210607/5ec5ea55ab6a491493ea988bd6b19218.jpg)
以上是关于作业8的主要内容,如果未能解决你的问题,请参考以下文章
HTML5期末大作业:餐饮美食网站设计——咖啡(10页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 咖啡网页设计 美食餐饮网页设计...(代码片段
201521123089 《Java程序设计》第8周学习总结