一个完整的大作业
Posted 27--何卓霖
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个完整的大作业相关的知识,希望对你有一定的参考价值。
1.选取一个自己感兴趣的主题,我选取了搜狐新闻
网站:http://news.sohu.com/
2.网络上爬取相关的数据,并输出结果
import requests from bs4 import BeautifulSoup url = \'http://news.sohu.com/\' res = requests.get(url) res.encoding = \'UTF-8\' soup = BeautifulSoup(res.text, \'html.parser\') for news in soup.select(\'.list16\'): li = news.select(\'li\') if len(li) > 0: title = li[0].text href = li[0].select(\'a\')[0][\'href\'] print(title, href)
3.进行文本分析,生成词云。
import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt text =open("D:\\\\cc.txt",\'r\',encoding=\'utf-8\').read() print(text) wordlist = jieba.cut(text,cut_all=True) wl_split = "/".join(wordlist) mywc = WordCloud().generate(text) plt.imshow(mywc) plt.axis("off") plt.show()
4.结果
以上是关于一个完整的大作业的主要内容,如果未能解决你的问题,请参考以下文章