⚡一文告诉你蓬莱阁到底如何⚡

Posted 2021-09-24 小董同学啊

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了⚡一文告诉你蓬莱阁到底如何⚡相关的知识，希望对你有一定的参考价值。

⚡一文告诉你蓬莱阁到底如何⚡

一、前言
二、环境准备
三、具体实现
四、最后

完成目标：
获取评论并制作词云

一、前言

毕竟会在烟台待上三年，先了解了解烟台这个地方。

二、环境准备

编辑器：pycharm

用到的库：requests、wordcloud、jieba

三、具体实现

1、短评游客评论并保存

爬取去哪儿网关于蓬莱岛的游客评论的前20页

def save_comment():
    fp = open("comment.txt", mode="w", encoding="utf-8")
    for num in range(1, 20):
        url = 'https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=' + str(
            num) + '&page=' + str(num) + '&pageSize=10&tagType=0'
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38',
            "accept": "application/json, text/javascript, */*; q=0.01",
        }
        response = requests.get(url=url, headers=headers)
        try:
            commentList = response.json()['data']['commentList']
            for comment in commentList:
                # content.append()
                fp.write(comment['content'] + "\\n")
        except Exception as e:
            pass
    fp.close()

2、词云制作

读取评论并制作词云

def stopwordslist(): # 停用词列表
    stopwords = [line.strip() for line in open('Chinesestopword.txt', encoding='UTF-8').readlines()]
    return stopwords

def get_wcd():
    fp = open("comment.txt", "r", encoding="utf-8")
    data = fp.read()
    stopwords=stopwordslist()
    data_list = jieba.lcut(data)
    data_list = " ".join(data_list)
    outstr = ''
    
    for word in data_list:
        if word not in stopwords:
            if word != '\\t':
                outstr += word
                outstr += " "
                
    wcd = wordcloud.WordCloud(
        font_path="simkai.ttf"
        , colormap="brg"
        , width=800
        , height=400
        , max_words=200
        , background_color="white"
        , scale=16
    ).generate(outstr)
    
    wcd.to_file('comment.jpg')

3、成果

四、最后

还是不错滴，有机会去~~~

以上是关于⚡一文告诉你蓬莱阁到底如何⚡的主要内容，如果未能解决你的问题，请参考以下文章

程序人生 - 一文告诉你，爬虫技术到底违不违法，怎么用才合法？

一文告诉你游戏服务器的架构到底是什么样，各服务器的职责是什么

超详细！一文告诉你 SparkStreaming 如何整合 Kafka ！附代码可实践

一文告诉你Linux如何配置KVM虚拟化--安装篇