影评推荐系统
Posted foremostxl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了影评推荐系统相关的知识,希望对你有一定的参考价值。
1、创建django
创建文件夹保存文件:
mkdir 文件夹
cd 文件夹
django-admin startproject 项目名称
在项目下创建应用
影评数据采用爬虫知识,使用scrapy库从bing搜索引擎采取和抽取
1、爬取数据
必应(英语:Bing,台港称Bing)是一款由微软公司推出的网络搜索引擎。
简短几十行代码之后你已经能够开始抓取一部电影的全部短评和评分了。在这之前,记得在settings里加一个DOWNLOAD_DELAY = 2,不然的话爬不到一半就会被豆瓣给禁了。
我们的应用(spider文件夹)使用两个蜘蛛:
一只从影评URL抽取数据(movice_link_results.py)
另外一只生成所有链接到初始影评URL的网页连接图(recursive_link_results.py)
将爬取到的数据保存到Django model PageItem中
以上是关于影评推荐系统的主要内容,如果未能解决你的问题,请参考以下文章