把知乎上关于美腿的问题爬了一遍,然后用flask做可视化

Posted python教程入门到实战

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了把知乎上关于美腿的问题爬了一遍,然后用flask做可视化相关的知识,希望对你有一定的参考价值。

关于怎么爬美腿的问题,这里不展开。我把关于美腿/身材等某个回答数量多的问题,进行了答案文本的爬虫,然后在对每一个答案进行正则,最后得出的csv文本是这样:


3486条数据,但是有重复数据,因此需要选取全部偶数的图片或者奇数的图片。

实现的思路

Flask进行展示,然后用瀑布流插件,关于瀑布流插件,真是让我找了好几天,费尽心思才终于找到一个我会用的,真是蛋疼。先看看成型效果:


只截图一部分,只要鼠标下滑,就能不断加载。后端的代码,有部分是这样,pic,df等变量是views.py文件的全局变量,方便getimages方法读取。getimages方法是被前端的ajax调用,每次返回20张图,x这里是计算出图片列表长度,比如列表长度是3888,那么最大的20倍数,可能在3880?防止超过索引的(这里没有进行严格验证)。

df = pd.read_csv('丝袜图地址.csv')data = df['img'].tolist()pic = []for i in range(0, len(data), 2): pic.append(data[i])

@waterfall_bp.route('/images', methods=["GET"])def get_images(): offset = request.args.get('index', 0, type=int) per_page = 20 if offset % 20 != 0: return jsonify({'data': 'error'}) x = len(pic) / 20 * 20 if offset == x: return jsonify({'data': data[offset:]}) res = pic[offset:per_page+offset] return jsonify({'data' : res})


更多的详细代码,可以回复:黑丝,获取flask可视化的demo。


以上是关于把知乎上关于美腿的问题爬了一遍,然后用flask做可视化的主要内容,如果未能解决你的问题,请参考以下文章

知乎上的关于作用域的捆绑问题

Python:晚上把附近的足浴店都给爬了一遍,好兄弟针不戳!

知乎上关于数据分析和数据挖掘帖子的收藏~

知乎上这个程序员火了,竟是因为给老板修了一 次U盘...

关于51CTO学院页面不显示图片的问题

知乎用户群分析--又双叒叕一只爬虫爬了知乎20万用户