JupyterNotebook 最好的测评方式,自然是用它去采集 acfun 弹幕网|Python技能树测评

Posted 梦想橡皮擦

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JupyterNotebook 最好的测评方式,自然是用它去采集 acfun 弹幕网|Python技能树测评相关的知识,希望对你有一定的参考价值。

前几天,橡皮擦已经编写了一篇 csdn jupyternotebook 的入手评测,文章从基本使用出发,让你在最短的时间内,学会 notebook

本次我们要用 notebook 去写一篇博客,从实操中带你理解 notebook 的妙处。

入手教程:弹窗中的彩蛋!一款在线开发工具 JupyterNotebook,一篇博客就会用

在上文中的评论区,csdn lab notebook 团队在评论区给了一个 jupyter 的新入口,本次测评就从这个入口开始。


codechina 上创建任意项目,然后进入项目首页,点击下图所示的 Web IDE 菜单,选择 Notebook

与此同时关注下橡皮擦的 python 爬虫 120 例

如果你不想创建项目,想要直接访问,也是可以的,记住右侧地址即可 https://jupyter.csdn.net/ 进入。

使用 jupyternotebook 写一篇实实在在的博客

创建博客
点击启动页的 Python3,创建新笔记本,CSDN Jupyter Test 是新创建的目录,后续在该目录创建文件,如果你安装了官方提供的插件,那笔记保存之后会自动同步到 codechina 中去,非常方便。

文件名可以自定义,例如: acfun 弹幕网评论采集

分析目标站点

在新建的 笔记 中,新增一个单元(Cell),然后将单元类型切换为 Markdown,可以在命令模式下使用快捷键 M,或者手动切换类型。

一边使用 Markdown 格式进行笔记编写,一边进行 Python 代码编写,实际效果如下所示:

编写完毕,按下键盘上的 Ctrl+Enter 即可运行该单元,Shift+Enter 会运行该单元并创建一个新单元。

请求第 1 页数据

在新创建的单元中进行代码的编写,由于 CSDN 为我们贴心的安装好了 requests 模块,所以直接编码即可。

编写过程中可以随时按下快捷键 Ctrl+Enter,测试代码是否正常,如有错误出现,notebook 非常贴心的进行了提示。

修改异常位置代码,再次运行之后,异常消失,获取到的网络响应数据,出现在单元下方。

接下来优化代码,获取目标评论数据,修改代码如下图所示:

编码过程中,可以随时按下键盘上的 Tab,补齐代码。

采集全部评论

接下来的一步是扩展代码,实现对 所有评论数据 的采集,因目标评论数据存在 5 页,顾使用循环采集即可。

编写目标数据保存代码,本案例直接保存数据到 代码运行文件 目录,文件命名为 comment.txt,完整代码如下所示。

代码运行完毕,数据文件出现在指定位置,点击即可打开该文件。

总结部分

代码写完,在笔记中留下总结与扩展,一篇博客就完成啦。

这里需要注意下,在 markdown 类型的单元中想要实现换行,需要在每个段落后面手动输入 2 个空格。

没有空格,默认一个段落,增加两个空格,自动折行。

其它说明

分享链接

在文件上右键,【复制分享链接】,尝试将自己编写的笔记分享给别人,例如 本篇博客,你可以测试一下是否可以查阅(需要有 CSDN 任意会员,才可访问 JupyterNotebook )。

使用经典模式
如果你觉得上述过程中的视图模式,与你本地常用的 jupyter 不一致,可以手动切换为经典模式,设置方式如下图所示。

导出 markdown 格式笔记

如果你希望笔记以 markdown 格式保存到本地,在文件菜单中直接导出即可。

写在后面

以上内容就是本文的全部内容,希望对学习路上的你有所帮助~

今天是持续写作的第 233 / 365 天。
期待 关注点赞评论收藏

以上是关于JupyterNotebook 最好的测评方式,自然是用它去采集 acfun 弹幕网|Python技能树测评的主要内容,如果未能解决你的问题,请参考以下文章

弹窗中的彩蛋!一款在线开发工具 JupyterNotebook,一篇博客就会用|Python技能树测评

等级保护测评中用什么漏洞扫描工具最好?

三类6种地图可视化软件测评,最好用的工具居然是它

关于CCR测评器的自定义校验器(Special Judge)

鲁大师电动车智能化测评报告第十九期:电自旗舰大乱斗,九号突围成功

鲁大师电动车智能化测评报告第十九期:电自旗舰大乱斗,九号突围成功