arxiv 论文 快速下载
Posted jngwl
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了arxiv 论文 快速下载相关的知识,希望对你有一定的参考价值。
简单的说,就是 通过 chrome 插件将 arxiv 的链接自动重定向到中国镜像网站http://cn.arxiv.org
背景
arxiv (https://arxiv.org/)是一个收集计算机科学、物理学、数学和生物学等多个学科的论文预印本网站,主站点在康奈尔大学,在全球多个地方设置有镜像网站。
对于深度学习专业,可以说绝大多数论文都是从 arxiv 上获取的,因此能够快速的访问 arxiv 非常重要。
由于国内多方面原因导致经常直接访问速度比较慢,因此可以通过使用在中国区的镜像站点(http://cn.arxiv.org ,由中科院理论物理所支持)来加速。但是通常在其他地方查询到 arxiv 链接,如果每次手动修改网址比较麻烦。因此这里推荐采用以下方法来解决。
解决方案
chrome 插件 tampermonkey(油猴插件) 是一款功能强大的脚本插件,可以通过脚本对浏览器上网页进行修改编辑等,更多介绍可以参考 https://zhuanlan.zhihu.com/p/28869740
因此,这里我们使用该插件对网页中的arxiv 链接进行重定向到 cn.arxiv.org
- 安装chrome 浏览器。推荐使用google chrome官方下载地址 ;如果无法访问,使用百度下载也可以。
- 安装tempermonkey插件,推荐使用 chrome webstore 官方网址;如果无法下载,在 crx4chrome 网站搜索并下载也可以,这里给出crx4chrome网站上tampermonkey插件的下载链接。
- 添加 arxiv 重定向脚本。
代码更新时间2017年12年04日,自动转到pdf链接。代码需要全部复制粘贴,部分看似注释的代码也有用处,代码如下
1 // ==UserScript== 2 // @name Redirect arxiv.org to CN.arxiv.org/pdf 3 // @namespace uso2usom 4 // @description On any web page it will check if the clicked links goes to arxiv.org. If so, the link will be rewritten to point to cn.arxiv.org 5 // @include http://*.* 6 // @include https://*.* 7 // @version 1.2 8 // @grant none 9 // ==/UserScript== 10 11 // This is a slightly brute force solution, but there is no other way to do it using only a userscript. 12 13 // Release Notes 14 15 // version 1.2 16 // Focus on pdf link only! 17 // Add ‘.pdf‘ link automatically. Convenient for saving as pdf. 18 19 // version 1.1 20 // Redirect arxiv.org to CN.arxiv.org 21 22 document.body.addEventListener(‘mousedown‘, function(e){ 23 var targ = e.target || e.srcElement; 24 if ( targ && targ.href && targ.href.match(/https?://arxiv.org/pdf/) ) { 25 targ.href = targ.href.replace(/https?://arxiv.org/, ‘http://cn.arxiv.org‘); 26 } 27 if ( targ && targ.href && targ.href.match(/http?://arxiv.org/pdf/) ) { 28 targ.href = targ.href.replace(/http?://arxiv.org/, ‘http://cn.arxiv.org‘); 29 } 30 if ( targ && targ.href && targ.href.match(/https?://arxiv.org/abs/) ) { 31 targ.href = targ.href.replace(/https?://arxiv.org/abs/, ‘http://cn.arxiv.org/pdf‘); 32 } 33 if ( targ && targ.href && targ.href.match(/http?://arxiv.org/abs/) ) { 34 targ.href = targ.href.replace(/http?://arxiv.org/abs/, ‘http://cn.arxiv.org/pdf‘); 35 } 36 if (targ && targ.href && targ.href.match(/http?://cn.arxiv.org/pdf/) && !targ.href.match(/.pdf/) ) 37 { 38 targ.href = targ.href + ‘.pdf‘; 39 } 40 });
4.测试配置是否成功,下面是arxiv上的一篇文章作为示例,点击看网址前面是否已经加上“cn.”前缀,点击pdf测试速度。该文章共57页,之后可以手动去掉“cn.”前缀对比速度。
NIPS 2016 Tutorial: Generative Adversarial Networks 测试时间:2018.12.6
5.说明
由于 http://cn.arxiv.org 并不是主站点,是 arxiv 在中国区的镜像,因此更新有大约半天的延迟,对于当天提交的文章,可能更新不及时。对于当天文章可以手动删除“cn.”前缀解决。
如果出现 pdf 正在自动从源文件生成等提示,为正常现象,稍后即可获取pdf论文。
转载自简书作者德谟赛斯 https://www.jianshu.com/p/184799230f20
以上是关于arxiv 论文 快速下载的主要内容,如果未能解决你的问题,请参考以下文章
论文阅读(Weilin Huang——arXiv2016Accurate Text Localization in Natural Image with Cascaded Convolutiona