arxiv 论文 快速下载

Posted jngwl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了arxiv 论文 快速下载相关的知识,希望对你有一定的参考价值。

简单的说,就是 通过 chrome 插件将 arxiv 的链接自动重定向到中国镜像网站http://cn.arxiv.org

背景

arxiv (https://arxiv.org/)是一个收集计算机科学、物理学、数学和生物学等多个学科的论文预印本网站,主站点在康奈尔大学,在全球多个地方设置有镜像网站。
对于深度学习专业,可以说绝大多数论文都是从 arxiv 上获取的,因此能够快速的访问 arxiv 非常重要。
由于国内多方面原因导致经常直接访问速度比较慢,因此可以通过使用在中国区的镜像站点(http://cn.arxiv.org ,由中科院理论物理所支持)来加速。但是通常在其他地方查询到 arxiv 链接,如果每次手动修改网址比较麻烦。因此这里推荐采用以下方法来解决。

解决方案

chrome 插件 tampermonkey(油猴插件) 是一款功能强大的脚本插件,可以通过脚本对浏览器上网页进行修改编辑等,更多介绍可以参考 https://zhuanlan.zhihu.com/p/28869740
因此,这里我们使用该插件对网页中的arxiv 链接进行重定向到 cn.arxiv.org

  1. 安装chrome 浏览器。推荐使用google chrome官方下载地址 ;如果无法访问,使用百度下载也可以。
  2. 安装tempermonkey插件,推荐使用 chrome webstore 官方网址;如果无法下载,在 crx4chrome 网站搜索并下载也可以,这里给出crx4chrome网站上tampermonkey插件的下载链接
  3. 添加 arxiv 重定向脚本。
    代码更新时间2017年12年04日,自动转到pdf链接。代码需要全部复制粘贴,部分看似注释的代码也有用处,代码如下
 1 // ==UserScript==
 2 // @name        Redirect arxiv.org to CN.arxiv.org/pdf
 3 // @namespace   uso2usom
 4 // @description On any web page it will check if the clicked links goes to arxiv.org. If so, the link will be rewritten to point to cn.arxiv.org
 5 // @include     http://*.*
 6 // @include     https://*.*
 7 // @version     1.2
 8 // @grant       none
 9 // ==/UserScript==
10 
11 // This is a slightly brute force solution, but there is no other way to do it using only a userscript.
12 
13 // Release Notes
14 
15 // version 1.2
16 // Focus on pdf link only!
17 // Add ‘.pdf‘ link  automatically. Convenient for saving as pdf.
18 
19 // version 1.1
20 // Redirect arxiv.org to CN.arxiv.org
21 
22 document.body.addEventListener(‘mousedown‘, function(e){
23     var targ = e.target || e.srcElement;
24     if ( targ && targ.href && targ.href.match(/https?://arxiv.org/pdf/) ) {
25         targ.href = targ.href.replace(/https?://arxiv.org/, ‘http://cn.arxiv.org‘);
26     }
27     if ( targ && targ.href && targ.href.match(/http?://arxiv.org/pdf/) ) {
28         targ.href = targ.href.replace(/http?://arxiv.org/, ‘http://cn.arxiv.org‘);
29     }
30     if ( targ && targ.href && targ.href.match(/https?://arxiv.org/abs/) ) {
31         targ.href = targ.href.replace(/https?://arxiv.org/abs/, ‘http://cn.arxiv.org/pdf‘);
32     }
33     if ( targ && targ.href && targ.href.match(/http?://arxiv.org/abs/) ) {
34         targ.href = targ.href.replace(/http?://arxiv.org/abs/, ‘http://cn.arxiv.org/pdf‘);
35     }
36     if (targ && targ.href && targ.href.match(/http?://cn.arxiv.org/pdf/) && !targ.href.match(/.pdf/) )
37     {
38        targ.href = targ.href + ‘.pdf‘;
39     }
40 });

 

  4.测试配置是否成功,下面是arxiv上的一篇文章作为示例,点击看网址前面是否已经加上“cn.”前缀,点击pdf测试速度。该文章共57页,之后可以手动去掉“cn.”前缀对比速度。
   NIPS 2016 Tutorial: Generative Adversarial Networks   测试时间:2018.12.6

  5.说明
     由于 http://cn.arxiv.org 并不是主站点,是 arxiv 在中国区的镜像,因此更新有大约半天的延迟,对于当天提交的文章,可能更新不及时。对于当天文章可以手动删除“cn.”前缀解决。
     如果出现 pdf 正在自动从源文件生成等提示,为正常现象,稍后即可获取pdf论文。

     

 转载自简书作者德谟赛斯 https://www.jianshu.com/p/184799230f20 








以上是关于arxiv 论文 快速下载的主要内容,如果未能解决你的问题,请参考以下文章

论文阅读(Weilin Huang——arXiv2016Accurate Text Localization in Natural Image with Cascaded Convolutiona

论文|LINE算法原理代码实战和应用

论文|LINE算法原理代码实战和应用

论文|LINE算法原理代码实战和应用

论文|LINE算法原理代码实战和应用

论文上附有的 arXiv 是干嘛的