小技巧:如何突破某些网站只能登陆后才能进行文字拷贝的限制

Posted qianduanwriter

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了小技巧:如何突破某些网站只能登陆后才能进行文字拷贝的限制相关的知识,希望对你有一定的参考价值。

我写公众号文章时,经常需要从一些网站的文章上查阅一些资料。比如我想把这个网页上的一个标题“SAP Fiori 2.0用户体验设计概念获红点大奖”进行拷贝。

技术图片

然而当我按了键盘上的拷贝快捷键Ctrl C后,却收到这个提示,告诉我只有登陆后才能够进行复制操作。

技术图片

可是为了登陆我得先注册,有点麻烦。如果赶时间的话,可以使用这篇文章的小技巧,达到不用先注册再登陆,也能任意拷贝网页文字的效果。

下面是详细步骤。

1. 和往常一样打开您想复制文字的网页,先不忙按Ctrl C。按F12打开Chrome浏览器的开发者工具。

切换到Network标签页。为了避免干扰,先点Clear按钮把Network标签页下的网络请求全部清除掉。最后如下图所示:

技术图片

2. 和往常一样,点击复制的快捷键Ctrl C。此时看到了意料之中的登陆框。然而我们关心的是:到底是哪一行javascript代码触发了这个登陆框?

从Chrome开发者工具的Network标签页里,我们找到了答案。

首先在Network标签页里我们找到了登录对话框的实现文件artlogin.html。接着,把鼠标放到下图标注了“2”的VN1134:1,Chrome开发者工具就会自动在一个悬浮窗口里显示出到底是哪一行JavaScript产生了artlogin.html的加载。答案就是标注了“3”的几个函数。这几个函数是以调用栈的方式显示的。

最底层的调用栈里的函数是DisplayPageinfo.document.body.oncopy。做过前端开发的朋友们只要看到这个oncopy,心中就有数了:这就是该网站处理用户按了Ctrl+C进行文字拷贝的处理函数,oncopy又会调用copyArt函数。

技术图片

现在我们就进入copyArt函数一探究竟。果然,下图第3961行试图读取用户对于当前网站的cookie信息。如果cookie为空,那么进入第3962行if语句的第一个分支:第3970行的$("#LayerLogin").load("/artlogin.html")负责的正是登陆对话框的加载。

技术图片

讲到这里,解决方案已经很清楚了:在执行第3962行代码判断网站cookie之前,我们随便给变量CurUserNameCookiescgcg赋上一些内容,让它的值不为空,确保进入IF的ELSE分支就行了。

如下图,在Chrome开发者工具的Console标签页里给Cookie变量赋值:

技术图片

于是进入了我们期望的ELSE分支,此时,我在网页上选中的文本“SAP Fiori 2.0用户体验设计概念获红点大奖”已经成功写入JavaScript变量selhtml中,请大家看代码第3986行。

技术图片

直接点Chrome开发者工具的"Continue"按钮结束调试,打开记事本按粘贴的快捷键Ctrl+V,成功了。

技术图片

技术图片

要获取更多Jerry的原创技术文章,请关注公众号"汪子熙"或者扫描下面二维码:
技术图片

技术图片


以上是关于小技巧:如何突破某些网站只能登陆后才能进行文字拷贝的限制的主要内容,如果未能解决你的问题,请参考以下文章

用Visual Studio .Net开发的一个小网站,怎么在局域网中发布呢?

爬虫小技巧

postman 中的小技巧

Python爬虫之cookie的获取保存和使用新手必学

将图片局部文字提取出来的小技巧

SpringBoot | 番外:使用小技巧合集