原创互联网爬虫技术构罪辨析
Posted 互联网法学
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了原创互联网爬虫技术构罪辨析相关的知识,希望对你有一定的参考价值。
本文作者
李上
本文系浙江大学
《互联网与法学》课程成果
【摘要】互联网爬虫技术作为一种高效信息处理程序,在现实生活中被广泛应用于非法获取数据的犯罪活动中。但“技术本身无罪”,并非所有的爬虫手段都应被规制。本文从司法实践出发,对比论证数据的公开程度对爬虫手段入罪的影响,并结合爬取对象的存储方式与被爬取信息的使用目的,来综合确立爬虫技术的入罪界限。
【关键词】爬虫技术 构罪标准 爬取对象 公开数据
一、互联网新型技术手段引发的法律新审视
不同于上世纪末出现的“新型计算机犯罪”,惩治重点在于通过互联网等计算机技术实施传统侵犯财产型犯罪,[①]实质上没有跳脱出传统刑法保护法益范围,互联网只是作为犯罪活动的新手段与工具;此后网络的普及与日益发达的互联网交易,使得法律不得不重新审视计算机系统的保护价值,进一步催生了互联网犯罪的新型法益———数据安全,其内涵包括了数据利用的三个面向:数据的保密性,即免受未授权人获悉;数据的完整性,即免受无权篡改;数据的可用性,即权利人可随时无障碍的利用。[②]在《刑法修正案(九)》后,计算机系统以及存储于其中的数据、信息等被纳入刑法保护领域,相关的非法获取、控制、使用或买卖行为都将受到刑法规制。此举亦将传统司法实践的着眼点自然转向更抽象的犯罪客体,现今背景下,信息、资讯、数据等无体物已不可否认地成为具有自身独特性的独立法益客体,数据本身也成为各大互联网企业最重要的资产之一。
于是随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。网络爬虫(web crawler,又被称为网页蜘蛛、网络机器人、网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫技术可以按照被设计的程序自动提取网页有效信息,显然有利于信息的交流和共享,一些网站出于信息公开或经营所需等目的,并不拒绝甚至还欢迎网络爬虫提取网页信息。[③]在大数据时代下,爬虫技术可以被应用于多个场景,它不仅是我们一直依赖的搜索引擎核心组成,而且它的出现直接改变了传统数据工作的繁重模式,大大提升信息处理效率。但在互联网高速发展下,爬虫同样也被用于各类黑灰产业,用以爬取公司商业秘密、互联网平台数据、公民个人信息等等。
二、爬虫技术之构罪界限辨析
爬虫技术作为一种广泛应用的互联网程序,虽然经常被不法分子用于违法犯罪,但这并不意味着法律对爬虫手段持否定性评价。依照我国现行法律与司法实践,爬虫手段的入罪界限主要是依据爬取的对象来确定,可以说爬虫本身不违法,但爬取到的数据对象却可能使爬虫行为成为犯罪活动。
(一)爬取非公开数据——以互联网爬虫“第一案”元光公司案为例
1
案情简介
2
可能产生的构罪竞合
例如非法爬取数据的行为还可能构成侵犯商业秘密罪。商业秘密是指不为公众所知悉,经权利人采取保密措施并能为其带来经济利益的技术信息和经营信息。其中,技术信息又指是指生产方案、设计图纸、产品配方等;而经营信息则是指企业的经营方针、客户名单等。各大互联网企业,如阿里巴巴、微信、京东等平台,存储于其中的用户行为数据、社交数据以及购物清单等数据无疑构成互联网企业最为重要的资产之一。如果这些数据具有实用性且被互联网企业以合理措施予以保密,行为人非法获取这些非公开数据将构成侵犯商业秘密罪。
另外根据《关于办理危害计算机信息系统安全刑事案件应用法律若干问题的解释》第十一条:本解释所称“身份认证信息”,是指用于确认用户在计算机信息系统上操作权限的数据,包括账号、口令、密码、数字证书等。也就是说,在获取这些身份性数据时,可能同时落入侵犯公民个人信息罪的规制范围内。公民个人信息区别于其他信息的主要特性在于其可识别性,可以单独或间接识别到信息主体,而信息与主体的关联程度直接决定了司法保护的程度与范围,因而应对公民个人身份信息与商业性个人信息应当采取宽松不同的保护策略和归罪路径。[⑤]
笔者认为,在非法获取“身份认证信息”此类与信息主体粘性极强的个人信息时,即使属于互联网金融的商业个人信息,也依然应当优先考虑依附其上的人身属性,尤其是在现今互联网金融平台登录账号多与用户身份证号相关联的情况下,应当认定行为人构成侵犯公民个人信息罪。但也有学者认为,在我国刑法中,非法获取数据的行为要么侵害了数据安全,被认定为非法获取计算机信息系统数据罪,要么侵犯了以数据为媒介、工具的传统法益而构成传统犯罪,不可能同时侵犯数据安全新型法益与传统法益,因而也就不存在数个罪名的竞合问题。[⑥]笔者认为,对于非法获取数据行为的罪名竞合问题,诚然应认定特殊法益的优先性,但在数罪之间存在竞合可能时,就要坚持“择一重罪”的认定原则,考虑量刑的均衡性,据以认定具体罪名。
(二)爬取一定范围内公开的数据——以“今日头条”案为例
1
案情简介
被告单位上海晟品网络科技有限公司实际控制人,指示技术人员采用技术手段,使用伪造的设备ID绕过服务器的身份校验,伪造IP 绕过服务器的访问频率限制,连接视频列表、分类视频列表、相关视频及评论3个接口,对今日头条服务器进行数据抓取,并将结果存入到数据库中,最终抓取被害单位北京字节跳动网络技术有限公司(今日头条)服务器中存储的视频数据,造成被害单位损失技术服务费2万元。此案与前述案例不同,虽然都是利用爬虫手段爬取存储在服务器上数据,但本案非法获取的视频参数等属于半公开状态,即针对使用“今日头条”APP的用户公开,只要下载了APP的用户即可免费合法地观看、下载与获取。但被告单位采取伪造的ID与IP将“机器人”伪装成自然人用户,进而获取到被害单位公开数据的授权。最终法院以非法获取计算机信息系统数据罪定罪。[⑦]
2
爬取对象构罪界限再界定
综合上述两个案件评析,共同特征都是爬取了非公开或半公开的数据,但单依此标准作为爬虫入罪判断标准仍然过于单薄,需要在数据公开范围标准下,进一步界定非法获取数据的行为本质。笔者认为,“非法获取数据”核心在于界定该数据是否值得刑法保护,换言之,笔者认为如果单纯以数据的三性,保密性、完整性、可用性作为衡量标准,上述半公开化的数据非法获取行为就难以被包含在计算机犯罪活动中。但如果以该数据的存储方式或使用目的来作为入罪标准就会合理得多,例如爬虫第一案中,公交实时数据作为平台加密存储于服务器上的数据,其存储方式已明显区别于一般、公开的数据,在肯定该数据在商业社会中具有巨大财产价值的前提下,非法突破防火墙获取加密存储数据的行为必然构成犯罪;其次在上述案件中爬取的视频列表、用户评论虽然处于公开可视化的状态,但该数据直接构成“今日头条”APP的核心商业数据,且行为人获取数据的使用目的就是为了盗取他人知识产权成果,提高自身平台的访问量,以此达到不正当竞争的目的,因此在使用目的上可以将其纳入刑法规制范围。
(三)爬取公开数据——以“天风证券”与“前程无忧”纠纷为例
前程无忧和58同城作为人力资源服务型大数据企业,曾经被曝出该平台上超过2亿求职者的简历信息遭泄露,58同城的新闻发言人当时回应称,简历数据不是从58同城的平台上泄露的,而是用户将简历设置为公开可见时,被第三方数据平台利用爬虫软件抓取。但即使是承认用户在对自己的个人信息拥有自决权前提下,爬取公开数据仍然可能构成相关犯罪。最为直接的犯罪行为就是将爬取到的公民个人信息,打包出售给相关推销、贷款公司,用以帮助后者精准分析目标客户,针对性放贷以及设置贷款金额风控,如果行为人对此知道或应当知道的,将直接构成相关犯罪行为的帮助犯。
即使行为人收集的数据客体公开合法,使用过程中也没有出售给第三方或不合理使用,也依然可能“惹祸上身”。以天风证券与前程无忧网发生的纠纷为例,天风证券委托“造数科技”,一家第三方数据公司,从18年4 月到9月,在前程无忧(51job)平台上共爬取了894万个招聘广告,其中一线城市占35%,二线城市占54%。随后天风证券的自有分析师根据爬虫技术爬下来的这894万条招聘广告作出数据分析,最终发布宏观研究报告——《消失的招聘广告——从招聘平台看就业状况》。报告中直接说明了天风证券的宏观分析师经过爬虫数据分析,发现2018年4月到9月在前程无忧平台上共消失了202万个招聘广告,其中二线城市下降的最快,并进一步指出由此表明的就业形势严峻。此报告随后被各大媒体转发,阅读量巨大,甚至引发“裁员恐慌”,就连中央财办都致电前程无忧平台询问是否属实,前程无忧平台直指此报告爬取数据虽为公开,但不能保证分析样本与方法的真实、准确性,给前程无忧造成巨大不利影响。
此次事件中天风证券并没有违法使用爬虫技术,只是将其作为分析报告的蓝本数据获取途径,但如果天风证券在爬取公开数据时合法,进行数据分析时却存在刻意夸大就业严峻等情节,损害前程无忧平台的信用、名誉等社会评价的,可能构成损害商业信誉罪。即使天风证券此次行为未达到刑法规制的层级,在民事上依然可能被前程无忧平台提起名誉权侵权之诉。
三、结语
在大数据时代下,无论是个人的隐私信息,还是企业的商业数据,数据本身的商业价值日益凸显,但更为重要的挑战是如何提升数据安全性。互联网爬虫技术作为一种现代化信息处理手段,在各方面便捷了人类生活,但同时它的高效也为违法犯罪提供了“便利”。“技术本身无罪”,但当爬虫技术被应用于犯罪活动时,就应当纳入刑法规制范围内。因此本文旨在从司法实践出发,对比论证了数据的不同公开程度对爬虫手段入罪的影响,结合爬取对象的保存方式与被爬取的使用目的,来综合确立爬虫手段的入罪界限。希望能帮助互联网企业以及相关技术人员明晰技术手段的构罪标准,进一步规范自身运营。
(图片来源于网络)
(因编辑需要,文中注释均已省略)
主主编编:李世阳,朱佳俐
副a主b编:李 莹,王啸森
来稿请投:zjulaw@aliyun.com
转载须授权
以上是关于原创互联网爬虫技术构罪辨析的主要内容,如果未能解决你的问题,请参考以下文章