观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?

Posted 数据法律观察

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?相关的知识,希望对你有一定的参考价值。

九月份以来,国内大数据公司接连被查的新闻报道不绝于“眼”,各种关于被查原因的揣测中——“爬虫违法违规”甚嚣尘上。风声鹤唳之下,诸多不可避免需使用爬虫技术的企业似乎都有点谈“爬”色变。许多行业内人员认为,目前国内的大数据行业正在遭遇一轮前所未有的“清洗”,主动选择关停爬虫业务、考虑转型或许已是最好的出路。

 两周来我们也频繁接到涉及爬虫业务的公司咨询,感受到相关企业和从业人员的焦躁不安,其中最多被问到的是“爬虫是不是不能做了?”以及“爬虫的法律风险是什么?”就此,我们结合既往工作经验与行业内爬虫业务现状写下本篇文章,以期能解答一些疑问,宽慰一些不安。

观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?

行业“清洗”是否与爬虫有关?


确实与爬虫有关。

首先,我们根据公开的新闻报道梳理了被查的大数据企业/被要求协助调查的企业的相关信息如下:

观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?

此外,根据有关媒体报道,因与上述企业可能有业务关联,天翼征信的高级管理人员和业务人员被公安部门要求协助调查;另有消息表明,聚信立在内的多家大数据企业宣布停止爬虫业务、开展自查自纠。【4】


网络爬虫技术作为帮助企业获取网络数据信息的基础性工具发挥着关键作用,三家企业的主营业务都依赖于“数据采集”,停掉爬虫业务就相当于釜底抽薪,断送了一些企业的数据源。


爬虫是大数据企业被查的核心原因吗?

大数据企业接连被查,确与爬虫有关,但并非这些企业被查的核心原因。


通过上述梳理不难发现,除都依赖于爬虫技术外,三家企业还存在两个相同点:第一,这三家企业在业务方面都涉及向有贷款业务的机构提供风险控制服务。这类有贷款业务的机构主要包括银行、消费金融机构、小额贷款和现金贷公司,这类机构在进行放款时必须要做的就是对借款人的还款能力进行综合评估。第二,这三家企业本身不对外提供贷款业务,自身没有用户群体可以产生数据,对所服务的贷款业务机构所提供的用户授权高度依赖。

观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?

(图片来源于网络)

一个企业自身无法获取数据(业内称“第三方数据企业”),却能使用爬虫技术提供数据风控服务,怎么想都觉得和爬虫脱不了干系。但仔细研究会发现,并非是爬虫的“锅”。举例来说,A(有贷款业务的公司)委托B(大数据公司)对甲(借款人)的还款能力进行评估。如果A对B授权,且甲授权A和B获取其数据信息,那么B借助爬虫技术获取甲的数据信息并将其用于且仅用于提供给A的风控服务是有法可循的。但如果B服务了足够多的像A一样的贷款业务公司,获取了足够多的像甲一样的数据信息,却将这些数据自己留存,就有可能形成自己的“数据池”,进行像媒体报道的那样“一毛一条”的支付宝、微信消费记录等数据买卖或其他违法犯罪行为。

当然,如果B在没有获得A和甲授权的情况下,使用技术手段强行获取数据信息,也属于我国刑法规制的犯罪行为。在媒体的各种报道中也能寻到一些端倪,一些大数据企业很可能存在着违法违规收集使用个人信息、侵犯公民个人信息罪、非法获取计算机信息系统数据罪的行为。


爬取已合法公开的个人信息有问题吗?


第三方数据企业除依靠委托方和委托方客户的授权获取用户数据以外,往往还会爬取已公开的个人信息,这也涉及到业内非常关注的问题——在公民个人信息已经合法公开的情况下,利用爬虫技术对其进行抓取是否构成侵犯公民个人信息?


目前生效的法律法规都未明确回应上述问题,但根据《民法典人格权编》(草案二次审议稿,“《草案》”),使用已合法公开的公民个人信息,行为人不承担责任——《草案》第八百一十六条,行为人使用自然人自行公开的或者其他已合法公开的信息不承担民事责任,但是使用该信息侵害该自然人重大利益或者自然人明确拒绝他人使用的除外。


此外在近期司法实践中的两起相关案例或许能给我们一些启示。

案例一

在广东省深圳市中院发回重审的侵犯公民个人信息罪的案件(本案相关裁判文书尚未公开)中,罗湖区法院认为李某贩卖个人信息70万余条构成侵犯公民个人信息罪,深圳中院则认为企业根据法律法规规定或为经营所需而公开的企业信息(即使包含个人姓名、联系方式)不属于刑法意义上的公民个人信息,因此以事实不清、适用法律错误为由撤销原判,发回重审。

案例二


虽然《草案》和上述案例已表明了一些立法趋势和司法态度,但我们更期待立法或司法解释能进一步给出明确回应,以应对爬虫技术广泛应用之下这类不可避免的矛盾和问题。


爬虫的红线一直都在

合法合规是企业安身立命的根本


《一本财经》“在《大量数据公司被抓,几十家被列入调查名单:“这只是前戏”》一文中提到“现在最可怕的点就是,不知道风险从哪里来,哪条业务会踩了红线,也不知道红线在哪里”。整个大数据行业就如同黑暗森林,不知道猎人的子弹从哪里射过来。”但实际上,爬虫乃至整个大数据行业的红线一直悬挂在那里,但总有些“作死的人”想去触碰它甚至妄图越过它。关于网络爬虫行为存在的法律风险,数据法律观察团队也曾撰写了相关文章(、)进行介绍,在该系列文章中我们也对企业合法合规使用爬虫技术提供了一系列建议,有兴趣以及想“守住网络爬虫红线”的读者可作参考。

实际上,监管机关打击侵犯公民个人信息、非法获取数据类违法犯罪行为的步伐从未停止,并且随着《网络安全法》、《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》和《最高人民法院最高人民检察院关于办理危害计算机信息系统安全刑事案件应用法律若干问题的解释》的颁布和生效,对相关犯罪的打击力度逐渐加大,截取几个大案来说:2017年上市公司数据堂员工侵犯公民个人信息案;2018年8月瑞智华胜涉嫌窃取个人信息30亿条;2018年10月巧达数据非法获取计算机信息系统数据案;2019年“315”曝光声牙科技使用WIFI探针盒子违法收集个人信息……将近期发生所谓行业“清洗”事件置入监管机关保护公民个人信息的一系列行动中来看,就显得“稀松平常”了。进一步,也许这些大数据企业早就自知行为的违法违规却不能自查自纠、仍然抱着侥幸心理,这才走到了“人人自危”的境地。


如果将爬虫技术比作一个江湖武功秘籍,那么很多时候错的并非武功秘籍,而是习武之人。本次监管机关的“清洗”行动,醉翁之意不在其他,只在那些将爬虫技术错误运用的人和事。这次是信贷行业中提供风控服务的第三方数据企业,那么下次会是谁呢?


讲座分享

主题:网络爬虫行为典型法律风险及案例全解析


主办方:本团队与首席数据官联盟、中国首席法务官研究院及法律科技实验室联合举办


背景信息:近期大数据行业发生的众多事件都和一个词关联起来--“网络爬虫”。在期望包容创新的同时,面临着如此监管风暴,还有多少从业者依然坚信“技术中立”,到底是爬虫错了,还是使用爬虫的我们错了?让我们冷静地从法律角度分析,消除行业的恐慌和疑惑。


场次一:深圳 国际金融科技城 2019年10月14日

报名链接:

报名二维码:

观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?


场次二:北京 五道口东升大厦 2019年10月16日

报名二维码:


观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?

文章仅为我们对相关法律、法规及政策的一般解读,不能作为正式法律意见和建议,如果您有特定的问题,请通过邮箱联系咨询事宜。

【1】报道来源:

https://mp.weixin.qq.com/s/BWzayL-ZpKqR3RAA8n5DzQ

【2】 同上

【3】 报道来源:

https://mp.weixin.qq.com/s/Mh09Qf--svNSXCCZyD5Yxw

报道来源:

https://mp.weixin.qq.com/s/vRYs4ULasxbfC-83ZbmeTQ

【4】报道来源:

https://mp.weixin.qq.com/s/DXqXM4ccilNLkxq3OtqU0w



以上是关于观察原创 | 大数据公司接连被查,爬虫技术该不该背锅?的主要内容,如果未能解决你的问题,请参考以下文章

黄韬|规制网络爬虫技术的政策目标

近期多个大数据公司被查 爬虫技术使用须谨慎

网络爬虫技术滥用被查 消费金融风控面临再造

爬虫技术公司被查引行业反思 消费金融平台风控再造 跨境支付反洗钱核查面临新命题

又一家数据公司被查,爬虫到底做错了什么?

51信用卡被查引发“爬虫技术”争议 是否侵犯个人信息?