K哥爬虫普法微信公众号爬虫构成不正当竞争,爬虫er面对金山,如何避免滥用爬虫?

Posted K哥爬虫

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K哥爬虫普法微信公众号爬虫构成不正当竞争,爬虫er面对金山,如何避免滥用爬虫?相关的知识,希望对你有一定的参考价值。

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

2011年1月微信问世,腾讯公司经过持续投入,构建起包括微信平台、微信个人用户、开放平台、微信支付、小程序等产品功能和服务,构建起包括微信平台、微信个人用户、公众号运营者、第三方服务商等多角色主体共同参与的微信生态系统。为了保障微信生态系统的健康发展,维护包括微信公众平台在内的运营秩序和用户信息安全,保证良好的用户体验,腾讯公司作为平台经营者和管理者,通过在微信公众平台官网(https://mp.weixin.qq.com)设置 robots 协议,禁止任何第三方通过爬虫技术抓取微信公众号平台信息内容及数据,制定并公示了各种微信平台规则对微信公众平台信息内容及数据资源安全进行保护。

被告系“极致了”(www.jzl.com)产品的经营者斯氏(杭州)新媒体科技有限公司,未经腾讯公司许可利用爬虫技术非法抓取微信公众平台信息内容及数据,并对外提供公众号及其文章的搜索、公众号导航及排行、公众号数据抓取、公众号数据分析等微信公众号数据服务。

原告认为,被告的行为系利用非法抓取的微信公众号源网页信息内容和数据,通过简单的统计和分析后对外提供微信公众号数据服务的寄生经营行为,重构了微信公众号的数据评价体系,违背了微信公众平台产品设计逻辑和运营原则,损害了微信平台生态系统的健康,损害了原告的商业利益,具有不正当性。

法院观点

原告腾讯公司和腾讯科技公司系微信公众平台的经营者和管理者,被告斯氏公司是“极致了”网站经营者。原告在微信公众平台官网设置了 robots 协议,禁止任何第三方通过爬虫技术爬取微信公众号平台信息内容及数据,制定并公示了各种微信平台规则对微信公众平台信息内容及数据资源安全进行保护。但“极致了”网站利用爬虫技术,绕开、突破了“微信登录限制”和“IP访问限制”,爬取微信公众平台信息内容及数据,并通过网站对外提供公众号搜索、导航及排行等数据服务。

法院经审理认定,“极致了”网站突破IP访问限制和封禁措施,破坏了微信产品登录访问服务运行,同时“爬虫”行为会对微信服务器造成负担,构成对微信公众号正常运行的妨碍。此外,被控行为也妨碍了微信产品的正常运行机制。“极致了”提供微信公众号及文章搜索、展示等服务,构成了对微信公众号部分数据内容服务的实质性替代,进而损害两原告通过对外授权可获取的合作利益等商业利益,构成不正当竞争。

判决情况

根据《中华人民共和国民法典》第一百二十七条、第一千一百六十七条、《中华人民共和国反不正当竞争法》第二条、第十二条第二款第四项、第十七条、《最高人民法院关于审理不正当竞争民事案件应用法律若干问题的解释》第十七条、《中华人民共和国民事诉讼法》第六十四条第一款之规定,判决如下:

一、被告斯氏(杭州)新媒体科技有限公司立即停止涉案不正当竞争行为,即立即停止非法抓取微信公众号(http://mp.weixin.qq.com)信息内容及数据、停止对外提供微信公众号及其文章搜索、公众号排行及推荐、公众号数据抓取等涉案相关数据服务,并删除已经存储的前述数据;

二、被告斯氏(杭州)新媒体科技有限公司于本判决生效之日起十日内赔偿原告深圳市腾讯计算机系统有限公司、腾讯科技(深圳)有限公司经济损失及为制止不正当竞争行为所支付的合理费用共计60万元;

三、被告斯氏(杭州)新媒体科技有限公司于本判决生效之日起七日内,在极致了网站(www.jzl.com)连续七日刊登声明为原告深圳市腾讯计算机系统有限公司、腾讯科技(深圳)有限公司消除影响(声明内容需经法院审核,逾期不履行,由法院登报公开判决主要内容,登报费用由被告斯氏(杭州)新媒体科技有限公司负担);

关于赔偿数额,两原告主张以被告因侵权行为的获利作为赔偿的依据,一是以每月付费会员收费为计算维度,(2020)厦鹭证内字第102658号公证书载明被控网站截止原告公证时付费用户会员为8197人,付费会员分为三个等级(高级会员为89元每月,豪华会员为149元每月,超级会员为299元每月),仅以每月89元为计算基数,则“极致了”网站每月收取的会员费用为8197人*89元每月=729533元。根据两原告提交的就“极致了”网站对付费会员提供服务情况等进行的公证,即“极致了”网站对网站会员进行收费截止2021年8月至少已经10个月,考虑付费会员可能在不断增长变化的前提下,暂以729533元的50%为基数,“极致了”网站仅仅在10个月就付费会员获利为:729533元每月*50%*10个月=3647665元。此外,综合“极致了”网站实际收费会员制度运行时间远远早于2020年9月,故“极致了”网站实际获利情况远远不止于此。二是以单次监控/采集收集为计算维度,“极致了”网站最低一级的付费会员费用为每月89元,含300次阅读数监控和300次数据回采,即平均每次监控/回采收益约为0.15元。(2020)厦鹭证内字第102658号公证书载明被控网站截止原告公证时“极致了”网站已回采超过6亿公众号文章,即仅数据回采部分获利为6亿*0.15元=9000000元,考虑“极致了”网站还提供阅读数监控等其他服务,“极致了”网站实际获利不止于该金额。综上,原告主张被告赔偿经济损失及合理支出共计300万元。被告抗辩其经营的“极致了”网站获利较少,但未提交客观证据予以证明。

法院注意到如下事实:

1.被告在庭审中自认“极致了”网站于2020年5月上线,其中下线四个月后又重新上线直至2021年8月,被告在明知“极致了”网站涉嫌侵权的情况下仍然重新上线“极致了”网站,说明侵权主观恶意较大;

2.微信在社交产品市场中拥有极高的市场占有率,享有极高的知名度,商业价值十分可观。微信公众号拥有众多用户,具有较高的市场价值,能够给两原告带来可观的市场收益,同时微信公众号能够稳定地吸引海量用户数据,具有较大的数据衍生产品开发空间,能给两原告带来可观的增值利润;

3.被控“极致了”网站通过多个不同网址以及多个公众号进行宣传、服务,每日爬取的公众号及文章数量较大;

4.结合“极致了”网站不同产品、不同服务的报价等情节予以酌情考量其销售利润;

5.被控行为虽然造成了微信用户对微信公众号数据部分流量的流失,两者之间只是具有或然性关联关系;

6.“极致了”网站提供微信公众号文章搜索服务中,点击文章标题查看微信公众号文章内容仍需跳转回微信公众号进行展示;

7.两原告为本案诉讼采取了多次公证证据保全措施,并委托律师参与诉讼,需要支付合理维权费用。

综合考量上述因素,法院酌定被告连带赔偿两原告经济损失及为制止不正当竞争行为所支付的合理费用共计60万元。

判决文书

杭州铁路运输法院(2021)浙8601民初309号民事判决书

案例分析

本案的重点有两处,一是“极致了”网站使得网络用户无需登录微信账号、订阅微信公众号即可在“极致了”网站查看除了微信公众号文章以外的相关阅读数、点赞数等相关数据内容,影响微信用户协议的履行,破坏微信公众号数据的展示规则,对微信公众号点赞数、阅读数、公众号主体信息等部分数据内容构成实质性替代,分流了微信产品的部分潜在用户;二是微信客户端不仅向网络用户提供可以直接访问微信公众号及文章的搜索链接,还可以向搜狗搜索提供引擎独家授权、允许搜狗提供公众号及文章搜索。“极致了”官网提供微信公众号及文章搜索、展示等服务,已经构成对微信公众号部分数据内容服务的实质性替代,进而损害两原告通过对外授权可获取的合作利益等商业利益,构成不正当竞争。

目前市面上有不少类似于本案的产品,通过抓取各种内容平台数据,进行数据整理、加工处理后推出相关产品,长久做下去的必然是和官方有合作的,单单依靠爬虫进行数据采集的话,只要被平台方发现,告上法庭,必然会构成不正当竞争的,搞不好还有破坏计算机系统罪,广大爬虫工程师们如果公司正在研发此类产品,一定要确认是否与官方有合作,多多关注业务的合法合规性,避免走上违法犯罪的道路。

K哥爬虫普法12亿公民信息泄露,仅判3年,个人信息是否为爬虫“禁区”?

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

出生于1983年12月的黎某是湖南省浏阳市人,从2012年开始做淘宝客生意,即通过做淘宝推广赚取淘宝客佣金,其关键就是需要大量的淘宝客户联系方式。

2017年7月,黎某在网上认识了逯某。双方谈起上述生意时,黎某提到,“很难获取大量的淘宝客户联系方式”。为此,逯(lù)某为其编了一个“微信加人”软件,并且没收钱。“这个软件使用起来非常方便,也利于淘宝客生意。我觉得他有很好的网络编程技术,于是就承诺逯某,待成立了公司,算逯某技术入股。”黎某供述称。

2019年3月,黎某在湖南省浏阳市成立了浏阳市泰创网络科技有限公司(自然人独资),该公司主要做“淘宝联盟”里的淘宝返利,主要用一些手机号,加对方微信好友进行推广淘宝商品,让用户领取“淘宝联盟”优惠券,对方使用优惠券成功购买商品,该公司会获得返利。逯某受雇于黎某,作为公司技术员,每月工资一万元。自2019年11月,逯某自写软件“淘评评”。该软件可以通过淘宝商品详细信息接口和淘宝信息分享接口,爬取淘宝客户的淘宝数字 ID 和淘宝昵称,通过淘宝分享接口爬取淘宝客户手机号信息,并将其中淘宝客户的手机号码提供给黎某,用于浏阳市泰创网络科技有限公司用于经营活动。

黎某称,他在收到淘宝客户手机号码之后,会把这些信息数据导入“微信加人”软件,加微信好友成功后,由浏阳市泰创网络科技有限公司的员工负责发送广告链接,淘宝用户在该公司的广告群里购买商品,该公司获得佣金。

该公司一位工作人员王某透露,该公司约有 1100 个微信群,每个微信群最多有 200 人,最少约 90 人。其主营业务就是帮淘宝商家带货,从而获得淘宝网佣金和商家服务费。至于其淘宝客户来源,该人员称“不清楚”。“我们建好微信群后,将群二维码提供给老板黎某,然后就有人自动进群。”王某称。

逯某盗取数据的方式非常激进:仅在2020年7月6日-7月13日这七天里,平均每天爬取数量 500 万,爬取敏感字段量巨大,被淘宝公司风控部门发现。

该公司自2019年11月份至2020年7月份利用该信息经营共获利 340187.68 元。

经司法鉴定,逯某通过其开发的软件爬取淘宝客户的数字 ID、淘宝昵称、手机号码等淘宝客户信息共计 1180738048 条(即:11.8 亿条),逯某将其爬取信息中的淘宝客户手机号码通过微信文件的形式发送给黎某使用共计 19712611 条(即:1971 万条)。

法院观点

法律规定:

  • 《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第一条

    刑法第二百五十三条之一规定的“公民个人信息”是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等;

  • 《检察机关办理侵犯公民个人信息案件指引》

    对“公民个人信息”的审查认定根据《解释》的规定,公民个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。经过处理无法识别特定自然人且不能复原的信息,虽然也可能反映自然人活动情况,但与特定自然人无直接关联,不属于公民个人信息的范畴。

最高院法官的论述:

在大数据时代,从理论上而言,任何信息与其他足够多的信息相结合,都可以识别特定自然人身份或者反映特定自然人活动情况。因此,对于不能单独识别特定自然人身份或者反映特定自然人活动情况的部分关联信息,究竟哪些可以纳入“公民个人信息”的范畴,必然会存在较大的认识分歧。 在司法适用中具体判断部分关联信息是否可以认定为“公民个人信息”,应注意以下几点:

(1)需要结合的其他信息的程度。 如果涉案信息本身与特定自然人的身份、活动情况关联程度高,需要结合的其他信息相对较少,则认定为“公民个人信息”的可能性较大;反之,如果需要结合的其他信息过多,则认定为“公民个人信息”的可能性较小。

(2)信息本身的重要程度。 如果涉案的信息与人身安全财产安全密切相关,敏感程度较高,则对于此类信息在认定是否属于“公民个人信息”时,可以采取相对从宽的标准。

(3)行为人主观目的。 如果行为人主观上获取涉案信息就不需要识别特定自然人身份或者反映特定自然人活动情况,则此类部分关联信息原则上不宜认定为“公民个人信息”。

判决情况

逯某受雇于黎某,二人违反国家规定,非法获取公民个人信息,情节特别严重,其行为均已构成侵犯公民个人信息罪。公诉机关指控罪名成立。且系共同犯罪,逯某、黎某有坦白情节,且认罪认罚,对其均可从轻处罚。

综合其犯罪情节及社会危害性,依照《中华人民共和国刑法》第二百五十三条之一、第二十五条第一款、第六十七条第三款、第五十二条、第五十三条、第六十四条之规定,判决如下:

一、被告人黎某犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币三十五万元;

二、被告人逯某犯侵犯公民个人信息罪,判处有期徒刑三年三个月,并处罚金人民币十万元。;

三、被告人黎某、逯某违法所得依法继续予以追缴上缴国库;

四、依法扣押的作案工具逯某电脑主机5台、电脑显示器3台和手机5个,由扣押机关依法处理。

判决文书

(2021)豫1403刑初78号

案例分析

就最高院观点而言,“淘宝昵称”、“淘宝账号”不应该认定为为公民个人信息,虽然账号是不可重复的,但账号并非身份证号码,每个人都可以有多个账号,且并非所有账号都绑定身份信息,仅有账号很难识别到特定自然人。《解释》第一条中虽然列举了“账号密码”为公民个人信息,但应当理解为一组账号和密码,而不是单独的账号或者单独的密码。就本案而言,应当主张在12亿条信息中心剔除“淘宝账号”、“淘宝昵称”两组信息。

如果逯某所述属实,其是通过淘宝分享接口爬取到的淘宝客户手机号信息,证明彼时淘宝的信息安全保护是做的很不到位的,并且缺乏相关意识。近年来信息泄露问题严重,快递信息、防疫信息等都应该引起有关部门及企业的警惕,这方面的安全防护是重中之重。

关于个人隐私保护,这里给到以下建议:

  • 保护个人账号密码:设置一个复杂的密码,并且不要把密码告诉任何人。同时,使用密码管理器来妥善管理密码;

  • 注意公共 Wi-Fi 的使用:在公共场所使用 Wi-Fi 时,要注意安全,不要在不安全的 Wi-Fi 环境下进行敏感操作,如登录银行账户等;

  • 谨慎分享个人信息:不要随意把个人信息分享给陌生人,不要在社交媒体上公开分享个人信息,在网上填写信息的时候,能填虚拟的地方就尽量不要写真实的信息;

  • 定期检查账户安全设置:检查并设置账户的安全设置,如双重验证、密保问题等,确保账户安全;

  • 不要轻易点击陌生链接:不要随意点击来自不明来源的链接,以免被钓鱼网站欺骗;

  • 不要随意下载陌生应用程序:不要轻易下载不知名的应用程序,以免个人信息被窃取;

  • 定期清理浏览器缓存:定期清理浏览器缓存和历史记录,以免个人信息被他人利用。

当处理个人隐私数据时,爬虫工程师们需要特别注意以下几点:

  • 遵守相关法律法规:必须严格遵守国家的法律法规,包括《个人信息保护法》等相关规定;
  • 尊重个人隐私:尊重个人隐私是一种道德和职业操守。在爬取个人数据时,必须确保数据来源合法且已经获得了用户的授权同意,不得擅自窃取、利用、出售或泄露用户的隐私信息;
  • 加强数据安全管理:应该加强数据安全管理,包括加密、脱敏、访问日志记录、定期审查等措施,以确保数据的安全;
  • 及时删除个人数据:在用户请求删除个人数据或者个人数据不再需要的情况下,应及时删除个人数据,以保障用户隐私;
  • 审查第三方合作伙伴:在与第三方合作时,应该审查合作伙伴的数据保护政策和安全措施,确保他们的数据处理流程符合法律法规要求,并且能够保障用户的隐私安全。

个人隐私数据不能碰!数据来源是否合法是爬虫活动的前提,不要因为一时的利益,抱有侥幸心理,常在河边走哪有不湿鞋,银手铐戴到手上的那一刻才知道后悔,就什么都晚了,愿各位警钟长鸣。

以上是关于K哥爬虫普法微信公众号爬虫构成不正当竞争,爬虫er面对金山,如何避免滥用爬虫?的主要内容,如果未能解决你的问题,请参考以下文章

K哥爬虫普法12亿公民信息泄露,仅判3年,个人信息是否为爬虫“禁区”?

Python爬虫实战微信公众号爬虫:微信公众号浏览自动化

专家详细解读爬虫技术背后的法律问题

Python爬虫实现的微信公众号文章下载器

第三百三十节,web爬虫讲解2—urllib库爬虫—实战爬取搜狗微信公众号

欢度国庆⭐️共享爬虫之美⭐️基于 Python 实现微信公众号爬虫(Python无所不能爬)