被玩坏的爬虫技术!5000多张人脸信息只卖10元
Posted 郭盛华
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了被玩坏的爬虫技术!5000多张人脸信息只卖10元相关的知识,希望对你有一定的参考价值。
中国消费者报报道(记者聂国春)“放下你手中的代码,小心被抓!”最近,程序员圈子里流行着这样的段子。原因在于近期发生多起涉及爬虫技术的公司被警方调查。
根据日前公安部新闻发布会的通报,自今年9月1日以来,各地网安会同刑侦部门收网打掉“套路贷”团伙147个,抓获嫌疑人1531名,采取刑事强制措施798名,铲除了一批为犯罪行为提供服务的技术服务商、数据支撑服务商。其中,黑龙江七台河“7.30”套路贷专案中,新颜科技、聚信立、同盾科技、魔蝎科技等公司的爬虫业务有关负责人均被警方抓获。
在如今这个时代,数据已然成为了比黄金、石油更宝贵的财富。随着大数据技术体系的日趋成熟,大数据技术正被广泛应用到各个行业领域。然而,在大数据技术下,每个人也可能成为受害者。
5000多张人脸信息只卖10元
依托人脸识别技术,人脸信息绑定了鉴权、支付等重要的应用场景,因而成为和指纹、身份证同样重要的个人信息。一旦被非法窃取,后果不堪设想。
10月28日,由于反对采用人脸识别的方式进入动物园,浙江理工大学特聘副教授郭兵将杭州野生动物世界诉至杭州市富阳区人民法院,该案成为国内消费者起诉商家的“人脸识别第一案”。11月1日,富阳区法院正式受理此案。
郭兵认为,园区进行人脸识别,将收集他的面部特征等个人生物识别信息,该类信息属于个人敏感信息,一旦被泄露、非法提供或者滥用,将极易危害包括原告在内的消费者人身和财产安全。
郭兵的担忧并非杞人忧天。央视11月30日报道称,在某APP平台上发现名为“人脸相关算法训练数据集”的商品,标价10元。该商品介绍称,这个数据集包含5000多张人脸照片,很多还是一个人不同表情的脸部照片。而在淘宝上,也有一些店铺公开出售人脸信息,价格多为每人5张照片,1人1元。记者在IT社区、网络商城等多个平台搜索看到,有不少人脸照片可供免费下载或付费购买,付费金额由帖子发布者自定,多在10元到20元左右。
被玩坏的爬虫技术
“爬虫技术是一项工具,但被居心不良的人使用,就可能出现大问题。”IT程序员小张感慨说。
据了解,在爬虫技术诞生初期,被爬取方不仅不抗拒,反而很欢迎被搜索引擎爬取,因为这样才能被搜索到,给自己带来更大的访问量以及相应的广告收入。大数据产业兴起后,海量信息中单条价值有限,但聚合在一起则价值很大,于是部分企业利用网络爬虫大量搬运其他网站上的内容,掐头去尾、改头换面放到自己的网站上,双方由此产生利益冲突。在移动互联网时代,爬虫技术主要分为两类,一类是公开爬虫,另一类是授权爬虫。前者指只能爬取公开发布的数据信息,比如企业的工商信息、公开社交平台信息等;而授权爬虫,则是指要求用户提前授权,从而爬取到用户个人的通讯录、邮箱、司法信息、APP使用、电商平台等隐私数据。
应用技术要有担当
当前,国内互联网行业隐私保护薄弱、数据安全亦存在漏洞,爬虫技术、人脸识别技术等新技术往往与信息来源违法、滥用等问题交织在一起。这是否意味着新技术一定会催生大量的黑灰产业链呢?
王新锐律师认为,当技术刚刚产生而业界也不知道如何应用时,采取“技术中立论”的态度并无不妥。但一旦技术变得成熟,和产业深度结合,掌握技术的人就要警惕技术是否会被黑产利用,是否会成为帮凶,甚至直接成为黑产的核心技术。各种“割韭菜”、侵犯合法权益的玩法,随着时间的累积一定会大量爆发风险,执法者就必然会采取行动,而这时“助恶者”也会付出代价。
“技术本无对错,只是人心有善恶。”中国人民大学法学院教授张新宝表示,技术中立应是一个基本判断,在此基础上,分析该技术应用的主要目的。如果仅用于犯罪,如赌博技术、复制号码技术等,那么就应该限制。如果技术既可服务于经济社会,也可能被坏人利用,那就应该规范。因此,要通过对个人敏感隐私信息的强化保护,以及强化规范个人一般信息的商业利用和国家基于公共管理目的的利用(如刷脸入住酒店等),实现个人、信息业者和国家三方利益的平衡。
部分图片源自互联网,如侵权请联系删除
来 源:CNN
整 理:东方联盟
以上是关于被玩坏的爬虫技术!5000多张人脸信息只卖10元的主要内容,如果未能解决你的问题,请参考以下文章