风控安全“爬虫技术”惹争议

Posted 小鲸融创

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了风控安全“爬虫技术”惹争议相关的知识,希望对你有一定的参考价值。


风控安全“爬虫技术”惹争议

导读:

近期杭州、上海等地多家大数据智能风控企业连遭警方调查。此次风波中的魔蝎科技和公信宝被调查的原因均与爬取用户信息(可简单理解为“爬虫”技术)及用户数据引用服务违规有关。公开消息显示,魔蝎科技曾推广过有关爬虫的应用产品,可快速获取用户基本信息、放款额度、风控数据等。


在当前金融行业不景气,数据安全趋严的情形下,智能风控(大数据风控)行业面临洗牌,转型势在必行。

虽然随着互联网金融兴起、金融科技发展,用户金融行为线上化,产生了大量除了工商财税、水电煤缴费等传统征信数据之外的一些结构化数据,但是这些数据银行是缺失的。而由于银行贷前审核、贷中审批和贷后管理等业务性要求,这些数据具有有很大的辅助和参考作用。


银行就会与之合作,开拓一些新的商业模式。但近年来的情况是,银行自身大数据风控产品和金融科技应用逐渐成熟,逐渐摒弃了初期这类合作模式。


9月25日,为期三天的2019阿里云栖大会在杭州云栖小镇开幕。蚂蚁金服集团总裁胡晓明发表题为《数字经济时代的金融科技》的主题演讲。

他指出,科技驱动金融从离线走向在线,所有的金融都被数据和技术驱动,其背后有五大“技数”能力:数据智能、安全风控、区块链、生物识别、隐私保护。


亦正亦邪

爬虫技术即为了抓数据所运用的模拟登录、模拟账号、养IP/账号池、抓包分析、模拟用户访问等技术手段。

传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。

聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。


风控安全“爬虫技术”惹争议


然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时停止。另外,所有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;

爬虫技术有利于挖掘数据价值,它是中性的,但部分第三方数据公司在与其他金融机构合作过程中,留存部分数据,又把这些数据转手倒卖给第三方消费信贷公司,甚至是现金贷、高炮台公司,使得用户数据被滥用,这就触及合规的底线了。


风暴骤起,后续发酵

“监管这次下了狠手要规范行业,部分与现金贷行业联系较强的大数据公司及助贷平台已经暂定做业务了,有些消费金融公司也缩减了业务规模。”华东地区一家大数据公司负责人表示。

一些现金贷公司、消费金融公司需要爬虫数据做风控支持,如果公司资本无法支持搭建一个上千万完整的风控系统只有降低额度和停止业务两条路可以选择,而者之后死掉一批这类公司是一定的。


风控安全“爬虫技术”惹争议


“影响最大的还是现金贷平台,他们主要就靠爬取用户的运营商数据来进行贷后催收。”一家消费金融平台资深风控业务负责人向记者介绍,相对于消费金融公司在风控环节,可以通过审核用户的综合资质、并通过其他数据比如黑名单、要素验证、消费记录等来准入,而现金贷平台的申请用户资质相对来说信用资质较为次级。

“只要爬取了用户近半年的通讯记录,就可以获得用户的常用联系人关系等,用户基本上不再有什么秘密。所以会看到,有些恶意催收事件里,就是直接轰炸用户通讯录联系人。”

而网贷平台主要还是自建风控模型、接入外部数据是用于辅助查询。此外,在互联网金融行业兴起之初,拓展在线零售业务的银行机构,也会选择与第三方大数据风控公司合作,进行数据交叉验证、丰富风控维度。


寻求动态平稳

大数据、智能风控行业发展迅猛之际,与之而来的个人信息采集、应用规范受到监管重视。今年5月份到8月份,《数据安全管理办法(征求意见稿)》、《App违法违规收集使用个人信息行为认定方法(征求意见稿)》、《个人信息安全规范(征求意见稿)》、《信息安全技术、移动互联网应用(App)收集个人信息基本规范(草案)》等密集出台。

针对用户隐私,监管频出重拳,不仅仅是发生在智能风控大数据领域,甚至蔓延到整个互联网行业。近期,工信部对外披露二季度检测发现问题的应用软件名单,多个在线直播平台如YY、斗鱼直播,美团外卖、91短贷等32款应用软件被点名,多涉未经用户同意,收集、使用用户个人信息。



“爬虫技术等泛滥确实应该整治,保护用户个人隐私,个人信息安全保护趋于严格,但目前相关监管方法草案偏多,具体到细化和落实执行方面还有难度,行业也处在观望状态。”上述消费金融公司风控负责人称。

“要看到的是,当前,监管支持消费金融行业发展的大导向并没有变。”薛洪言看好当前金融数据在合规前提下深度应用开发前景,数据的发展和安全边界是一个动态平衡过程,对数据规范使用的监管将是一个长期过程。

例如蚂蚁金服在隐私保护上已经构建了多方安全计算平台、建立了可信的本身的计算环境,零知识证明,同态加密等技术,让数据可用不可见,实现数据价值的本身的可信流转。


“2013年之前,国内的智能风控公司更多是做网络安全层面的;而当前智能风控已经广泛应用在金融、电商等等各个业务层面了。”


——智能反欺诈服务商维择科技

中国区总经理吴中


以上是关于风控安全“爬虫技术”惹争议的主要内容,如果未能解决你的问题,请参考以下文章

51信用卡被查引发“爬虫技术”争议 是否侵犯个人信息?

网络爬虫技术滥用被查 消费金融风控面临再造

大数据公司接连被查,爬虫技术惹的祸?| 数据观

爬虫技术中性 “窃取”大数据有罪

解密游走于法律边缘的爬虫技术

爬虫技术的善恶与反爬虫技术