大数据AI“武装”企业服务:风控检索安全

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据AI“武装”企业服务:风控检索安全相关的知识,希望对你有一定的参考价值。

 

大数据、AI“武装”企业服务:风控、检索、安全

技术分享

  +

- 文|吴杨可月 -

- 小饭桌创业研究院出品 -

  两件秘闻,将美国大数据公司Palantir从幕后推向前台——

  一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫“庞氏骗局”的大量确凿证据;

  二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢。

  人们这才惊叹的发现,这家低调且离大众很远的公司,估值已经超过200亿美元。

  事实上,在中国,越来越多像Palantir这样服务于机构的大数据、AI公司,正在各个领域和赛道上涌现。风控、检索、安全、营销,都有他们的身影蛰伏其后,发挥越来越关键性的作用,甚至左右市场的波动。

  本研究对大数据、AI中的企业服务机会进行详尽的分析,通过与国外该领域的对比,梳理其中的投资机遇。

  数据处理的新进展,带来应用层面的新机会

  ? 新进展:数据融合、非结构数据处理能力

技术分享

  AI的底层是特征标记,革新意义就在于能处理文本图片声音非结构数据,从而将研报政策舆情行为情绪等更多维度的信息纳入可供分析的范畴。

  数据融合则是将不同来源不同结构不同模态数据放在同一个模型分析。

  ? 新机会:风控、检索、安全、营销

  国内基础设施需求与国外不同,机会更多来自可以直接降低损失带来收益的方向。

技术分享

  ◆◆

  1、风控

  从Palantir、Anaplan看国外大数据风控应用

技术分享

  (数据来源:Crunchbase,公开信息整理)

  1.风险辅助识别——海量样本中快速发现异常

   国外公司:Palantir的工作原理——反恐(找出恐怖分子)为例

技术分享

   国内公司:氪信的工作原理——金融为例

技术分享

  功能:优化现有风控效率,但不具备完全风控定价能力

  ? 有机会从“第三方”做到“直接借贷”

  通常情况,“直接借贷”的收益,显著优于“第三方”数据服务提供方。

  数据获取+数据分析——具备风控定价能力,即可做“直接借贷”。

  路径一:接入丰富的借贷方数据源

  -典型代表:第三方征信公司。

技术分享

  路径二:累积足够的异常数据,具备通过“旧风险”推知“新风险”的能力

  -典型代表:基于AI的数据分析公司

技术分享

  -一些难点:

  ?所累计的数据,只有结果没有推导过程

技术分享

  ?基于AI的分析,不具备迁移学习能力,拓展性有限

  2.舆情监测——增加风控维度

  舆情监测的价值——快人一步、真假判定、“In control”

技术分享

  典型应用领域:金融、公关、媒体、企业安全、政府……

技术分享

技术分享

  Dataminr:发现“小道消息”里的真消息,“大新闻”里的假消息

  -案例一:“小道消息”里的真消息

  ?独立记者Brian在Twitter上发消息称家得宝“可能会是信用卡违约的新受害者”

  ?Dataminr系统立刻识别出此消息的价值

  ?Dataminr将此消息传达给客户,包括60家银行和对冲基金

  ?Dataminr的速度比财经新闻快了15分钟,且赶在家得宝股价下降2%

  -案例二:“大新闻”里的假消息

  ?有推文发送白宫有炸弹的假消息,造成道金斯工业指数数分钟内下滑145

  ?Dataminr连续进行2次假消息预警:第1次,指出信息是从被黑账号发出;第2次,分析白宫附近的实时推文,判定称该消息可能是假的

  (数据来源:公开信息整理)

  3.经营规划——打通多维数据,精准解析

  ? Anaplan:跨部门收集数据,简易关联,指导未来决策

  接入企业内部运营数据,进行数据关联,并通过模型,指导未来决策

  -优势:

  ?简易的数据关联——将财务、销售、人力等独立的数据融合在一起

  ?无需IT人员,即可完成模型的搭建、挖掘、维护、分享

  ?云端电子表格:Excel功能+多组共同操作

  ?预测模型——搭建运营数据与未来规划的桥梁

  -用户覆盖:16个国家设立办公室,660家公司,100,000+个用户

  (数据来源:Anaplan官网)

  ◆◆

  检索

  从Kensho、Watson看国外大数据检索应用

技术分享

  (数据来源:Crunchbase)

  1.投研——提升信息量、效率、便捷性

  ? 基于海量信息,模拟分析师分析过程

  基于海量信息——以Kensho为例

技术分享

  模拟分析师分析过程

  -根据数据库中某资产价格的变动历史,提取出影响该资产价格的所有可能变量

  -通过特征选择算法,选择出和当期资产价格波动较为相关的变量

  -通过机器扫描所有和这些变量相关的数据源

  -将变量值输入模型,从而得出资产价格的波动区间,以及变量的影响因子

  (数据来源:公开信息整理)

  ? Kensho的傻瓜式应用:“事件——结果”直接呈现

技术分享

  功能:

  -追因:什么因素影响了股价变动?

技术分享

  -预测:某一因素会对股价造成什么影响?

技术分享

  -程度:呈现众多因素下,股价/指数变动的幅度

  金融机构愿意买单:又买产品又投钱

  Kensho为例:高盛、JP摩根、美林、摩根史丹利、花旗、标普——既是它的用户,也是它的投资方

技术分享

  2.理赔——比对理赔要求和赔偿标准

  价值:提高理赔效率,减少错误,降低风险

技术分享

  案例——IBMWatson服务日本富国生命保险进行健康险理赔

  -成本:系统引入$170+维持费用$12.8/

  -效益:预期节省开支$110/;拟减少员工30%

技术分享

  (数据来源:公开信息整理)

  3.审计——比对财务信息和审计标准

  Sway Finance——财务信息快速检索工具

  -直接把经营活动转化为财务信息,并可随时检索信息、比对合规性

技术分享

  4.内控——比对员工行为和法律/公司规范

  ? Behavox:发现高风险或违规活动

技术分享

  价值:及时、高效发现高风险或违规活动

  -及时——防患于未然

技术分享

  -高效——极大减少合规检查需耗费的时间、人力成本

技术分享

  方法:从交易员与客户、交易员之间的沟通中,捕捉偏离常规的细节

技术分享

  (数据来源:Behavox官网)

  合规性检测的原理是比对验证

技术分享

  知识库比对要尽量应用在高ROI的领域

  比较好的应用领域:

技术分享

  另,样本的可获取性以及获取成本也是一个附加条件,医疗辅诊领域就需要攻克这个难点。

  国外,理赔、内控领域的应用已快速铺开,审计尚不明朗;国内,目前集中在理赔。

技术分享

  ◆◆

  安全

  从Splunk、Datto看国外大数据安全应用

技术分享

  (数据来源:雪球2017.4.实时数据,Splunk annual report 2017,Crunchbase,公开信息整理)

  1.日志分析——跨越不连续性的根本性分析

  ? Splunk:机器数据的引擎——聚合、搜索、可视化

  面向细分市场——Machine Log(日志数据为主)分析,并在上面集成了完整的专用模块

技术分享

  所有应用都是相对专门的领域,因此可以进行专门优化

  ? 机器数据的特点——跨越不连续性、快速增长、基础&根本

  特点一:跨越不连续性

  -跨越系统的不连续性:可收集、索引、利用所有应用程序服务器设备等在物理虚拟中生成的数据

技术分享

  -跨越时间的不连续性:分析所有实时历史数据

技术分享

  特点二:快速增长

  -以Splunk为例,其营收已达到$9亿,仍有望保持50%的增速

技术分享

  特点三:基础&根本——基于端对端基础结构,从复杂事件中获取新层次的运营可见性

  (数据来源:Splunk财务年报2017)

  ? Splunk的应用:瞬时解决安全问题、优化服务性能

  核心能力:抽象数据、应用领域之间的理解处理能力

技术分享

  典型用户

技术分享

  解决安全问题:一站式搜索、分析——快速、全面发现问题

技术分享

  优化服务性能:检测端对端基础结构——优化服务性能、业务流程

技术分享

技术分享

  2.容灾——快速备份,一键还原到特定时期

  ? Datto:给予小型企业“防弹”级别的数据备份服务

  容灾:将应用产生的数据进行存储+灾备——应对数据丢失和意外灾害(被黑)

技术分享

  面向:中小企业

技术分享

  费用:初装 + 按流量计的月费

技术分享

  多项技术优势

技术分享

  (数据来源:公开信息整理)

  ? 机遇与挑战并存:替换成本高、国内市场空白,但技术门槛高

  替换成本高——构建竞争壁垒

技术分享

  国内市场空白

技术分享

  通过技术实现以下功能

技术分享

技术分享

  (数据来源:初装费/月费借鉴Datto收费标准,公开信息整理)

  3.反作弊——排除欺诈、垃圾产生的干扰

  国外案例:Signifyd

  功能:帮助客户避免因欺诈、退款、操作失误产生的损失及资源浪费

技术分享

  应用:电商

技术分享

  价值:让客户够安心的快速扩张

  国内案例:数美科技

  产品:

技术分享

  应用:文娱、电商、金融

技术分享

  ◆◆

  营销

  从Sprinklr、Hubspot看国内外大数据营销应用

技术分享

  (数据来源:雪球2017.4.实时数据,Crunchbase,公开信息整理)

  1.社交营销——跨平台整合式营销

  ? Sprinklr:社交媒体跨平台整合管理工具和服务

  在一个平台上同时进行多个社交媒体上的营销管理——分析数据开展营销活动了解用户体验

  -19个社交媒体管理模块

  -20+社交渠道:Facebook、Twitter、LinkedIn、YouTube、人人网、微博等

技术分享

  用户:

  -《财富》Top 50中一半的公司

  -1,200多个品牌商

技术分享

  (数据来源:Sprinklr官网,公开信息整理)

  功能例举:基于传播属性的数据分析

  广告分析工具:记录提及、点赞、分享、评论信息——效果评估

技术分享

  功能例举:有计划的开展内容营销

  内容规划和发布工具:内容制作——找寻目标并发布——资源管理——效果监测

技术分享

  功能例举:互动式用户体验管理

  用户体验管理工具:持续地创建、管理、优化有价值的用户体验

技术分享

  ? Sprinklr通过多起收购,补全营销能力

技术分享

  2.集客营销——吸引、转化、提升的全周期

  ? Hubspot:帮助提供有价值的内容,提高流量转化率,促进交易达成

技术分享

  丰富全面的产品功能

技术分享

  典型应用:中小渠道商、服务商

技术分享

  不过,国内的渠道流量都集中在几个大的电商平台(阿里、京东、美团),传统服务领域品牌化、线上化、流程化不足,目前能用到集客营销工具的公司比较少

  3.精准营销——找到对的人、产品、方式

  ? 第四范式:通过数据学习精准定位潜在用户、适合产品、成本投入

  案例一:精准定位潜在用户

技术分享

  案例二:精准定位适合产品

技术分享

  案例三:精准定位成本投入

技术分享

  (数据来源:第四范式官网)

  尾声:大数据、AI类企业服务公司的特点

  业务综合:数据分析的底层工作原理类似,一个公司会同时切到多个不相关的领域

技术分享

  咨询服务VS产品:数据类企业服务,虽然也涉及产品,但很多更倾向于卖咨询服务,与传统企业服务(CRM、OA、HR…)卖产品、卖维护服务的特点不一样。

技术分享

伴随而来的新现象:Palantir也是面向大B,但公司没有销售、BD团队

  高富帅行业:

  -技术背景豪华:MIT、前FB工程师

  -需要对业务有更深的理解:Behavox的创始人是前高盛分析师;Palantir的创始人广泛游走于律师、金融,还是《从0到1》的作者

以上是关于大数据AI“武装”企业服务:风控检索安全的主要内容,如果未能解决你的问题,请参考以下文章

大数据风控案例

大数据风控案例(总结他人)

最新风控模型竞赛开始了!金融大数据应用-企业信贷风险防控-中国建设银行数据集-作者开箱测评

大数据风控模型

网易云易盾推出面向微信小程序的大数据反作弊产品

12月第2周业务风控关注 | 公安部:严打自媒体“网络水军”违法犯罪,关闭大V账号1100余个