大数据AI“武装”企业服务:风控检索安全
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据AI“武装”企业服务:风控检索安全相关的知识,希望对你有一定的参考价值。
+
- 文|吴杨可月 -
- 小饭桌创业研究院出品 -
两件秘闻,将美国大数据公司Palantir从幕后推向前台——
一是,Palantir的旗下产品在整合40年的记录及海量数据并充分挖掘之后,找到了前纳斯达克主席麦道夫“庞氏骗局”的大量确凿证据;
二是,通过其大数据挖掘能力,Palantir帮美国政府找到本拉登的老巢。
人们这才惊叹的发现,这家低调且离大众很远的公司,估值已经超过200亿美元。
事实上,在中国,越来越多像Palantir这样服务于机构的大数据、AI公司,正在各个领域和赛道上涌现。风控、检索、安全、营销,都有他们的身影蛰伏其后,发挥越来越关键性的作用,甚至左右市场的波动。
本研究对大数据、AI中的企业服务机会进行详尽的分析,通过与国外该领域的对比,梳理其中的投资机遇。
数据处理的新进展,带来应用层面的新机会
? 新进展:数据融合、非结构数据处理能力
AI的底层是特征标记,革新意义就在于能处理文本、图片、声音等非结构数据,从而将研报、政策、舆情、行为、情绪等更多维度的信息纳入可供分析的范畴。
数据融合则是将不同来源、不同结构、不同模态的数据放在同一个模型里分析。
? 新机会:风控、检索、安全、营销
国内基础设施和需求与国外不同,机会更多来自可以直接降低损失、带来收益的方向。
◆◆◆
1、风控
从Palantir、Anaplan看国外大数据风控应用
(数据来源:Crunchbase,公开信息整理)
1.风险辅助识别——海量样本中快速发现异常
国外公司:Palantir的工作原理——反恐(找出恐怖分子)为例
国内公司:氪信的工作原理——金融为例
功能:优化现有风控效率,但不具备完全风控定价能力
? 有机会从“第三方”做到“直接借贷”
通常情况,“直接借贷”的收益,显著优于“第三方”数据服务提供方。
数据获取+数据分析——具备风控定价能力,即可做“直接借贷”。
路径一:接入丰富的借贷方数据源
-典型代表:第三方征信公司。
路径二:累积足够的异常数据,具备通过“旧风险”推知“新风险”的能力
-典型代表:基于AI的数据分析公司
-一些难点:
?所累计的数据,只有结果,没有推导过程
?基于AI的分析,不具备迁移学习能力,拓展性有限
2.舆情监测——增加风控维度
舆情监测的价值——快人一步、真假判定、“In control”
典型应用领域:金融、公关、媒体、企业安全、政府……
Dataminr:发现“小道消息”里的真消息,“大新闻”里的假消息
-案例一:“小道消息”里的真消息
?独立记者Brian在Twitter上发消息称家得宝“可能会是信用卡违约的新受害者”
?Dataminr系统立刻识别出此消息的价值
?Dataminr将此消息传达给客户,包括60家银行和对冲基金
?Dataminr的速度比财经新闻快了15分钟,且赶在家得宝股价下降2%前
-案例二:“大新闻”里的假消息
?有推文发送白宫有炸弹的假消息,造成道金斯工业指数数分钟内下滑145点
?Dataminr连续进行2次假消息预警:第1次,指出信息是从被黑账号发出;第2次,分析白宫附近的实时推文,判定称该消息可能是假的
(数据来源:公开信息整理)
3.经营规划——打通多维数据,精准解析
? Anaplan:跨部门收集数据,简易关联,指导未来决策
接入企业内部运营数据,进行数据关联,并通过模型,指导未来决策
-优势:
?简易的数据关联——将财务、销售、人力等独立的数据融合在一起
?无需IT人员,即可完成模型的搭建、挖掘、维护、分享
?云端电子表格:Excel功能+多组共同操作
?预测模型——搭建运营数据与未来规划的桥梁
-用户覆盖:16个国家设立办公室,660家公司,100,000+个用户
(数据来源:Anaplan官网)
◆◆◆
检索
从Kensho、Watson看国外大数据检索应用
(数据来源:Crunchbase)
1.投研——提升信息量、效率、便捷性
? 基于海量信息,模拟分析师分析过程
基于海量信息——以Kensho为例
模拟分析师分析过程
-根据数据库中某资产价格的变动历史,提取出影响该资产价格的所有可能变量
-通过特征选择算法,选择出和当期资产价格波动较为相关的变量
-通过机器扫描所有和这些变量相关的数据源
-将变量值输入模型,从而得出资产价格的波动区间,以及变量的影响因子
(数据来源:公开信息整理)
? Kensho的傻瓜式应用:“事件——结果”直接呈现
功能:
-追因:什么因素影响了股价变动?
-预测:某一因素会对股价造成什么影响?
-程度:呈现众多因素下,股价/指数变动的幅度
金融机构愿意买单:又买产品又投钱
以Kensho为例:高盛、JP摩根、美林、摩根史丹利、花旗、标普——既是它的用户,也是它的投资方
2.理赔——比对理赔要求和赔偿标准
价值:提高理赔效率,减少错误,降低风险
案例——IBM的Watson服务日本富国生命保险进行健康险理赔
-成本:系统引入$170万+维持费用$12.8万/年
-效益:预期节省开支$110万/年;拟减少员工30%
(数据来源:公开信息整理)
3.审计——比对财务信息和审计标准
Sway Finance——财务信息快速检索工具
-直接把经营活动转化为财务信息,并可随时检索信息、比对合规性
4.内控——比对员工行为和法律/公司规范
? Behavox:发现高风险或违规活动
价值:及时、高效发现高风险或违规活动
-及时——防患于未然
-高效——极大减少合规检查需耗费的时间、人力成本
方法:从交易员与客户、交易员之间的沟通中,捕捉偏离常规的细节
(数据来源:Behavox官网)
合规性检测的原理是比对验证
知识库比对要尽量应用在高ROI的领域
比较好的应用领域:
另,样本的可获取性以及获取成本也是一个附加条件,医疗辅诊领域就需要攻克这个难点。
国外,理赔、内控领域的应用已快速铺开,审计尚不明朗;国内,目前集中在理赔。
◆◆◆
安全
从Splunk、Datto看国外大数据安全应用
(数据来源:雪球2017.4.实时数据,Splunk annual report 2017,Crunchbase,公开信息整理)
1.日志分析——跨越不连续性的根本性分析
? Splunk:机器数据的引擎——聚合、搜索、可视化
面向细分市场——Machine Log(日志数据为主)分析,并在上面集成了完整的专用模块
所有应用都是相对专门的领域,因此可以进行专门优化
? 机器数据的特点——跨越不连续性、快速增长、基础&根本
特点一:跨越不连续性
-跨越系统的不连续性:可收集、索引、利用所有应用程序、服务器、设备等在物理、虚拟、云中生成的数据
-跨越时间的不连续性:分析所有实时、历史数据
特点二:快速增长
-以Splunk为例,其营收已达到$9亿,仍有望保持50%的增速
特点三:基础&根本——基于端对端基础结构,从复杂事件中获取新层次的运营可见性
(数据来源:Splunk财务年报2017)
? Splunk的应用:瞬时解决安全问题、优化服务性能
核心能力:抽象数据、应用领域之间的理解处理能力
典型用户
解决安全问题:一站式搜索、分析——快速、全面发现问题
优化服务性能:检测端对端基础结构——优化服务性能、业务流程
2.容灾——快速备份,一键还原到特定时期
? Datto:给予小型企业“防弹”级别的数据备份服务
容灾:将应用产生的数据进行存储+灾备——应对数据丢失和意外灾害(被黑)
面向:中小企业
费用:初装 + 按流量计的月费
多项技术优势
(数据来源:公开信息整理)
? 机遇与挑战并存:替换成本高、国内市场空白,但技术门槛高
替换成本高——构建竞争壁垒
国内市场空白
通过技术实现以下功能
(数据来源:初装费/月费借鉴Datto收费标准,公开信息整理)
3.反作弊——排除欺诈、垃圾产生的干扰
国外案例:Signifyd
功能:帮助客户避免因欺诈、退款、操作失误产生的损失及资源浪费
应用:电商
价值:让客户够安心的快速扩张
国内案例:数美科技
产品:
应用:文娱、电商、金融
◆◆◆
营销
从Sprinklr、Hubspot看国内外大数据营销应用
(数据来源:雪球2017.4.实时数据,Crunchbase,公开信息整理)
1.社交营销——跨平台整合式营销
? Sprinklr:社交媒体跨平台整合管理工具和服务
在一个平台上同时进行多个社交媒体上的营销管理——分析数据,开展营销活动,了解用户体验
-19个社交媒体管理模块
-20+个社交渠道:Facebook、Twitter、LinkedIn、YouTube、人人网、微博等
用户:
-《财富》Top 50中一半的公司
-1,200多个品牌商
(数据来源:Sprinklr官网,公开信息整理)
功能例举:基于传播属性的数据分析
广告分析工具:记录提及、点赞、分享、评论信息——效果评估
功能例举:有计划的开展内容营销
内容规划和发布工具:内容制作——找寻目标并发布——资源管理——效果监测
功能例举:互动式用户体验管理
用户体验管理工具:持续地创建、管理、优化有价值的用户体验
? Sprinklr通过多起收购,补全营销能力
2.集客营销——吸引、转化、提升的全周期
? Hubspot:帮助提供有价值的内容,提高流量转化率,促进交易达成
丰富全面的产品功能
典型应用:中小渠道商、服务商
不过,国内的渠道流量都集中在几个大的电商平台(阿里、京东、美团),传统服务领域品牌化、线上化、流程化不足,目前能用到集客营销工具的公司比较少
3.精准营销——找到对的人、产品、方式
? 第四范式:通过数据学习精准定位潜在用户、适合产品、成本投入
案例一:精准定位潜在用户
案例二:精准定位适合产品
案例三:精准定位成本投入
(数据来源:第四范式官网)
尾声:大数据、AI类企业服务公司的特点
业务综合:数据分析的底层工作原理类似,一个公司会同时切到多个不相关的领域
咨询服务VS产品:数据类企业服务,虽然也涉及产品,但很多更倾向于卖咨询服务,与传统企业服务(CRM、OA、HR…)卖产品、卖维护服务的特点不一样。
伴随而来的新现象:Palantir也是面向大B,但公司没有销售、BD团队高富帅行业:
-技术背景豪华:MIT、前FB工程师
-需要对业务有更深的理解:Behavox的创始人是前高盛分析师;Palantir的创始人广泛游走于律师、金融,还是《从0到1》的作者
以上是关于大数据AI“武装”企业服务:风控检索安全的主要内容,如果未能解决你的问题,请参考以下文章