这个保护数据隐私的赛道,人人都想插一脚,互联网大厂挤破头,连甲方都下场自研了...

Posted QbitAl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了这个保护数据隐私的赛道,人人都想插一脚,互联网大厂挤破头,连甲方都下场自研了...相关的知识,希望对你有一定的参考价值。

梦晨 明敏 发自 凹非寺
量子位 | 公众号 QbitAI

个人数据泄露事件频发,已经有点麻了。

在学习通APP泄露1.7亿条学生数据后,紧接着B站被曝出0.5比特币就能买到2亿条用户数据。

这感觉,仿佛咱们的个人数据每天都在互联网上裸奔。

所以,保护个人隐私数据,除了自己“闭关锁国”外,就真的没什么好办法了吗?

当然不是。

这几年来,一个名为“隐私计算”的技术,就是专门来解决这个问题的,在行业内也已经形成了一个专门的赛道。

仔细一看,好家伙,这赛道也太挤了

BAT等互联网大厂、AI平台软件商早已抢占身位,第三方初创公司更是扎堆涌现,甚至还看到了像中国移动这样的甲方下场自研。

要知道业界公认的“隐私计算元年”是2020年,截止2021已有88家企业陆续发布105款相关产品,而且还不断有新玩家想要挤进来分一杯羹。

不少市场研究机构都认为这一赛道估值或达千亿级人民币,“隐私计算已经到了发展前夜”的声音更是此起彼伏。

但另一边,作为隐私数据的源头——普通用户,看到这些信息可能会有些一脸懵。

甚至乍看“隐私计算”这个词汇,会以为它是利用隐私来赚钱的。

说到这里还有个八卦

国内某研究团队曾特意请量子位把一篇技术介绍文章中的“隐私计算”都改成“隐私保护计算”,避免引起误会。

行业内烈火烹油、行业外鲜为人知。

隐私计算市场,为何会呈现如此局面?

竞争过热

要理解这一现状,首先还要明确一下隐私计算的基本概念。

隐私计算并不指一种特定的技术,而是近几年提出的一种综合概念:

指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。

具体来说,隐私计算的技术路线大致可以分为三类。

  • 多方安全计算 (MPC, Secure Multi-party Computation) ,指在无可信第三方的前提下,通过多方共同参与,安全地完成某种协同计算。

  • 联邦学习 (FL, Federated Learning),指在机器学习过程中,各参与方借助其他方数据进行联合建模,但无需共享数据。

  • 可信执行环境 (TEE, Entrusted Execution Environmnet),则是在硬件层面上的隐私加密。

按业界对外常用的通俗提法,三种路线的共同目标都是让数据“可用但不可见”。

量子位智库把隐私计算产业参与方做了分类整理,可分为以下几类:

  • 第三方初创公司

  • 大型互联网公司

  • AI平台等软件开发商/集成商

  • 转型公司

  • 甲方自研

第三方初创公司,指从成立之初就专注于隐私计算领域的公司。

这些公司大多成立于2019年,规模控制在几十人,融资处于A-B轮。

代表公司有“隐私计算四小龙”中的翼方健数华控清交两只小龙,以及融数联智、数牍科技等。

大型互联网公司中,BAT、字节、京东等都已入场。

他们最大的优势在于自身庞大的业务场景,掌握优质数据源。但为保证对外的数据流通,他们和第三方独立公司也会结合。

短期来看,其隐私计算产品会用于内部;长线角度看,大厂们都会基于其云计算能力,在未来将隐私计算产品对外商业变现。

AI平台等软件开发商/集成商也同样存在自身需求,入局隐私计算可以使其内部链接成全套的解决方案。

但据第三方公司透露,许多综合性AI公司会选择直接集成第三方公司的隐私计算方案,并对外进行整体发布。

因此,第三方专业公司的核心技术能力依旧有望保持其的长期壁垒。

入场隐私计算的转型公司,大多具有相关基础技术(如区块链),或自身具有竞争优势(数据源优势—数据服务方;整套安全方案—安全技术商;场景优势—金融科技)。

主要有区块链公司、金融科技公司、数据服务商、安全技术商等。

据了解,他们中不少是基于原有业务的客户需求与相关技术来发展隐私计算模块的。

其中金融科技公司里包括“隐私计算四小龙”中另外两个,蚂蚁金服微众银行

最后一类,甲方亲自下场自研

代表有国家电网、中国移动、各大银行等。

据业内人士透露,由于内部本身就有大量需求,对产品打磨有空间,各甲方都有自主开发的打算。

但是短期内,仍处于借助外部产品探索的状态。

综上,国内隐私计算市场呈现出了互联网大厂和甲方蜂拥入局、第三方初创公司数量激增的格局。

尽管如此,仍旧有很多新玩家蓄势待发、准备入场。

据量子位智库预估,截至今年3月,国内具有隐私计算相关业务的厂商可能已经达到了150家左右。

从业者激增带来的最直接影响,是产品数量也在激增,甚至出现竞争过激的苗头。

《2021中国信通院隐私计算白皮书》显示,目前超过了81%的隐私计算产品进入了试点部署或实施阶段。

通过测评的就有59款,而且推出速度还在进一步加快。

与此同时,资本对于隐私计算的关注度也不低。

但早期投融资热潮已经开始消退,两极分化明显。

一方面,一半以上厂商融资都还停留在A轮及以前轮次。

另一方面,单轮高额融资已经出现。

最近华控清交宣布完成累计近7亿B轮融资,蓝象智联今年完成2亿元A轮融资,更早以前翼方健数完成了3亿元B+轮融资。

此外,还有业内人士透露称,个别公司已在筹备上市。

但在市场供给侧热火朝天的另一面,需求侧却显得有些冷静。

除了客户集中在各行业头部少数公司外,还有对政策依赖性高的特点。

近年来,政策引导、技术普及、市场教育等因素影响下,不少头部客户开始主动接触隐私计算。

但其群体数量本身就十分有限,因此市场依旧呈现出“僧多肉少”的特点。

而且目前客户更多从安全合规的角度出发,市场格局还没有完全打开。

主要局限在金融、政务、运营商三大领域,就连近年来讨论颇多的医疗领域,技术采用率依旧不高。

而供给侧和需求侧之间的“冷热差异”,造成的直接结果就是厂商之间的恶性竞争

量子位智库分析师表示,在隐私计算行业中,10多家公司竞争1个客户的现象十分常见,为了争取客户不惜自杀式报价。

甚至有并未真正掌握相关技术就去参加招标,如遇到POC (Proof of Concept)阶段就主动退出的乱象。

何以至此?

总的来说,隐私计算前景虽广阔,但如何走出竞争过热的现状还有待探索。

接下来,量子位智库尝试从不同角度分析隐私计算市场现状形成的原因,从而进一步找出潜在的解决思路。

首先要说的是行业的进入门槛相对较低。

隐私计算中的密码学、零知识证明等技术,早年间就已经被大数据、互联网、安全等公司玩得很熟悉了。

导致来自各种背景的创始人和团队都能顺势入场,并且在技术商用落地上有一定的先发优势。

而各种开源框架的流行,填补了行业的底层能力,将门槛进一步降低。

据业内人士透露,在通过联邦学习产品测试的公司中,超过80%的公司是基于开源框架搭建的。

第二,门槛低让众多玩家得以入场,带来的同质化现象又加剧了竞争烈度。

量子位智库通过统计采访发现,各家未来的战略规划和商业模式已初步有了分化——

可大致分为软件系统提供商、标准化完整方案、专注垂直赛道、底层芯片方案和基础设施服务商这几类

但就现阶段需求场景有限、技术与配套基础设施尚未成熟的情况下,还难以大展拳脚。

大多公司的目光正集中在打造数据源生态,以求未来形成平台优势。但就目前而言,尚未看到明显的水平差异。

第三,即使有技术优势,也难以向客户方证明。

这里最主要的原因是落地困难。

隐私计算方案要想真正集成到实际业务中投入使用,需要在安全、效果和性能这个“不可能三角”中找到平衡点。

短期内看不到实际效果的情况下,客户考察主要基于官方测评、厂商讲解技术原理,自身缺乏测试技术水平的方法论。

根据量子位智库调研,在保证产品安全的前提下,隐私计算技术水平并不对当前客户的购买决策产生决定性影响。

另外,现阶段隐私计算行业对政策依赖明显。

可以明显观察到,政策出台前后往往也是投融资热潮,后续如没有持续的政策利好,热潮也随之消退。

最后要说的是,隐私计算作为一个新兴行业,早期的混沌无秩序算是快速发展的副产品,不得不经历。

但正如互联网、AI这些过去数年间发展最快的行业已证明的那样,随着技术、市场的成熟和产业链分工的细化,秩序和新一轮的拓展空间也会随之而来。

重新聚焦到隐私计算行业,一些变化已经在发生

技术层面看,已公开专利从2020年的1899件激增至2021年的3608件,增长将近一倍。

预估未来2-3年将有大批专利完成转化,技术差异性优势开始形成。

市场层面看,互联互通方面也出现前瞻性布局。

隐私计算要想真的让数据自由流通起来,不可能停留于彼此割裂的小生态,依托标准体系建立互联互通势在必行。

目前为止,绝大多数受访公司也都表达了对互联互通趋势的认可。

代表案例有富数科技与微众银行联手,完成行业内第一次异构联邦学习平台的互通等。

基于这些行业趋势和动向,量子位智库判断2022年隐私计算已进入打磨头部客户及案例实践、专注特定行业的落地提升期

在头部落地标杆出现后,预计将迎来一波应用热潮。

走向何方?

除了市场规模的增长和落地行业的拓展,隐私计算真正的价值也将显现。

当前行业关注的价值点还主要在满足合规需求,但这种视角实际上限制了隐私计算的深层价值创造与应用场景拓展。

与API调用、第三方沙箱、数据脱敏等此前的数据保护方式相比,隐私计算在保障合规安全的同时,为大规模、跨机构的数据流通创造了条件。

据此,量子位智库提出隐私计算的三层价值理论。

第一层,隐私计算行业自身发展,主要靠满足安全合规需求。

从欧盟GDPR到我国个人信息保护法、数据安全法的陆续落地,都是客户对隐私计算需求的核心出发点。

而传统上数据清洗后提供API和数据包的方式,已不再适应新形势下的安全合规需求。

第二层,隐私计算作为底层支撑,与大数据及AI产业协同发展。

如果以数据流转全生命周期为视角来看,隐私计算可以从根源保证数据的安全可用性。
因此,我们判断隐私计算趋于成熟后必将与大数据产业高度重合,全程参与大数据的交易、再加工、定价等环节。

而以深度学习为代表的这轮AI浪潮,核心也是从海量数据中提取价值。

在结合隐私计算能力后,直接为客户提供具有安全数据、安全算法、安全算力的端到端AI工具/数据中台工具等,成为隐私计算未来重要的价值形式。

第三层,推动数据作为生产要素在全社会的流动,提升社会生产力。

在数据智能时代,数据成为优化资源分配和使用的关键决策依据。

如基于用户画像的个性化营销,实际上就是基于用户的购买物品、地址等个人数据,调整人力、投放等营销资源的配置,从而提升营销的整体效率。

作为生产要素,数据需要流通。

如电网的数据,付费等数据对个人的价值比较有限,但可以用来做中小微企业的信用分析,做贷款的信用度、资质的分析。在数据流通并转换于不同的空间、场景之后,其价值会有明显的提升。

通过合理解决数据流通问题,隐私计算将成为数据智能时代目前唯一可行的技术基础设施,,对社会生产力发展有重大意义。

基于这种生产要素认知,隐私计算将有更大的延展。甚至会出现开发商、服务提供商、基础设施硬件提供商、数据交易中介等配套产业,并与各类行业紧密相连。

据量子位智库测算,预计到2030年我国隐私计算行业的总市场规模将达到1134亿元。其中,第一、二、三层价值分别占比11%、27%和62%。

One More Thing

展望过未来,再次把目光拉回到现实。

在当前产品同质化、竞争过热的形势下,隐私计算各玩家又该如何破局?

对此,量子位智库也基于对行业的观察和思考给出了几个思路,主要涉及标杆客户、长期自研技术壁垒、连接能力、价值创造能力和产品工程化能力。

扫描二维码,就能下载量子位智库出品完整《隐私计算产业展望报告》

也可扫描下方智库小助手微信,进入隐私计算主题群进行讨论。

在下一期专题中,将详细解读我们在隐私计算产业区别于市场的七大结论

关于量子位智库

量子位旗下科技创新产业链接平台。致力于提供前沿科技和技术创新领域产学研体系化研究。面向前沿AI&计算机、生物计算、量子技术及健康医疗等领域最新技术创新进展,提供系统化报告和认知。通过媒体、社群和线下活动,帮助决策者更早掌握创新风向。

特别感谢公司:冲量在线、洞见科技、锘崴科技、融数联智、华控清交、微众银行、富数科技、平安科技、星云Clustar、同盾科技、翼方建数、矩阵元、OpenMPC。

以上是关于这个保护数据隐私的赛道,人人都想插一脚,互联网大厂挤破头,连甲方都下场自研了...的主要内容,如果未能解决你的问题,请参考以下文章

互联网体育成唐僧肉,人人都想咬却没几个咬得到

不怕大厂「耍流氓」,想保护隐私的你可以这样管理 Android 权限

荣耀且卑微:为什么互联网外包是未来趋势,却人人都想转正?

国内个人隐私保护安全法规实施里程碑

互联网数据泛滥下,你的隐私数据要如何保护?

深度学习核心技术精讲100篇(五十三)-机器学习中的隐私保护