翼方健数曹华:构建数据和计算互联网的必由之路

Posted AI科技大本营

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了翼方健数曹华:构建数据和计算互联网的必由之路相关的知识,希望对你有一定的参考价值。

智能时代,数据无疑是最活跃的生产要素,它将决定未来的生产力和生产关系。其中,共享和保护数据,促进数据流通,并最大化数据价值是业内技术发展所关注的焦点。

诞生在这一背景下的隐私计算技术正在蓬勃发展,隐私计算应用场景变得更加丰富,隐私计算技术已接近产业化。当下,业内的技术解决方案也到了系统化应用的新阶段。

此前,在由OpenMPC社区和DataFun联合举办的“隐私计算线上论坛”上,翼方健数首席产品官曹华分享了隐私安全计算平台翼数坊的落地应用实践,尤其在医疗、政务、金融等领域已有丰富的落地经验。

 

曹华本人是普林斯顿大学博士,系犹他大学电子工程系博士后、南佛罗里达大学电子工程系教授,在其担任教职期间,建立了飞秒级别的超快太赫兹实验室,发表30余篇期刊和会议论文。在Optics in 2002的期刊中,他的代表工作之一被美国光学协会列为年度重大发现之一。

除了深厚的学术背景,他还具有10多年高科技公司产品管理和跨国项目管理经验。在翼方健数,汇聚了诸多像曹华这样横跨学界和业界的顶尖专家,这让他们在隐私计算技术的前沿探索和工程实践上有深刻认知。

会上,曹华阐述了翼方健数对隐私计算技术的一些看法。他提出,隐私计算不是单一技术,而是系统工程。这意味着,使用多方安全计算、联邦学习、TEE等单一的隐私安全计算技术方案很难赢得市场,翼方健数认为,不同技术适用于不同场景,需要优化组合不同的技术,实现对于实际应用场景的赋能,从而推动技术系统化地迭代。

他所重点介绍的翼数坊XDP是翼方健数自研的融合了多种技术的平台产品。作为一个单体平台,它可以通过专属的高效私有协议实现一个联盟,进而实现很多数据平台达成一种共同协议,在数据平台之间,即使没有信任,也能在获取授权的情况下参与共同计算。它能够解决数据开放共享和数据隐私安全保护之间的困境,最终以智能服务等方式输出数据的“价值”。

从打造技术系统到赋能各行业平台化产品,这些都是翼方健数构建数据和计算互联网(IoDC)的必由之路。

隐私计算不是单一技术,而是系统工程

作为一项生产要素,数据从信息时代的遗留物、独特的经济学特征、数据的非经济学角度等方面,可以看出数据具有非常多且繁杂的特性。因此,要想通过数据流通最大化其价值,其中要解决的一个关键问题是信任假设

传统IT时代的信任假设实际上要信任系统管理员,云时代企业要信任云服务商,风险在于原始数据要离开数据平台去做数据处理,这必然失去对数据隐私和安全的保护。在智能时代,数据无处不在,生产力的推动需要各种数据协作方式,相应地,各种应用场景下的信任假设的要求变得非常复杂和多样化。

那么,如何解决这一问题?

 

通过隐私安全计算方式,包括多方安全计算MPC/同态加密、联邦学习、安全沙箱计算/TEE等技术,可以实现让原始数据不离开数据平台,数据在平台内授权使用,平台只输出数据价值。

曹华指出,现有的不同隐私安全计算方法实际上都基于不同的信任假设,相比MPC/同态加密和联邦学习,安全沙箱/TEE方案具有可信的第三方,能提高计算效率。不过,基于不同的应用场景,信任假设是变化的,需找到平衡效率和安全的方案。

同时,隐私安全技术也面临很多挑战,比如在应用中如何发现数据问题,如何保证自己的模型IP不被平台管理人盗用,如何衡量各个数据源对于最终可用数据集的贡献等问题。

 

如此来看,隐私计算必然是一个系统工程。翼方健数从全流程、快速应用、互联互通、计算环境、数据资产化五大模块构建系统。

曹华解释,数据通常经过加工之后才能使用,其中每一个计算环节实际都有其独特的安全假设以及对计算环境的需求,所以平台必须为不同的场景提供相应的安全计算环境。数据资产化则是数据价值体现一个终极形式,包括数据确权、定价、交易以及价值分配等,只有把这些全都解决,才算是建立了一个完整的隐私安全计算系统。

最大化数据价值:从翼数坊平台到构建IoDC

既然隐私计算是一个系统工程,那么,翼方健数如何提供整套解决方案,帮助用户发现、实现和分享数据价值?

翼数坊XDP平台是一个已实现合理授权的数据价值共享、创造数据流通性的平台,提供了一个遵循隐私计算理念的数据存储、计算、协作的环境。在数据安全、授权使用和隐私保护下,提供数据采集、清洗、分析、应用的数据全生命周期管理,目标是针对各种应用场景,把隐私安全计算技术整合到系统模块,最终形成一个更贴近业务场景的商业化平台。

 

翼数坊XDP平台通过三个翼方健数自主研发的核心模块XFS (XDP File System)、XEE (XDP Execution Engine) 以及DaaS (Data as a Service)兼顾了“安全”与“开放”,实现数据的隐私保护与安全共享。

其中,XFS模块是一个安全、高效、分布式的文件系统,兼容不同数据源及存储介质,能够在保证数据存储绝对安全的同时,无感知地为计算应用提供透明、通用的数据访问接口。同时XFS也是翼方健数自主研发,专为隐私计算打造的文件系统。

XEE模块负责提供开放、安全和灵活计算框架的执行引擎,它对底层设施不做假设,可自由部署在不同硬件环境。DaaS模块则提供数据结构化、数据发现和搜索引擎。

这套工具为用户提供诸多方面的核心价值:

首先,能处理大量数据,是一个有能力处理城市级别大数据的隐私安全计算平台;

其次,提供一个比较完整的解决方案,有各种隐私安全计算的数据保护和计算体系

再次,灵活并能适配多样的应用,能够对城市级别大数据面临的各种数据业务提供成熟的技术框架,实现数据和算法的接入;

最后,支持数据跨城市的流通,有能力突破传统的数据融合方式,安全高效地利用跨城市节点的数据资源。

 

据曹华介绍,翼方健数已在国内外部署了数十个翼数坊XDP平台,应用于医疗健康、生物制药、高科技园区、科研、金融、营销、城市数字化等各种应用场景。

值得一提的是,翼数坊XDP平台建立了基于隐私安全计算的开放数据生态。它遵循隐私计算基本原则,平台提供数据保护、授权机制,数据所有者参与数据使用管理。这意味着,任何用户都可以在平台内授权使用数据,平台还对第三方应用开放,建立了平台内数据处理机制,数据处理结果形成新的数据集,并拥有数据使用过程的追溯机制。

 

由此,从一个个单体隐私计算平台到实现数据共通的平台联盟,翼方健数最终希望构建数据和计算互联网。曹华分享了这一演化路径:

· 在单体平台内部,可以保证数据安全,提供算力和算法,各个机构可以对自己的数据进行授权控制,并能够享受数据带来的价值;

· 有了众多单体平台后,可以进行平台互联。单体平台之间通过协议的方式进行数据互通,并通过隐私安全计算的方法,在保护数据的前提下,进行数据共享和协作,用户可以跨平台去获取数据价值;

· 长远来看,翼方健数的平台还要与其他隐私计算技术支持的平台进行互联互通。也就是通过数据和算法互联网完成数据互联,通过计算的方式实现数据价值的流通。

要实现这一愿景,一方面,翼方健数还需不断更迭隐私计算系统平台,做好更多应用场景的适应,加快平台在各行业的落地,同时,还需将不同的平台连点成面,构筑平台联盟,为实现数据和计算互联网打下基础。

另一方面,隐私计算技术的发展离不开技术人才和生态各方的共同努力。今年8月,翼方健数宣布完成超3亿人民币B+轮战略融资,正积极招募计算机科学、隐私安全计算、数据智能及各垂直领域的人才;同时,也需要源源不断的数据服务方、数据所有方、数据需求方加入,共建开放的数据生态。

未来,翼方健数将从技术、人才到生态,从各个层面强化自身的实力,以此加速隐私安全计算技术发展,向着实现数据和计算互联网的愿景稳步迈进。

以上是关于翼方健数曹华:构建数据和计算互联网的必由之路的主要内容,如果未能解决你的问题,请参考以下文章

使用netty构建API网关实践之路

使用netty构建API网关实践之路

英孚教育全面上云与Serverless构建之路

东方国信——通信大数据起家,开启买买买之路

小白python之路认识python

分布式架构的发展和演进之路