隐私计算在中国发展如火如荼。蚂蚁集团已成为全球隐私计算行业发展的重要力量。
来源:199IT 作者:Ralf神藏
刚结束的第五届数字中国建设峰会,蚂蚁集团首创推进的可信密态计算(TECC)入选“十大硬核科技”。同台竞技的,包括华为、中兴、京东方、深圳计算科学研究院、联通、南方电网、中国电子、航天云网等电信、科技、能源巨头。评委包括多位院士和数十位行业权威专家组成的专业评审组经过三轮讨论。
蚂蚁集团可信密态计算(TECC)之所以能够从489项成果中脱颖而出,靠的是实打实的过硬技术实力。官方给出的获奖评语是:将可信计算技术与密码学深入融合,形成安全高效的新型隐私计算技术,是数据密态时代的有力支撑。
(图:蚂蚁集团副总裁兼首席技术安全官韦韬博士 )
蚂蚁集团副总裁兼首席技术安全官韦韬博士现场接受了“十大硬核科技”颁奖,199IT与韦韬博士进行了简短的交流。
隐私计算的尝试中国比欧美国家迈入更深阶段
隐私计算并不是一个突然爆发的技术,在行业内已经存在多年。20世纪80年代姚期智院士提出了百万富翁设想,并在一篇论文中用密码学理论给出了解答,这便是当前隐私计算主流技术路线之一多方安全计算(MPC)的理论来源。在中国,隐私计算已经发展得如火如荼。2016年前后,以蚂蚁集团为例的科技公司开始布局隐私计算,也出现了一批隐私计算技术创业公司。随着数据要素流通和安全合规需求的加持,近两年隐私计算已在各地各领域逐步展开规模应用,包括金融、政务、医疗等领域。
与欧美国家相比,在隐私计算领域,中国已经比欧美国家迈入更深的尝试阶段。这是中国的后发先至的优势。明确的法律法规、庞大的市场和更大更快的应用需求,也让中国市场脱颖而出。
2021年,Gartner发布的隐私计算技术成熟度曲线,预测到2024年,隐私驱动的数据保护和合规技术支出将在全球突破150亿美元以上。 甲子光年智库测算,到2025年隐私计算市场将超过200亿,2021年至2025年年均复合增长率达133.4%。
与市场高速发展同步的,还有隐私计算技术的突破,这次获得“十大硬核科技”的可信密态计算就是个很好的案例。
当前实现隐私计算的技术路径很多,包括多方安全计算、联邦学习、可信执行环境、全同态等等,但这些单一技术路线各自存在着一定的局限。
在此背景之下,蚂蚁集团于2021年起推动发展新一代隐私计算技术“可信密态计算”(Trusted-Environment-based Cryptographic Computing,TECC),创新性地将密码技术(MPC、FL)和全栈可信计算技术(TEE、TPM)融合在一起,突破了使用单一技术的局限,获得了更高的综合能力。可信密态计算(TECC)解决了海量数据规模、高数据安全性、复杂计算逻辑、多数据参与方的复杂难题,进一步拓宽隐私计算的数据规模量级和计算能力,不仅满足联合营销、联合风控、数据共建等经典隐私计算场景,还突破性地支持大数据和跨地域隐私计算场景。
以东数西算为例,东数西算的数据使用场景和数据规模巨大,传统隐私计算的跨网计算模式难以发挥出西部算力优势。而TECC计算集群不用将数据明文在东西部之间传输,可以在西部算力节点只需存储密态数据,而且数分钟内可以完成亿级密态数据的类SQL分析,1小时内完成亿级密态样本的XGB模型训练。TECC还支持用户在底层算子上自定义计算逻辑,对排序、乱序、数学函数等都进行优化设计,可以有效支撑东数西算场景的计算能力需求。
以TECC为基础的数据中心方案,通过密态计算和可信执行环境融合,运维人员也难以窃取数据,非常适合有高安全需求的数据,并且TECC的计算方和数据提供方是分离的,可以最大程度上发挥西部能源和算力优势。
谈到此次可信密态计算(TECC)获奖的意义,韦韬博士坦言,获奖一方面是对蚂蚁集团隐私计算技术的认可,也是对整个隐私计算行业的认可。特别是全面到来的数据密态时代,隐私计算的重要性已经被提到了非常关键的位置。更重要的其实是对隐私计算这项技术发展的鞭策和期待,隐私计算对数字经济发展至关重要,关乎数据这项国家战略资源的价值释放,也关乎数据要素流通行业的健康长远发展。
(图:蚂蚁集团首创推进的可信密态计算(TECC)入选“十大硬核科技”)
对于行业来说,隐私计算本质是要把数据要素的流转融合,从明文变成密文,整个数据流通行业即将迈入密态时代,这个变动是极其巨大的。数据是各行各业数字化应用的血液,渗透到各个环节之中,这些变化是需要各行各业一起来努力实现的。在这方面,行业企业、研究机构、专家们做了很多努力,包括共同制定行业白皮书,举行座谈会,制定行业标准等。蚂蚁也积极参与到了行业生态建设的队伍中,除了上述的工作,蚂蚁还开源了多个隐私计算产品,包括2019年开源的TEE 操作系统Occlum,今年7月开源的可信隐私计算框架“隐语”。可信密态计算(TECC)作为隐语的关键构件,也将在主管部门指导下进行开源。如何跟同行共同推进,如何和主管机构、行业协会来协同工作,也是需要大家共同思考的问题。
蚂蚁集团隐私计算专利全球第一 前十名越来越多中国公司身影
三年前,隐私计算领域专利基本为国外巨头公司如微软、IBM等所有。“当时的感受是国际巨头在隐私计算领域专利非常厉害,专利数量多。”韦韬博士回忆当时的情景时表示,而彼时,蚂蚁集团在隐私计算的专利已经排入全球第三名。
仅仅三年,这一格局已被打破。目前,蚂蚁集团已经成为隐私计算领域专利申请数全球第一。更可喜的变化是,全球前十名的企业里,中国公司占据越来越多的席位,包括了阿里巴巴、中国平安、华为、国家电网等公司。
回顾这三年的发展,韦韬博士表示,蚂蚁集团在隐私计算上投入了巨大的资源,非常看重这个领域的技术研发和创新。蚂蚁几乎已经探索了所有能探索的隐私计算技术,这一点在蚂蚁7月份开源的可信隐私计算框架“隐语”中也能得到体现。“隐语”用一套通用框架支撑了当前几乎所有的主流隐私计算技术,包括多方安全计算、联邦学习、同态加密、差分隐私等技术,也可支持可信密态计算(TECC)这样新兴的隐私计算技术。隐私计算领域与之前的互联网、通信领域都有很大区别。与DVD编解码、3G时代核心技术都被国外巨头所垄断不同,在隐私计算领域,通过中国公司的不断努力,不会再被国外公司“卡脖子”。
国内很多公司达成的共识是,隐私计算对后续互联网科技发展有着至关重要的战略意义。
可信密态计算是对隐私计算标准的重大创新
可信密态计算是隐私计算领域蚂蚁集团首创推进的一个全新模式。此前在隐私计算里,中国公司更多的是跟随策略。
这种全新的隐私计算模式,能够很好地解决多维度数据密态作为数据时代的需求,中国的企业和机构能有更多的创新机会,在此基础上能够支撑未来更多的数据要素的创新机会。
据介绍,可信密态计算(TECC)基于全栈可信与密态分片的全密文高速计算能力,在性能、可靠性、适用性等方面比传统跨网隐私计算有显著提升。TECC能在1小时内完成亿级样本XGB建模;适用于任意多方参与,任意数据划分,支持99.99%~99.999%基础设施级可靠性要求;比明文分布式计算增加不超过一个数量级的实用成本,也是首个可以满足数据密态时代多维度基础设施级要求的隐私计算技术。
199IT与韦韬博士探讨行业标准的问题时,韦韬博士表示,以往的隐私计算标准都是单个的技术标准。如多方安全计算(MPC)、联邦学习(FL)、可信执行环境(TEE)等等,很难去横向比较单个的安全性。在7月底中国信通院发布的《可信隐私计算研究报告(2022年)》中也提到,隐私计算产品安全边界的界定需要考虑不同行业、不同场景和不同技术的差别,也需要平衡计算准确性和计算效率的要求。因此,如何评价和验证系统的安全性亟需明确。对此蚂蚁集团结合多年深耕隐私计算技术研究和实践经验,对隐私计算实现的安全性进行了通用的五类安全分级,希望推动隐私计算实现的安全性落到实处。
韦韬博士强调,隐私计算行业的变革非常巨大,对各行各业的发展影响也非常巨大。但发展不是一蹴而就的,至少需要经过三至五年的过程。其中,安全是立身之本,要保障数据安全和基础设施的安全,需要稳定可靠的发展。
由于近年来隐私计算需求非常急迫,“安全和需求之间需要均衡,需要政府、企业、社会一起更好地推进。未来来看也不是仅仅是中国的事情,一定是全球化的事情。数据要素流程一定是未来国际竞争非常核心的环节,特别需要国内国外的更好的协同,生态更好地构建,这些至关重要。”
从技术、研发、专利、应用等多维度,中国科技公司已经成为全球隐私计算行业发展的前沿阵地。自研、硬核、创新、突破成为中国隐私计算领域的强大底色。在引领这一全球未来趋势的核心技术里,蚂蚁集团与中国其他科技公司一道,将成为全球重要的重要力量。如韦韬博士的判断,三至五年内,中国隐私计算技术将迎来更为突飞猛进的发展。