以大数据、AL建模、风控技术为基础,通过区块链和隐私计算为数据保护升级的新型数据安全合作基础设施,并提供行业建模、可信数据资产交换及分布式智能应用产品和解决方案。

新闻资讯

全流程加密再升级!蓝象智联最新研究成果入选国际顶级期刊《IEEE TIFS》!

2023-08-25 16:32
近日,蓝象智联在全流程加密联邦建模领域的最新研究成果入选国际顶级期刊《IEEE TIFS》!
入选论文《iPrivJoin: An ID-Private Data Join Framework for Privacy-Preserving Machine Learning》,由西安电子科技大学、浙江大学、蓝象智联联合撰写,提出了全新的“iPrivJoin”隐匿求交方案,能够更安全、更高效、更低成本地完成隐私计算中的全流程加密联邦建模;该研究成果有望为数据要素可信流通市场引入更具领先性的技术方案,并具有很强的落地实践性。


过去的大数据行业,大量的数据样本以传统机器学习的方式进行模型训练,以满足各行各业的不同场景应用;然而传统机器学习涉及多方数据明文汇集的隐私泄漏风险,正在面临监管合规和数据安全的挑战。
在此基础上,能够保护数据隐私安全的联邦学习快速发展,并成为隐私计算的核心技术方向。“数据可用不可见,数据不跑模型跑”的联邦学习,能够有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
在上述背景下,蓝象智联与西安电子大学、浙江大学的研究团队(以下简称“研究团队”)以独创的“全流程加密联邦建模”技术方案,实现不同数据源之间安全、合规、高效地合作模型训练,以满足数据要素市场多方数据融合应用的业务需求。
全流程加密联邦建模是一种全流程端到端的无隐私泄漏的建模方案,整个建模过程都是在密文下完成,计算过程中无任何解密操作或明文计算。
方案中通过“基于可编程不经意伪随机函数的主键求交算法”解决了当前传统数据联合建模中隐匿求交暴露明文交集而带来的数据泄漏的风险问题;使用“基于拉格朗日插值拟合的非线性函数算法”则解决了全密文下非线性函数计算效率低下或精度不高的问题。
在本次入选《IEEE TIFS》期刊的论文中,研究团队在全流程加密联邦建模的方案框架中,创新性提出了一个“更快、更优、更低成本”的隐匿求交方案——iPrivJoin
在联邦学习的模型训练中,隐匿求交是非常关键的多方数据对齐环节,研究团队提出的iPrivJoin方案与传统基于电路的隐匿求交方案相比,有三个显著的优点:
①更低的数据计算和通信成本。
研究团队的iPrivJoin方案,在模型训练过程中引入了不经意混洗(Oblivious Shuffle)技术,能够安全地剔除数据集中不相关的冗余数据,从而减少了后续模型训练过程中的数据量,这大大降低了模型训练的计算和通信成本。
对应在实际应用场景中,研究团队的iPrivJoin方案意味着各机构在进行数据共享建模的过程中,能够专注于“该用的数据”,排除“不相关的数据”,从而大幅降低数据传输、计算成本,提升多方数据建模的效果。
②更快的电路计算速度。
研究团队的iPrivJoin方案引入了一种新的私有编码(Private Encoding)技术,该技术可以避免在求交过程中执行传统昂贵且复杂的比较电路操作,既节省了成本,又加快了数据对齐的速度;
对应在实际应用场景中,不同机构之间可以更加高效地进行数据联邦建模,用更少的资源,做更多的数据模型训练。
③更优的数据混洗性能。
研究团队在上述基础上,创新性地改进了此前由微软提出的不经意混洗Oblivious Shuffle的方案。
Oblivious Shuffle是一种能够实现数据在不暴露隐私的前提下随机混洗的技术,研究团队提出的新方案(O-Shuffle)可以将部分随机掩码的生成操作从在线计算调整至本地计算,从而在处理高维数据时,大幅减少性能损耗。
iPrivJoin三个阶段的技术概述及举例说明
实验结果显示,研究团队提出的iPrivJoin方案,与直接使用传统的隐匿求交方案circuit-PSI相比,可以令后续建模过程获得大约3倍的加速;而在不经意混淆(Oblivious Shuffle)部分,研究团队的新方案O-Shuffle相较于目前微软最先进的方案,可以在WAN环境下实现约1.44倍的加速
复制链接获取论文:
https://ieeexplore.ieee.org/document/10159165

IEEE TIFS》(IEEE Transactions on Information Forensics and Security)是一个高影响力的学术期刊,专注于信息取证和安全领域的研究,由IEEE(Institute of Electrical and Electronics Engineers)出版,是该领域内的全球顶级期刊,目前谷歌学术评价该期刊在领域内影响力排名第二,仅次于安全领域顶级会议CCS(ACM Symposium on Computer and Communications Security)。




延/伸/阅/读
蓝象智联:隐私科技与数据要素生态服务商








由蓝象智联、西安电子科技大学、浙江大学联合撰写的论文入选国际顶级期刊《IEEE TIFS》!