澎湃Logo
下载客户端

登录

  • +1

EUSIPCO 3MT首位中国冠军,博士生借助噪声扰动算法打破数据流动壁垒

2021-06-06 10:26
来源:澎湃新闻·澎湃号·湃客
字号

机器之心专栏

作者:Mike Lee

近日,欧洲信号处理协会 EURASIP 官网公布了 EUSIPCO 2020 3MT 比赛结果,丹麦 - 奥尔堡大学的中国博士生李琼秀(Qiongxiu Li)荣获冠军。

EUSIPCO 会议(European Signal Processing Conference)是欧洲信号处理协会(EURASIP)每年一度的旗舰会议,同时也是欧洲信号处理领域影响最大的会议。会议涵盖信号处理研究和技术的最新发展,这些研究和技术将对计算机视觉、语音处理、人工智能和机器学习等诸多领域产生重要影响。

EURASIP官网:https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172

年度三分钟论文比赛( 3MT-Three Minutes Thesis contest)于 2015 年由 EURASIP 在法国尼斯首次举办,之后每年举办一次。在 EUSIPCO 年度会议期间,邀请拥有优秀研究成果的博士候选人,以博士期间的研究工作或论文成果进行 3 分钟的论文答辩演讲。

今年来自丹麦 - 奥尔堡大学的李琼秀(Qiongxiu Li)凭借论文答辩演讲「Privacy-Preserving Distributed Signal Processing」 获得了 3MT 比赛冠军。李琼秀是第一位获得冠军的中国学生。

官方证书:https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172

相关成果是分别发表在 IEEE. Trans. on Information Forensics and Security、 IEEE. Trans. on Signal Processing 的《Privacy-Preserving Distributed Processing: Metrics, Bounds and Algorithms》以及《Privacy-Preserving Distributed Optimization via Subspace Perturbation: A General Framework》的两篇一作论文。

研究内容

李琼秀的博士研究课题为「如何在保证用户隐私的前提下在分布式系统中做去中心化计算」。 以机器学习在医疗健康领域的应用为例: 机器学习有一个基础前提是数据越多就越有可能学习出性能更好的机器学习模型,比如可以更准确地进行早期诊断以预测癌症等疾病。因此很多医学工作者都有与机器学习研究者合作的意愿,通过分享病人数据来学习出更好的模型。但这种合作往往很难达成甚至是不合法的,因为共享数据侵犯了病人的隐私。在隐私保护的限制下,各个企业机构形成了数据孤岛,没有办法做到资源共享合作双赢。隐私保护安全计算就是为了解决这个矛盾, 目标是打破数据流动壁垒,研究如何在保证用户隐私的前提下实现合作双赢。这是一门交叉学科,涉及到数据科学,信息论,密码学,优化,分布式系统等多个学科,也有很多重要的应用,例如云计算、区块链、分布式计算网络等。

该研究方向还有一些细化的子领域:比如整个系统可以划分为中心化和去中心化系统。图左是一个中心化系统,首先所有用户把自己的本地数据(或者一些从本地数据上学习出来的模型参数,比如联邦学习的设定)发给共同信任的第三方(比如某些权威机构),由第三方统一计算后再把全局模型发回给各个用户。这种中心化系统有很多弊端比如拓展性不高,系统安全性完全依赖于第三方,而且很难找到共同信任的第三方。图右是一个去中心化系统,顾名思义就是为了解除对第三方的依赖,形成一个点对点(p2p, peer to peer)的对等网络。由系统内部每个用户的共同协作来完成全局计算,这样的系统灵活性高,鲁棒性和拓展性也很强。

目前比较流行的解决隐私安全的方法有差分隐私(differential privacy) 和安全多方计算 (secure multiparty computation)。李琼秀在博士期间提出了新的保护隐私的去中心化计算方法:基于分布式优化的子空间噪声扰动算法。其主要思想是通过添加扰动噪声在一个特定的由网络拓扑结构确定的子空间里保护隐私。这个算法有很多优点:相比于差分隐私,它的优点是不需要在隐私和算法准确度之间权衡取舍;相比于安全多方计算里的同态加密(homomorphic encryption)和秘密共享 (secret sharing) 技术,该算法的优点是计算和传输复杂度都很小。

论文链接:https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en

此外,李琼秀提出在分布式计算系统中使用互信息量来度量隐私和结果可用性(privacy&utility),讨论它们的上下边界,并系统地分析了多种算法的特点,包括安全多方计算,差分隐私和子空间扰动。该论文指出隐私的下边界是连接这三种算法的核心,并且基于隐私的下边界可以制定出一些原则和建议来帮助用户选择合适的隐私保护分布式计算方法。

论文链接:https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en

个人简介:李琼秀于 2015 年本科毕业于东北大学(秦皇岛)电子信息工程专业(排名 1/145), 于 2017 年硕士毕业于韩国仁荷大学(全额奖学金),之后于 2018 年 3 月前往丹麦奥尔堡大学攻读博士学位,预计在 2021 年 9 月完成博士答辩。博士期间导师分别是丹麦 - 奥尔堡大学 Mads Græsbøll Christensen 教授和荷兰 - 代尔夫特理工大学 Richard Heusdens 教授。

参考链接:

https://www.eurasip.org/index.php?option=com_content&view=article&id=150&Itemid=1172

https://sites.google.com/view/qiongxiuli/home

https://scholar.google.com/citations?user=ObH3SIoAAAAJ&hl=en

原标题:《EUSIPCO 3MT 首位中国冠军,博士生借助噪声扰动算法打破数据流动壁垒》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈