- +1
易珂 | 数据洪流中的摆渡人
在大数据与人工智能浪潮汹涌澎湃的今天,数据库技术作为信息时代的基石,正以前所未有的速度重塑着我们的世界。从互联网的海量点击到金融系统的逐笔交易,从社交网络的瞬时爆发到城市大脑的精密运转,数据的洪流日夜不息,冲刷着人类社会的每一个角落。

▲易珂
在这股汹涌的洪流深处,有一位年轻的摆渡人,他不仅擅长设计最高效的航道,让数据的价值得以在最短时间内抵达彼岸,更致力于构建更坚固的堤坝以抵御隐私泄露的浪潮。他就是香港科技大学计算机科学与工程系教授、大数据技术理学硕士项目主任——易珂。在他厚重的科研字典里,始终贯穿着一条清晰而坚定的主线——要做学以致用的科研。
在理论与实践的十字路口
1979年出生的易珂,与计算机的缘分始于少年时代的数理天赋。18岁时,凭借国际竞赛的优异表现,他被保送清华大学计算机科学与技术专业。
彼时,计算机专业已是国内最热门的专业之一,这里为易珂打开了通往计算机世界的大门。在清华的4年,是易珂夯实理论基础的关键时期,数学、算法、数据库原理等课程的学习,让他对计算机科学的底层逻辑有了深刻理解。“本科阶段学的那些基础知识,到现在做研究依然非常有用,尤其是跟数学、算法相关的内容,是我所有研究的根基。”多年后,易珂仍对清华的求学时光念念不忘,那些在图书馆啃读专业书籍、在机房噼噼啪啪敲击键盘的日子,不仅积累了知识,更培养了他严谨的科研思维和对学术研究的浓厚兴趣。
在清华,易珂并非是只顾埋头苦读的“书呆子”,他同时担任系科协主席,积极组织参与各种科研实践活动,并以优异的成绩和出色的社会工作获得清华大学特等奖学金。这种“理论学习+实践探索”的模式,让他早早意识到理论与实践结合的重要性。
2001年,本科毕业的易珂远赴美国杜克大学攻读计算机科学博士学位。正值美国数据库产业发展的黄金时期,甲骨文(Oracle)、微软、国际商业机器公司(IBM)三大巨头霸占全球市场,数据库理论研究也处于国际前沿。初到杜克大学,易珂深刻感受到国内外科研环境的差距:彼时国际主流科研圈子被美国的科研团队主导,而国内能在数据库顶会SIGMOD、VLDB发表论文的学者屈指可数。但这种差距并未让易珂退缩,反而成为他奋进的动力。
在杜克大学的5年是易珂科研理念成型的关键阶段。这所经常被人称作“南方哈佛”的学府,以其卓越的学术声誉和前沿的科研方向,吸引了全球的优秀学子。易珂师从两位偏重理论的教授,在导师的影响下,形成了“以理论的优美为核心,并向实际系统延伸”的研究思路。
理论计算机科学的研究常常是在黑暗中摸索。“理论这个东西,在做出来之前你是不知道能不能做出来的。”易珂坦言。这种不确定性,对任何研究者都是巨大的心理考验。
导师给了易珂一个重要建议:“做理论问题不要揪着一个问题死磕,要多角度审视,发现更多问题,这样遇到困难时才有更多解决思路。”这句话成为易珂日后指导学生的重要原则——拓宽视野、迂回前进,从不同角度审视问题。这不仅是一种研究方法,更是一种人生态度。
在当时,学术界还流行着一种倾向,即过分追求理论的完美性,而忽视了实际应用场景的复杂性。许多算法在数学上证明最优,但在真实的工程环境中却因不接地气或假设过于理想化而变得毫无用处。易珂对此深感忧虑。这一时期的磨砺,塑造出易珂独特的科研风格:他善于从实际的痛点出发,提炼出核心的数学模型,再用严密的逻辑推导出最优解,最后回归到系统中去验证。这种闭环的科研思维,让他的研究成果既有理论的高度,又有落地的温度。
在博士阶段,易珂展现出了惊人的专注力与洞察力。他将研究方向锁定在数据库理论与系统,早早在被誉为“数据界的奥斯卡”的数据管理国际会议(SIGMOD)上发表论文,成为同龄人中的佼佼者。博士二、三年级接连发表的高质量论文,不仅让他在国际数据库领域崭露头角,更让他坚定了在数据库领域深耕下去的决心。
2006年博士毕业时,易珂本可留美继续深造,但他始终怀揣着回国做研究的想法。这时国内数据库研究尚处于起步阶段,而香港作为连接内地与国际的窗口,科研环境成熟,已能参与到国际主流科研中。于是,易珂做出了一个影响职业生涯的决定:先在美国电话电报公司(AT&T)实验室做一年研究员,了解工业界的数据库发展现状之后,再赴香港科技大学任教。
在AT&T实验室的一年,让易珂走出了纯学术的“象牙塔”,近距离接触到工业界对数据库技术的实际需求——电信行业的海量数据处理、分布式系统的性能优化,这些实际问题让他更加坚定了“做有用的理论研究”的理念,也为他日后将理论成果落地产业埋下了伏笔。2007年,易珂正式加盟香港科技大学(以下简称“港科大”),开启了属于自己的科研新篇章。
站立浪潮之巅做“有用的科研”
香港是中国连接世界的窗口,而港科大的数据库研究已经走在亚洲前列。初到港科大,易珂得到了时任系主任倪明选教授的大力支持:一笔丰厚的启动经费,让他能够搭建自己的课题组;招生时的最高优先级,让他得以挑选到最优秀的学生,其中不乏“姚班”精英。“我的学生都是从国内外顶尖大学过来的,他们的天赋和努力,为课题组的发展打下了坚实的基础。”港科大浓厚的数据库研究氛围,为易珂提供了自由的科研环境。
“数据库是基础软件,是管理数据的核心工具,从个人、企业到政府,再到国家安全,都离不开数据库技术的支撑。”在易珂看来,数据库研究绝对不能是纸上谈兵,而是要扎根产业需求,解决实际问题。从港科大的科研起步开始,他便始终围绕产业发展中的核心痛点展开研究,在并行分布式SQL查询(结构化查询)处理、近似查询、差分隐私、安全多方计算等领域不断突破,用扎实的理论成果破解产业发展的技术瓶颈,实现从“理论创新”到“系统研发”再到“产业落地”的闭环。
2016年,易珂团队的近似查询研究摘得SIGMOD最佳论文奖,这是他第一次获此殊荣,而这项研究的起点,源自一次偶然的思想碰撞。有一次,易珂与合作者李飞飞(现任阿里巴巴集团副总裁)在国内参加论坛,返回的车上,两人针对大数据时代的查询效率问题展开讨论,仅仅半个小时便碰撞出了近似查询的核心想法。“当时就是突然的灵光一现,觉得这个思路可行,然后就商定下来,组织团队来实现。”易珂回忆道。

▲2025年,易珂团队在柏林参加数据管理国际会议(SIGMOD)时合影
看似偶然的灵感,实则是长期积累的必然。随着大数据时代来临,数据规模呈爆炸式增长,传统的精确查询方式耗时久、资源消耗大,已无法满足工业界的实时查询需求。易珂敏锐地意识到,在很多实际场景中,人们并不需要绝对精确的查询结果,允许一定误差的近似查询,能大幅降低查询开销,提升处理效率。基于这一需求,易珂团队开始了为期3年的研究,从理论模型的构建,到算法的设计与优化,再到系统的实现与测试,一步步将车上的灵感转化为成熟的研究成果。
这项研究的核心,是将采样技术应用于多表SQL查询,在误差可控的前提下,实现查询效率的大幅提升。此前,采样、数据勾勒等技术仅能应用于单表查询,而易珂团队的研究,首次将这些技术拓展到多表查询中,填补了领域空白。更重要的是,这项研究并非停留在理论层面,而是与产业需求紧密结合。李飞飞回国加入阿里后,将这项研究成果落地到阿里的产品中,让理论成果真正发挥了产业价值。“有些研究不是不能落地,而是需要合适的时机、环境和土壤。”易珂表示,近似查询的落地,让他更加坚信,理论研究只有与产业需求结合,才能真正体现价值。
如果说近似查询是易珂团队“理论联系实际”的初次尝试,那么并行分布式SQL查询处理的研究,则是他带领团队在大数据时代的核心突破。2015年至2020年,随着云计算的普及,分布式成为大数据处理的主流方式,而传统的单机SQL查询算法已无法适应分布式场景,一个未优化的SQL查询可能耗时数小时甚至数天,严重影响云端数据库的可用性。
针对这一产业痛点,易珂团队将研究重点放在了SPJA查询(由选择、映射、连接、聚合4个基本算子组成的常见SQL查询)上。这是SQL查询中最核心、最常用的类型,TPC-HBenchmark中的所有查询均为SPJA查询。易珂从理论入手,设计出一系列新的并行分布式算法,并从理论上证明了这些算法的最优性。与传统算法不同,易珂团队的算法充分考虑了分布式场景的特点,大幅降低了查询的时间和通信开销。
在理论创新的基础上,易珂并未就此止步,而是将理论成果落地到实际系统中。他们在Spark、Flink、Alibaba ADB等大规模分布式数据库系统中验证算法的有效性,将这些系统的SQL查询性能大幅提升。其中,与阿里云合作研发的SPJ查询采样技术,将估计误差降低3%至80%,相关成果发表于SIGMOD 2021,并集成至阿里云原生数据仓库AnalyticDB系统的优化器中,成为阿里云数据库的核心技术支撑之一。此外,易珂团队开发的Cquirrel系统原型,支持分布式SQL连续查询,获发专利,目前正由阿里云数据库工程团队进行产品化。
这项研究的科学意义,在于填补了并行分布式场景下SPJA查询研究的空白。过去50年,数据库领域对SPJA查询的研究主要集中在单机环境,而易珂团队的研究,将这一研究拓展到分布式场景,为云计算时代的数据库查询处理提供了新的理论和方法。正如国际同行的评价:“易珂团队的大规模并行算法在近似关联查询上达到了最优性。”这项研究也让易珂团队成为国际分布式数据库查询处理领域的领军团队之一。
随着数据安全和隐私保护的重要性日益凸显,《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等法律法规相继出台,数据隐私保护成为数据库领域的重要研究方向。2019年起,易珂团队将研究重点转向差分隐私和安全多方计算,这也是他近5年来投入精力最多的研究方向。
差分隐私是目前业界通用的隐私保护标准,其核心是在查询结果中加入符合要求的随机噪声,从信息论层面保证个人数据无法被反推。但早期的差分隐私研究主要集中在单表选择查询,对于连接、聚合等算子的支持十分有限,关键难点在于这些算子会让查询结果的敏感度变得无限大,使得传统的差分隐私机制无法工作。易珂团队提出了“实例最优性”这一理论框架,将其与采样、连接算法等技术结合,成功应用于一大类SPJA查询,在同样的隐私约束下,大幅降低了查询结果的噪声,且无需任何先验知识。2022年,这项研究摘得SIGMOD最佳论文奖,这是易珂第二次获此殊荣,也是国际数据库领域对其研究成果的高度认可。
此外,易珂团队还针对“信息孤岛”问题,开展了安全多方计算的研究。在实际场景中,多方各持有一部分数据,因法律法规或商业利益无法共享,但很多计算任务需要多方数据协同完成。姚期智院士提出的安全多方计算理论框架,为解决这一问题提供了思路,但现有方案针对SQL查询的效率极低。易珂团队将数据库理论与密码学结合,设计出针对SQL关键算子的安全多方计算协议,将查询效率提升5个数量级以上,并与阿里云合作开发了原型系统,在云环境下进行了初步部署。
尽管目前差分隐私和安全多方计算在国内的商业落地还面临着隐私保护意识不足、技术实现复杂度高等问题,但易珂坚信,随着社会的发展和技术的进步,这两个领域的需求将迎来爆发式增长。“现在国内的身份证、医疗系统等都实现了互联,数据隐私保护的需求越来越强烈,我相信两到三年内,差分隐私和安全多方计算技术会实现大范围的应用。”易珂说,他的研究始终着眼于产业的未来需求,为产业发展提前筑牢技术根基。
20余载科研路,易珂带领团队在数据库领域取得了一系列国际顶尖成果:2个SIGMOD最佳论文奖、2个SIGMOD最佳论文提名、4个SIGMOD研究亮点奖、1个PODS时间检验奖;开发了Quorion、DPSQL、SparkSQL+等多个系统原型;多项研究成果落地阿里云等产业平台;他本人于2025年当选国际计算机学会会士(ACM Fellow)。这些成果的背后,是他始终坚持“做有用的科研”的理念——从产业需求中寻找研究问题,用理论创新解决产业痛点,让理论成果走出实验室,照进产业实践。
亦师亦友携手未来
从2000年前后国内数据库产业完全依赖美国,到如今仅次于美国稳居世界第二,中国数据库产业的20余年,是一部奋起直追的发展史。而易珂,正是这场发展浪潮中的重要参与者和推动者。
作为一名在香港任教的内地学者,易珂始终以“桥梁”的身份,连接着内地与国际的数据库研究,推动着中国数据库领域的国际化发展。他多次受邀在国内高校做讲座、开展交流,将国际前沿的数据库理论和技术带回内地。
易珂同时也清醒地认识到,中国数据库领域与美国仍存在一定差距,尤其是在核心技术的原创性和高端人才的培养方面。“现在国内的论文发表数量已经很多了,但在一些核心理论和关键技术上,还需要更多的原创性突破。同时,数据库领域的高端人才还比较紧缺,需要更多的年轻人投身这个领域。”
“学生培养这一块,我还是挺自豪的。”谈及自己的学生,易珂的语气中满是欣慰。在港科大,易珂的团队规模并不大,但培养出了多位活跃在国内外的优秀学者。有的成为国内外高校的教授,有的成为产业界的中坚力量。这些学生如同撒向数据库领域的种子,在各自的岗位上发光发热,而这一切,都离不开易珂独特的“放养式”培养理念。
这里的“放养”,并非放任自流,更不是不负责任。相反,它是一种基于高度信任与尊重的教育哲学。易珂的课题组,从来不是“导师说了算”的一言堂,而是“激发学生主观能动性”的开放式平台。他招生不多,一般同时只带五六名学生,相比于一些大团队的“批量培养”,他更注重“精耕细作”,为每个学生投入足够的时间和精力。“每个学生的论文、代码,我都会仔细看;对算法的设计、证明经常会一字一句的修改;他们有问题,我会马上回答,但我不会主动推着学生走,更不会给他们定死研究方向。”
在易珂看来,数据库研究尤其是理论研究,需要活跃的思维和独立的思考能力,有天赋的学生更需要自由的科研环境。“我希望学生能自己发现问题、提出问题、解决问题,而不是跟着我的思路走。只有这样,他们才能真正培养起科研能力,未来才能独当一面。”

▲易珂(前排右二)与学生合影
在易珂的课题组,学生可以自由选择研究方向,只要是感兴趣的、有价值的问题,他都会给予支持。他会与学生一起讨论问题,提供理论指导和研究方法,但不会干涉学生的具体研究过程。这种“放养”,让学生的主观能动性得到了充分发挥,也让他们的科研思维更加活跃。
易珂与学生之间亦师亦友。初到港科大时,他与学生的年龄相差仅四五岁,经常和学生一起在食堂吃饭、一起讨论问题,这种平等的交流方式,让学生敢于表达自己的想法。即便是现在,他依然保持着与学生密切交流的习惯,实验室的头脑风暴,是课题组的常态。“科研不是一个人的事,而是团队的事。很多好的想法,都是在与学生的讨论中碰撞出来的。”易珂说,他的很多研究成果,都离不开学生的努力,学生的创新想法,也为他的研究带来了新的视角。
在培养人才的过程中,易珂始终坚持“理论与实践结合”的理念,鼓励学生走出实验室,了解产业需求。他会推荐学生到阿里、字节、华为等企业实习,让他们近距离接触工业界的实际问题;他会带领学生与产业界的专家合作,让他们在项目中提升实践能力。这种培养方式,让他的学生不仅具备扎实的理论功底,更拥有较强的实践能力,无论是进入学术界还是产业界,都能快速适应岗位需求。
除了培养博士生,易珂还担任港科大大数据技术理学硕士项目主任,致力于培养大数据领域的应用型人才。在课程设置上,他注重“理论+工程+产业应用”的结合,开设了数据科学、数据库、分布式系统、AI、金融科技等课程,让学生不仅掌握理论知识,更能掌握实际操作技能。他多次获得港科大最佳教学奖,他的课程深受学生欢迎,培养的硕士毕业生,成为香港和内地大数据领域的重要人才储备。
易珂的科研生涯,是中国年轻一代学者崛起的缩影。他们扎根中国大地,放眼全球视野,用最前沿的技术解决最实际的问题。他们不浮躁、不功利,坚守学术良知,勇担时代使命。在未来的数据库科研道路上,还有无数的难题等待着去破解,无数的价值等待着去挖掘。易珂愿意在数据的洪流中,继续做一名坚定的摆渡人,探索数据库技术的新边界,用智慧和汗水书写属于自己的精彩篇章。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




