- +1
什么是人类蛋白质组?
DeepMind发布人类蛋白质组预测图,重要性堪比人类基因组。
人类蛋白质组 (Proteome) 就是人类所包含的所有蛋白质,类似人类基因组包含了所有人类基因那样。破译人类蛋白质的结构(可以理解为卷曲形状),对于生物学、医学,乃至整个生命科学具有无法估量的深远影响。
英国《自然》杂志22日发表了一项结构生物学重磅研究,世界知名人工智能团队深度思维(DeepMind)报告了“阿尔法折叠”(AlphaFold)对人类蛋白质组(人类基因组编码的所有蛋白质的集合)的准确结构预测。此次得到的数据集,涵盖了人类蛋白质组近60%氨基酸的结构位置预测,且预测结果具有可信度。
确定蛋白质的结构能为理解生物学过程提供宝贵信息,并有望指导药物研发。考虑到理解人类蛋白质组对健康和医药的重要性,研究人员付出了大量努力来确定这些蛋白质结构。
虽然开展了数十年的研究攻关,但通过传统实验方法确定的结构,只覆盖了人类蛋白质组17%的氨基酸——氨基酸是连接起来形成蛋白质的亚单位。利用传统实验方法解析结构需要克服诸多十分耗时的障碍,因此,扩大蛋白质组覆盖面仍是一项艰巨挑战。
此次,深度思维团队的研究人员利用前沿机器学习方法“阿尔法折叠”,确定了覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白)的蛋白质的结构。研究人员发现,“阿尔法折叠”能对人类蛋白质组58%的氨基酸的结构位置给出可信预测。其中,对35.7%的结构位置的预测达到了很高的置信度,是实验方法覆盖的结构数量的两倍。在蛋白水平上,“阿尔法折叠”对43.8%的蛋白的至少3/4的氨基酸序列给出了可信预测。
研究团队认为,大规模的准确结构预测将成为一种重要工具,让我们能从结构的角度解答新的科学问题,而“阿尔法折叠”的预测结果将帮助进一步阐明蛋白质的作用。
研究团队表示,“阿尔法折叠”的预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。
就在7月16日,深度思维公布了“阿尔法折叠2”的问世,就计算机方法而言,“阿尔法折叠2”能以前所未有的准确度根据蛋白质的氨基酸序列预测其三维结构。
“这是一本名副其实的世界蛋白质万年历。”DeepMind在博客中写道。
很多关注深度学习领域的朋友可能知道,DeepMind 多年前专为预测蛋白质结构而开发了 AlphaFold 算法。
DeepMind 刚刚公开了 AlphaFold 2 系统的相关论文和源代码。AlphaFold 2 被誉为“蛋白质折叠结构预测”这一生物学方面长达50年重要问题的当前最优解,将准确性平均分提升到了92.4(百分制),误差不超过一个原子的大小。
7月22日 Deepmind 发布的蛋白质组预测图,正是基于这项技术。
中国人类蛋白质组计划(Chinese Human Proteome Project,CNHPP)于2014年06月10日全面启动实施。这是中国科学界乃至世界生命科学领域一件具有里程碑意义的大事。
该计划是以中国重大疾病的防治需求为牵引,发展蛋白质组研究相关设备及关键技术,绘制人类蛋白质组生理和病理精细图谱、构建人类蛋白质组“百科全书”,全景式揭示生命奥秘,为提高重大疾病防诊治水平提供有效手段,为中国生物医药产业发展提供原动力。
CNHPP产生的大数据将全景式地揭示人体蛋白质组成及其调控规律,解读人类基因组这部“天书”。构建的人类蛋白质组生理和病理图谱,将准确呈现各种病理状态下蛋白质组的变化,揭示疾病的发病机制和病理过程,发现系列新型诊断标志物、治疗靶点和创新药物,为全面提高疾病防诊治水平提供新策略新手段。
2018年3月8日,Nature Communications在线发表了一项弥漫型胃癌蛋白质组研究最新成果。
文章首次描绘了弥漫性胃癌的蛋白质组全谱,绘制了胃癌的蛋白组“地形图”,为深刻理解胃癌分子机制提供了宝贵素材并为胃癌病人的精准医疗提供依据。
2019 年 2 月 28 日,早期肝细胞癌(early-stage hepatocellular carcinoma)蛋白质组研究成果在Nature上在线发表。
本篇文章首次描绘了早期肝细胞癌的蛋白质组表达谱和磷酸化蛋白质组图谱,发现了肝癌精准治疗的新靶点。
2020 年 7 月 9 日,国际顶尖学术期刊Cell在线发表了由中国科学家完成的大规模临床肺腺癌蛋白质组草图的绘制工作。在此项研究中首次对肺腺癌开展了大规模、高通量、系统性的全景蛋白质组学研究。
该工作首次大规模、系统性构建了肺腺癌的蛋白全景图和分子亚型特征,揭示了中国人肺腺癌的分子特征及预后和诊疗生物标志物,为肺腺癌的精准医疗提供了重要资源和线索。该工作是中国人类蛋白质组计划(Chinese Human Proteome Project,CNHPP)继肝癌、胃癌工作之后取得的又一重大成果,也是中国科学家主导的“蛋白质组学驱动的精准医学”的又一次重大突破,具有广泛的社会意义,更预示着蛋白质组学在精准医学中的独特性和重要性。
参考资料:
中国人类蛋白质组计划
https://baike.baidu.com/item/%E4%B8%AD%E5%9B%BD%E4%BA%BA%E7%B1%BB%E8%9B%8B%E7%99%BD%E8%B4%A8%E7%BB%84%E8%AE%A1%E5%88%92/14434840
登上Cell封面!上海药物所谭敏佳团队等完成大规模临床肺腺癌蛋白质组草图绘制
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司