AI与蛋白质设计碰撞,上海交大团队成果引领生物医药变革 上海交大洪亮教授团队发布重大成果:让蛋白质设计告别“试错时代”

上海交通大学洪亮教授团队发布的最新科研成果,该团队将AI与蛋白质设计改造相结合,建立了全球最大的蛋白质数据集,并基于此开发出Venus系列模型,还配备了相关自动化一体机,实现了蛋白质设计的精准高效,部分成果已落地产业化。

今日上午,上海交通大学洪亮教授团队公布了一项令人瞩目的最新成果。他们创新性地将AI技术与蛋白质设计及改造深度融合,成功建立起了全球规模最大的蛋白质数据集。基于这个庞大数据集所训练出来的模型,能够精准且高效地对蛋白质的功能进行预测和设计,实现了蛋白质生产从传统“缓慢的试错”模式向“高效率的精准设计”模式的重大转变。

当提及蛋白质时,人们的第一反应往往是肉、蛋、奶等食物中富含的蛋白质,它们能为人体提供必要的营养。然而,天然蛋白质往往难以直接发挥理想的功能,要使其成为满足各种应用需求的产品,就必须对其功能进行设计和改造。但这绝非易事。一款性能出色的蛋白质产品的诞生,通常需要专家具备丰富的经验,并且要配合数以万计的实验试错。长期以来,蛋白质设计改造过程中存在的时间长、成本高、试错密集等问题,一直是业界公认的普遍性难题。

AI与蛋白质设计碰撞,上海交大团队成果引领生物医药变革 上海交大洪亮教授团队发布重大成果:让蛋白质设计告别“试错时代”

洪亮在发布会上介绍科研新成果

洪亮教授在发布会上详细介绍了这一科研新成果。他指出:“蛋白质是由氨基酸序列构成的,氨基酸序列的长度从数百个到上千个不等。在AI时代,数据是推动技术进步的核心资源,庞大的蛋白质序列数据集为AI模型提供了丰富的‘学习材料’,能帮助模型更好地理解蛋白质的序列、结构和功能关系。”该团队建立的蛋白质序列数据集Venus – Pod(Venus – Protein Outsize Database),含有近90亿条蛋白质序列,包含数亿个功能标签。这不仅是全球数据规模最大、功能批注标签最多的数据集,其体量更是另一行业知名模型——美国ESM – C模型训练用的21亿蛋白质序列的4倍。这意味着由中国科研人员创立的这个数据库就像是一座巨大的“蛋白质矿藏”,为人类挖掘新的蛋白或者生物催化剂提供了可能,将有力推动生物医药和合成生物学的快速发展。

与此同时,配合Venus系列模型的全球首款低通量大体积蛋白质表达、纯化与功能检测自动化一体机也应运而生。这台一体机可在24小时内不间断地完成100余个蛋白质的表达、纯化与检测任务,较人力效率提高近10倍。它的出现,将大大减少研发过程中的人力、物力和时间成本投入,显著提高蛋白质工程与合成生物学研究的效率。

洪亮教授还介绍,Venus系列模型具备两大核心功能,即“AI定向进化”与“AI挖酶”。所谓“AI定向进化”,是指Venus系列模型能够对一个原本不尽如人意的蛋白质产品的多种性能进行优化,使其成为一个满足多方面应用需求的“六边形战士”。而“AI挖酶”则是基于其海量的未知功能蛋白质数据集,如同“海选超能力战士”一般,精准发掘出具备超常规功能、能满足苛刻应用需求的蛋白质,比如极度耐热、极度耐酸、极度耐碱、极度耐胃肠消化等。这些具备超常规功能的蛋白质在生物技术、医药研发和工业生产中具有巨大的应用潜力,有望为相关领域带来创新和突破。

据悉,经过Venus系列模型设计的多款蛋白质已经实现了落地产业化,未来将助力阿尔兹海默等疾病的诊断,为人类健康事业贡献力量。

上海交通大学洪亮教授团队将AI与蛋白质设计改造结合,建立全球最大蛋白质数据集,开发Venus系列模型和配套自动化一体机,解决了蛋白质设计改造的难题,提高了效率。Venus系列模型的两大核心功能极具应用潜力,且部分成果已产业化,有望在生物医药等领域带来突破和创新。

原创文章,作者:东京迎荷,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/3318.html

(0)
东京迎荷东京迎荷
上一篇 2025年3月22日
下一篇 2025年3月22日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注