2023年以来,智能大模型成为一个热词,也成为赋能各个行业的一个重要工具。而生物科学作为可高度数字化的系统,具备可解读、可编程的特性,成为智能大模型赋能的一个重要领域。目前,将大模型应用在生物数据上,构建AI蛋白质生成大模型,提升蛋白质设计的效率和成功率等,成为大模型支持生物医药、合成生物等产业创新发展的重要方向。大模型正在推动产业级蛋白质设计进入“智能生成时代”。 蛋白质是生命的基础,是生命活动的主要承担者。临床使用的胰岛素、单克隆抗体、干扰素等都是蛋白质药物。测定蛋白质结构和优化、设计蛋白质对于创新药研发、合成生物学等领域发展意义重大,也是生物学界最棘手的问题之一。2023世界人工智能大会上,分子之心公司创始人兼首席科学家许锦波和团队打造的业界首个AI蛋白质生成大模型“达尔文(NewOrigin)”正式亮相。其是集成序列、结构、功能和进化的产业级AI蛋白质生成大模型,也是面向生物经济时代的基础设施级底层大模型,可实现高效的、功能驱动的蛋白质生成能力。 据介绍,达尔文大模型是集成序列、结构、功能和进化的产业级AI蛋白质生成大模型,也是面向生物经济时代的基础设施级底层大模型,可实现高效的、功能驱动的蛋白质生成能力,支持生物医药、合成生物等产业创新发展。其可根据结构和功能需要,直接生成具有特定功能的蛋白质,满足蛋白疫苗、抗体、酶、多肽等多种类蛋白质设计,可低门槛、高精度地解决大分子药设计、新生物材料研发等产业中特定功能蛋白质的生成难题。 据了解,2016 年,许锦波提出首个AI蛋白质折叠算法,证明了深度学习预测蛋白质结构的可行性。2019年,许锦波率先将研究范围扩展至AI蛋白质优化与从头设计,通过整合结构预测、侧链预测等多种技术,结合多种场景需求,实现了十余项领先的核心技术突破,实现了蛋白预测、蛋白优化、蛋白从头设计的产业应用,如抗体的从头设计、蛋白疫苗的稳定性优化、酶的热稳定性的优化等。 相比目前的主流方法,达尔文大模型实现了高成功率、高普适性和低使用门槛,可以大幅度降低实验测试以及后续的药物开发和合成的费用和时间,并能优化和设计多种类型的蛋白质。同时,通过实现基于自然语言的交互方式,没有AI背景的科学家也可以非常容易地通过描述一个蛋白质的功能来设计它。 例如,提升蛋白疫苗稳定性是提升蛋白质疫苗效果的重要途径之一。传统实验室方法通常要耗费数月甚至数年时间,还要投入大量资金。而分子之心正与合作药企联合攻关,基于大模型仅需要几天就可设计出数十个理想的候选蛋白,而且相关性质大幅提高。 许锦波表示,大模型的出现将大大加速蛋白质生成技术的发展进程,并推动其在生物医药、合成生物学等领域应用,进而改变生物经济的格局。分子之心正在推进AI蛋白质生成大模型的快速迭代,进一步将大模型的能力在药物设计、生物育种、环境保护、高性能材料等多个领域广泛落地,推动创新蛋白质材料、易降解且能循环使用的环保材料、无毒无残留的绿色农药等产品创新。 来源:新华网 |