量子位节选摘抄张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划

Posted UQI-LIUWJ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了量子位节选摘抄张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划相关的知识,希望对你有一定的参考价值。

1 前言

        去年谷歌DeepMind推出的AlphaFold 2,无疑将当下的AI技术与尚在探索的生物技术完美结合起来。

去年张亚勤从百度离开加入清华大学,成立清华智能产业研究院AIR。如今,短短一年,已有多名世界顶级科学家加盟AIR。

        在MEET2022智能未来大会上,张亚勤透露清华智能产业研究院在进行的重要科研项目之一,就是利用AI技术开发抗体、研究DNA序列、预测蛋白质结构等等。

        张亚勤认为,AI在新冠疫苗的研发过程中发挥了重要作用,堪称AI在生命科学实际应用中的重大事

2 演讲要点

2.1 关于清华大学智能产业研究院(AIR)

        清华大学智能产业研究院(AIR)使命是利用人工智能技术赋能产业升级,推动社会进步。

AIR的战略目标有三个:

  • 首先要培养人才,主要是具有国际视野的顶级架构师、未来的CTO;

  • 第二是实现核心的技术突破;

  • 第三是是希望AIR研发的技术能用到产业,给产业带来重大的影响

        我们选择了三个方向作为突破点:第一个是智慧交通,第二智慧物联IoT,第三智慧医疗。重要的还是ABCD(AI、大数据、云计算、设备)四个横向的技术领域作为基石

2.2 AI带来的生物数字化

  • 我们首先是经历内容数字化,后来到企业数字化,现在进入物理世界的数字化,和生物世界的数字化。我们的身体、大脑、器官、细胞、蛋白质和基因等都在数字化。

        AI在极大加速生命健康和生物医药领域的快速发展。以新药研发为例,目前要开发一种新药需要投入超过十几年的周期,花费数十亿美元,周期很长、费用极高。这样巨大的投入显然会对医药行业带来巨大瓶颈,AI正在改变这种状况。

        

  • 首先在基因编辑方面,AI+CRISPR可以更精准,更快的找到靶点
  • 另外,在大分子、抗体,以及TCR个性化疫苗和药物,还有最近AlphaFold在蛋白质三维结构解析方面的新进展,从序列到到结构功能,AI技术功不可没。

        AIR最近在研究的课题之一,就是怎样使高通量的生物实验自动化,把干实验和湿实验无缝连接起来,形成闭环,真正地加速整个制药和生命科学的发展。现在AI算法还是辅助,主要还是靠生物的湿实验。未来会有一种新的模式是AI驱动的,完全自动化所有环节的湿实验,里面没有任何人的参与,这个是比较困难的,也是一种新的尝试。

        在这点上一个非常形象的例子就是新冠疫苗的开发周期大幅度缩减。中国科学家在新冠病毒出现之后的第一时间,2020年1月份就找到了病毒基因的序列,三个月之后,蛋白质的结构就被解析出来了,此后一个月,病毒和人的交互的方式也解析出来了,去年底疫苗进入临床实验,今年开始大规模使用,不管是灭活疫苗,还是mRNA疫苗,这可能是人类历史上最快的一次用人工智能加速疫苗开发的例子。

         AIR彭健教授将迁移学习模型用做药物临床前的评估,和精准临床实验的设计

        我们知道人类很多疾病样本数据很少,但却积累了很多动物数据,用动物数据模型加上目前已有的人类肿瘤细胞系上的药物数据,运用可解释型的机器学习能很快迁移到人体内的药效预测任务上。

        从结果可以看到,彭健教授这种迁移学习方式对于三阴型乳腺癌患者设计的药物医药可信度提高5倍左右。

        彭健教授团队还把几何深度学习用到AI抗体的开发。       

        目前虽然蛋白质序列大幅度被解析出来了,但是其本身的形状几何结构还有很多的变化,他们想做的就是把蛋白质表面的几何表征用深度学习方法去表示出来,然后做抗体亲和力预测。 

        彭健教授最近也取得了一些新的进展,他创建的Helixon公司与清华大学医学院一起合作研发出全球首个AI设计的新冠抗体,这其实是一种新范式。病毒本身是一直在变化的,但通过综合分析抗体与抗原的相互作用,有效设计抗体可变区氨基酸序列,这样的抗体本身也是相对比较稳定,且对德尔塔、阿尔法、伽玛等突变株具有高效和广谱的病毒中和效果。

        AIR兰艳艳教授带领的学生在基因测序方面做了很多新的工作,并在今年的创新工场Deecamp竞赛中获得了冠军。

        我们已知基因10%是编码的,90%是未编码的,他们利用基因里的未编码部分,将这些数据用前沿的预训练技术构造了一个全新的模态。

2.3 AI和生物的壁垒

  • 人工智能和生命科学方面尽管有很多可以合作的地方,但是也有很多壁垒,两个行业是两类不同的语言体系,两类不同的科学家,很重要的是怎么样能把这两个行业无缝连接起来

2.3.1 AI赋能生命健康

        AI赋能生命健康领域包括三个层次:AI基础设施建设、数据平台搭建,以及AI算法引擎设计。

        最好的人工智能赋能生命科学的例子就是蛋白质预测模型AlphaFold2。AlphaFold2能够成功满足几个条件:

  • 第一点,它是一个well-defined problem,从蛋白质的氨基酸的序列到三维的结构的mapping;

  • 第二点,30年前就开始的CASP竞赛,每次竞赛有标准的数据集,每次解析出的蛋白质序列,大家都可以公开上传;

  • 第三点,数据本身是well-structured,AI新算法可以直接使用。

3 总结

  • 我们现在整个生物世界在走向数字化、自动化,也包括智能的科学计算,像分子动力学,薛定谔方程等,都会和AI相辅相成。

        这些进展,我们整个生命科学的生物制药会更加快速精准、更安全、更经济、更加普惠。但很多的挑战我们没有讲,比如算法的透明性、可解释性、隐私安全、伦理等,这些事情都需要我们关注。我相信未来十年是整个生物制药和人工智能融合的大好时机,也是行业发展的最大的机遇

以上是关于量子位节选摘抄张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划的主要内容,如果未能解决你的问题,请参考以下文章

李开复张亚勤巅峰对话,还有虚拟人自动驾驶论坛,今年MEET智能未来大会,我蚌埠住了...

MEET大会报名开启 | 李开复张亚勤等产学研大咖邀你共同见证智能未来

李开复张亚勤重磅对谈,顶级AI大咖齐聚共话未来,200万网友在线围观| MEET2022智能未来大会...

李开复张亚勤吴恩达…国际大咖给你讲解AI知识

李开复对谈张亚勤:科学家创业需要企业家伙伴,开放心态看待元宇宙 | MEET2022...

张亚勤:深度学习更近一步,如何突破香农冯诺依曼和摩尔瓶颈?