麻省理工科技评论》认为,这一技术用AI解决了困扰生命科学领域近50年之久的蛋白质结构预测难题。为解决癌症、抗生素、乃至新冠防治等问题,打开了一条不同以往的技术捷径。
用AI预测蛋白质结构,始于2016年美国芝加哥丰田计算技术研究所教授许锦波的一项研究。许锦波毕业于中国科学技术大学计算机系,中国科学院计算技术研究所和加拿大滑铁卢大学,并在美国麻省理工学院数学系和人工智能实验室接受博士后训练。后担任美国芝加哥丰田计算技术研究所终身教授。近期,许锦波已经回到国内,为中国打造智能生命科学领域的“国家队”。通过AI技术与生命科学的融合创新、自研生物计算技术平台建设、跨学科复合型人才培养等方式,系统化推进学术研究与应用转化,打通中国智能生命科学从学术到产业的全链条。
众所周知,蛋白质是构成细胞的重要生命物质。理解蛋白质分子的组成及其折叠结构,就有望绘制出“生命地图”,对人类了解癌症、遗传病等诸多顽疾,以及进行更精准的药物开发,都至关重要。因此蛋白质结构预测被视为生物学的“圣杯”。
过去,科学家们主要通过物理和统计的方法预测蛋白质结构,难度极高且费时费力,导致该领域一直进展缓慢。在有“蛋白质结构预测领域的奥林匹克竞赛”之称的国际蛋白质结构预测竞赛(CASP,Critical Assessment of protein Structure Prediction)中,过去几十年,不同组别之间的精确度差别仅百分之几,几乎毫无突破性可言。
2016年,许锦波运用AI技术,为这一领域带来了颠覆性的变化。他研发的RaptorX-Contact方法,首次证明了深度学习方法预测蛋白质结构的可行性,引领了AI在蛋白质结构预测领域的突破。当年,这一方法在CASP上击败了来自全球的众多选手,获得第一,在生物界和AI界都引发了极大的关注和跟随,其中包括谷歌DeepMind团队。2020年,DeepMind将这一方法应用在AlphaFold的开发中,为其之后破解蛋白质预测难题奠定了重要的基础。
可以说,许锦波拉开了AI蛋白质结构预测时代的序幕,他也因此被业界誉为“AI预测蛋白质结构全球第一人”。因为在蛋白质领域的贡献,他多次被授予美国斯隆研究奖、美国自然科学基金早期职业奖、《PLoS Computational Biology》创新突破奖、国际计算生物学顶级会议 RECOMB 最佳论文奖和时间检验奖 (Test-of-Time Award)等荣誉,也是国际计算生物学官方期刊《Bioinformatics》的编委。