中国科学院计算技术研究大数据研究学院

员工活动 | 邮箱登录 | 加入收藏
 
组织架构 当前位置: 网站首页 » 组织架构 » 李明院士办公室

李明院士办公室


图片8.jpg

 

        背景:自2019年,在郑东新区及省市相关单位支持下,数研院筹建了面向大数据生命健康等高新科研方向的基础科研团队;2021年4月27日,在中原科技城管委会(智慧岛)举行了院士办公室揭牌仪式,在数研院正式挂牌。

        方向:面向人类健康和自然语言处理的深度学习技术及在大数据处理方向的应用,对生命健康科学及生物医药研发工作具有跨越式的支撑作用,是相关产业的前沿核心关键技术。

        规划:科研内容为免疫抗体的空间结构预测,免疫抗体药物得临床应用及相关健康大数据分析技术,面向深度语义理解的自然语言处理技术。

        愿景:形成以大数据辅助生命健康领域及示范应用为导向的科技研发、高端人才培养和产业孵化高地,力争产出更多相关成果。


一、专家介绍

图片7.jpg

        李明 院士,是加拿大皇家学会(The Royal Society of Canada)院士、未来科学大奖科学委员,ACM 及 IEEE Fellow, Killiam Fellow,Canada Research Chair (Tier I),曾获McGuffey Longevity Award。2010年获得加拿大顶级国家科学奖Killiam Prize(迄今唯一获此奖项大陆华人)。李明院士在美国康奈尔大学获得博士学位,现为加拿大滑铁卢大学校级教授 (University Professor),教育部长江讲座教授,清华大学客座教授,北京大学客座教授。他是研究Kolmogorov复杂性的世界权威专家,在研究机器学习,自然语言处理,算法平均复杂度、信息距离,和生物信息学方面解决了多个几十年未解难题,开创了新的研究领域,做出了重大贡献。他的著作“An introduction to Kolmogorov complexity and its applications”已经出了第4版,在世界上被誉为经典,广为引用。此外,李明院士还是清华大学智能产业研究院2021智源大会AI赋能生命健康与生物医药论坛及2021未来科学大奖论坛等主讲嘉宾。

 图片6.jpg

        卜东波 研究员,卜东波:博士,博士生导师,健康大数据研究中心(筹)主任,中科院计算所研究员、前瞻研究实验室学术主任。研究方向:计算机算法、生物信息学(蛋白质结构预测、糖结构鉴定)。在Nature Communications、NAR、AC、RECOMB/ISMB等期刊和会议发表论文多篇,开发了蛋白质结构预测软件ProFOLD,性能超越AlphaFold,正努力赶超AlphaFold2;开发糖结构鉴定软件GIPS,可准确鉴定糖的类型和结构。

 

二、科研成果

1、高精度蛋白质结构预测服务器ProFOLD

图片5.png

        卜东波研究员团队在Nature 子刊发表相关科研成果:FALCON蛋白质结构预测算法ProFOLD,FALCON (Fragment-HMM approximating local bias and consensus)是一种新的优化框架,能够大大降低搜索空间的大小,而经典的Monte Carlo与Local search始终维持一个相对较大的搜索空间,实验结果表明这种降低搜索空间大小的技术能够有效地提高搜索成功的可能性。根据相关成果研发了高精度蛋白质结构预测服务器ProFOLD,性能超越AlphaFold(即打败围棋世界冠军李世石那个阿尔法狗的公司产品)达到了世界先进水平,已为全世界相关科研人员提供了10余万次稳定的蛋白质结构预测服务;正努力进行下一步科研攻关,努力赶超AlphaFold2达到世界领先水平,具备每天提供1000次高精度蛋白质结构预测服务能力。

2、部分论文及学术交流

BMC Bioinformatics:

1. FALCON2: a web server for high‑quality  prediction of protein tertiary structures(FALCON2:高质量的web服务器蛋白质三级结构的预测);

2. Filling gaps of genome scaffolds via probabilistic searching optical maps against assembly graph(填补基因组折叠的缺口通过概率搜索光学地图反汇编图);

Nature Communications:

1. s41467-021-22869-83.CopulaNet直接学习剩余协同进化蛋白质的多重序列比对结构预测CopulaNet Learning residue co-evolution directly from multiple sequence alignment for protein structure prediction;

2. FALCON蛋白质结构预测算法ProFOLD;

3. Frontiers in Chemistry:HepParser一种只能软件破译程序低分子肝素基论质谱;

其他学术交流:

1.FALCON-2020-to-Kristine2《ProFOLD: 基于人工智能技术的蛋白质结构“从头预测”方法》演讲;

2.Nat. Commun.| CopulaNet:直接从多序列联配中学习残基间距离以“从头预测”蛋白质结构;

3.ProFOLD:普通笔记本电脑3小时跑完的蛋白质结构「从头预测」努力赶超AlphaFold2;

4.权威专家再谈AlphaFold2: AI是否会带来结构生物学的“大革命”?

图片4.jpg


三、科研方向:蛋白质抗体设计与T细胞疫苗研发

        概述:2021年全球大势来看,新批准药物里有50%以上都是抗体药。抗体药需要设计抗体,需要巨大的抗体库,需要高精度蛋白质结构预测,而李明院士团队恰恰有这样的抗体库,卜东波研究员团队在逐步突破蛋白质结构高精度预测技术,全世界质谱仪相关领域软件约70%在用李明院士团队相关体系。高精度蛋白质结构预测的另一个应用方向是T细胞疫苗研发。T细胞疫苗是指用于治疗某些自身免疫疾病T淋巴细胞或用于治疗病毒性疾病的T淋巴细胞(T cell vaccination缩写CTL)。为什么要做T细胞疫苗?众所周知,目前b细胞疫苗在广泛应用,例如咱们的新冠灭活疫苗,国药、科兴这些。b细胞疫苗接种后会产生抗体,但抗体不是特别强,过一段时间,尤其病毒发生变异后不是那么抗变异。但是,T细胞不一样,它抗变异,半衰期长达7年14年,可以跟b细胞的抗体形成一种互补,持续在血液里提供对病人的保护。

        目标:卜东波研究员团队蛋白质结构预测服务器将逐步达到并赶超AlphaFold2水平。AlphaFold2主要是不变区域的预测,对蛋白质抗体可变区域的设计其实是非常差的,而可变区域预测才是蛋白质抗体设计的关键!卜东波研究员团队在逐步突破这样的技术,起码有了突破的可能。

        前景:高精度蛋白质结构预测服务器的领先优势将应用于蛋白质抗体设计与T细胞疫苗研发等,提供针对新冠肺炎、肝炎、艾滋病等生物医药制药等的科研支撑服务。

        团队:李明院士指导,卜东波研究员牵头,张海仓副研究员等及若干算法工程师。

图片3.png

        张海仓 中科院计算所副研究员,博士。曾任哥伦比亚大学博后科学家和字节跳动高级算法工程师。目前研究兴趣包括生物信息学(智能药物设计、蛋白质设计、计算基因组学、蛋白质结构预测等)和深度学习算法。研究论文发表在Nature Communications, Bioinformatics等期刊。主要成果包括:1.开发了基因组变异-疾病预测软件MVP和gMVP,显著提高了基因组变异解释的准确性;2.开发了蛋白质结构预测软件COLORS、clmDCA和ThreaderAI,提高了蛋白质结构预测的精度。

 

四、科研方向:AI赋能癌症个体化免疫治疗

        概述:2021年,120万一针清零癌细胞的新闻刷屏,让老百姓开始关注到CAR-T等癌症免疫疗法。CAR-T疗法就是嵌合抗原受体T细胞免疫疗法,英文全称Chimeric Antigen Receptor T-Cell Immunotherapy。CAT-T疗法仅仅是免疫治疗的一种单一靶点治疗模式,所以目前主要应用于白血病等血液类单一细胞癌变类癌症,对于实体瘤癌症应用还在临床试验阶段。而个体化免疫治疗未来会针对每个人实现因人而异的个性化治疗,而这需要大数据AI深度学习算法体系的搭建。

        目标:实现大数据AI赋能癌症个体化免疫治疗的普遍应用支持。

        前景:高通量时代大数据AI干实验必然将辅助并逐步取代传统湿试验,AI赋能癌症个体免疫治疗有望实现癌症痊愈。核心关键在于,高效精准识别足够多的新抗原(新抗原neoantigen,是指肿瘤细胞提呈的可激活T细胞的抗原)。

1.为何要多靶点?

        肿瘤突变众多,必须多靶点对治。

2.为何要个体化对治?

        大量研究显示,肿瘤患者的新抗原突变呈现高度个体差异性,每个患者都各不相同,很难用固定的单个或多个靶点来包含众多患者。因此“见招拆招”的个体化新抗原疗法是回归到肿瘤异质性的本质了。2017年7月,《Nature》同期刊登两篇重磅研究,证明新抗原疗法的有效性。美国丹娜法伯癌症研究院Catherine Wu教授团队:6名术后复发的黑色素瘤患者,经个体化多靶点DC疫苗治疗32个月后,肿瘤全部消失且无复发。德国约翰内斯古腾堡大学医学中心的Ugur Sahin教授团队:13名晚期黑色素瘤患者,经个体化多靶点DC疫苗治疗26个月后,13人全部达到肿瘤全部消失且无复发。

团队:李明院士牵头,卜东波研究员、孙世伟副研究员等及若干算法工程师

图片1.png

孙世伟 中科院计算所前瞻研究实验室副研究员、CCF生物信息学专业委员会委员、Frontiers in Oncology, Big Data and Cancer Glycomedicine专刊副主编。目前主要研究方向包括计算糖组学,机器学习算法研究、生物信息学等。已在国际核心期刊和会议上发表论文60余篇。担任领导的计算糖组学研究组作为中国唯一团队参与NIST组织的糖组学协同研究。主持多项国家基金,北京市自然基金,地方基金项目等。


五、大事记

1. 2019年底,在计算所老所长李国杰院士亲自指导下及郑东新区、省市相关单位支持下,数研院与国际知名的生物信息学专家、加拿大皇家学会李明院士团队签约共建院士工作站。

2. 2020年,数研院联合郑州大学等每年联合培养10余名硕士研究生,卜东波研究员牵头孙世伟副研究员、张海仓副研究员团队,进行生物信息、医学等交叉学科科研及相关人才培养,发表多篇生物信息学相关科研成果,10月数研院受邀河南省院士专家工作促进会常务理事单位。

3. 2021年4月,中科大数据研究院院士办公室揭牌暨李明院士报告会顺利举办。

01.jpg

4. 李明院士受邀清华大学“人工智能赋能个体化癌症免疫治疗”主题报告。

5.2021年5月,Nature 子刊发表蛋白质结构预测算法ProFOLD服务器,性能努力赶超AlphaFold2,此突破是李明院士办公室在数研院成立后第一个重要成果。

6. 2021年10月12日,院士办李明院士等一行6人受邀到访到郑州大学国家超算郑州中心,围绕前沿科学研究、人才培养、社会服务等方面与30余专家学者座谈。

7. 2021年11月8日,李明院士、卜东波研究员等再次与郑大一附院生物细胞治疗中心张毅教授团队深入交流,启动癌症免疫治疗新抗原人工智能筛查AI深度学习模型训练等项目。

8. 2021年11月19日,2021未来科学大奖科学峰会期间,李明院士受邀以未来科学大奖科学委员会委员、滑铁卢大学校级教授身份,做《深度学习赋能高精度免疫肽段组学和个体化癌症免疫治疗》主题演讲。

9. 2021年11月-12月,郑州市博士后创新实践基地申报通过初审、专家评审、实地考察等,与郑大国家超算郑州中心(牵头郑大一附院、信工院协同)签署合作协议,进行院士工作站、博士后工作站实践基地等建设合作及相关科研与生物信息交叉学科硕、博、后高端人才联合培养。

 




豫ICP备19023555号-1 】@ 中科大数据研究院 版权所有
0.803913s