北京时间1月9日,复旦大学附属华山医院郁金泰、毛颖团队与类脑智能科学与技术研究院程炜、冯建峰团队联合攻关的交叉研究成果,登上《细胞》(Cell)杂志2025年开年封面。
杂志介绍:“该研究纳入了1706种人类疾病与表型,绘制出一张全面的蛋白质组图谱,并借助机器学习模型,成功挖掘出极具潜力的疾病预测诊断生物标志物和治疗靶点,为精准医学实施奠定了基础。”
该封面图融合了科学与艺术,生动展现了一个由蛋白质分子构成的人体可以利用基于芯片的人工智能算法,通过对蛋白质组大数据的深度分析,构建人类健康表型并监测自身健康和疾病状况
2个月前,该成果以《健康与疾病血浆蛋白质组图谱》(Atlas of the plasma proteome in health and disease in 53,026 adults)为题在《细胞》(Cell)期刊在线发表,成为该刊近期线上阅读量最大的文章。
备受关注的还有团队基于研究成果建立的可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/)。数据库上线第一周就有几万访问量,访问者来自世界各地。
数据库覆盖约三千种蛋白、上千种疾病与近千种表型,几乎与生物医药的所有领域都密切相关。
“相当于给人类的生命健康领域绘制了一张‘地图’,不同研究领域的人都可以在这张‘地图’里寻找对自己有价值的信息,检索某个蛋白具体和哪些人类健康表型和疾病有关系,是否可用于疾病的预测、诊断和治疗,人类某个疾病潜在的发病机制是什么,等等。”
复旦大学附属华山医院神经内科主任医师郁金泰认为,这也是为什么大家对这篇文章感兴趣的重要原因。
对于普通大众而言,这项成果有着重要的现实意义——不久的将来,你将可以通过价格亲民的血检项目,更早期、更精准地得知患数百种疾病的可能,从而尽早开展预防和治疗。
从提前15年预测痴呆到预测数百种疾病
故事始于AD(阿尔茨海默病,俗称老年痴呆),却不止于AD。
AD治疗有个难题,那就是在临床症状显现前,疾病可能存在数年甚至数十年的隐匿期,患者可能在临床诊断15-20年前无明显症状,且早期表现极易与正常老化相混淆。当患者出现显著认知行为障碍等症状,前往医院就诊时,疾病往往已进展到中晚期。
作为国家神经疾病医学中心(华山)认知障碍方向带头人,郁金泰已经在AD领域深耕十七年,曾联合多位国际专家,牵头制定了全球首个AD循证预防国际指南,为全球各国预防AD提供了科学依据。
如何才能对AD早发现早治疗?郁金泰和程炜多学科融合交叉团队敏锐觉察到蛋白质组学研究对AD预防、诊断和治疗的意义,团队先后通过血浆及脑脊液蛋白质组学研究发现了AD新的诊断生物标志物,联合诊断精度高达98.7%。
2024年2月,团队发表在《自然·衰老》(Nature Aging)的《血浆蛋白质组学预测健康成年人未来痴呆风险》(Plasma proteomic profiles predict future dementia in healthy adults)研究,意味着“一滴血就能提前15年预知痴呆风险”,被《自然》(Nature)作为头条新闻进行报道,引起学术界高度关注。
受到这一成果的鼓舞,以及复旦大学牵头开展国际人类表型组大科学计划的启发,团队提出了更宏大的目标:“在AD研究基础上,如果能够纳入所有健康相关表型和所有疾病,刻画血浆蛋白与它们的关联,全面绘制人类蛋白质组表型组图谱,那么对整个生命医学领域的贡献,无疑将是巨大的。”
于是,团队马不停蹄,在不到一年时间里,深入分析53026名个体的血浆蛋白质组数据,跨越了14.8年的中位随访期,绘制出了全面的蛋白质组图谱。
图谱涵盖2920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关表型,揭示了168100个蛋白质-疾病关联和554488个蛋白质-表型关联。研究还发现超过650种蛋白质与至少50种疾病存在联系,为183种疾病构建了预测诊断精度良好的蛋白模型,并且提供了26个潜在药物治疗新靶点。
“通俗地说,这张图谱能够告诉大家,血液中的哪些蛋白能够预测某种疾病的发生,以期通过采血实现疾病的早期诊断,”郁金泰说,“许多新的发现,将可能让更多人重新审视现在的疾病类别和亚型,为医疗诊断、机理研究和药物研发提供重要线索”。
AI结合蛋白质组学研究让精准医学真正落地
人类健康与疾病蛋白质组图谱的成功绘制,不仅为人类疾病预测提供了一把钥匙,也为生命科学研究开创了新的研究范式。
为什么蛋白质组如此重要?郁金泰解释:
“我们以前往往从基因组角度开展精准医学研究,几乎没有人使用蛋白质组做相关表型和疾病研究,但基因转录和翻译过程的复杂性限制了仅基于基因组就实现精准医学的可能性。”
从基因组这一“遗传密码”到疾病的真正发生,中间必须经过蛋白质的表达,因此,蛋白质能够更直接反映人体的生理过程和病理变化,是进一步理解疾病机制和开发新诊疗方法的关键。
蛋白决定性状:相同的基因,蛋白不同,性状完全不同
实际上,基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大。就像蝴蝶,在幼虫期是毛毛虫,在成虫期则是会飞的蝴蝶,不是因为基因组改变,而是因为蛋白的表达不同。
过去,人们之所以没有开展蛋白质组研究,主要是受到蛋白质组检测技术和数据分析手段的限制,无法对大规模人群的海量数据进行检测分析。如今,人工智能大数据分析技术让这一梦想照进现实。
“对于数据的理解,我相信我们不比世界上任何一个团队差。”在复旦大学类脑研究院院长冯建峰看来,这次突破并非一蹴而就,而是源于长期积累。
联合团队合影
作为第一个在人工智能顶会NIPS上发表成果的中国学者,冯建峰已在脑科学研究领域深耕四十年,致力于发展各种人工智能算法、优化大数据分析流程,并成功应用到脑疾病“寻根”、早期预测等研究中。
蛋白在个体间受年龄、性别、种族等多重因素的复杂调控,且蛋白间也有相互作用。此次研究涉及的数据包括50000多人的蛋白质数据、近3000种蛋白,1000多种疾病和表型,不仅规模庞大,且错综复杂。
“我们开发的人工智能算法,使海量蛋白质数据和上千种表型、疾病数据的分析变得可行,进而能够回答我们想知道的临床和科学问题。”
冯建峰表示,团队一直以来的目标就是“把所有能用的数据都用上”,依托复旦大学CFFF智能计算平台,团队利用人工智能与大数据分析技术,让这一全景式研究得以落地。
交叉融合推动成果临床应用,蛋白检测有望惠及大众
“我们有共同的科研目标,不是为了交叉融合而交叉融合。”谈及研究心得,郁金泰打比方道,交叉研究不应是“包办婚姻”,而需要“自由恋爱”。
他认为,一方面,复旦大学作为综合性大学,为多学科交叉融合创新提供了重要平台;另一方面,真正做好多学科交叉融合创新,还需找到志同道合的伙伴。
早在2021年,郁金泰就开始同冯建峰、程炜团队合作,建立了脑健康智能科学中心(AI for Brain Health,AI4BH),并将AI应用于AD等脑重大疾病早期诊断和预测的相关研究中。
仅4年时间,这支年轻而富有战斗力的跨学科团队,由脑科学、人工智能的专家和神经科医生组成,已在相关领域联合发表了十余篇顶刊文章。
最初的合作,其实出于偶然。当时,郁金泰团队发表了一篇关于睡眠时长和AD患病风险关系的论文,冯建峰团队恰好也在做睡眠和大脑相关研究。“程炜教授就邀请我去类脑院作报告。一交流,发现他们对我们的临床工作非常感兴趣,而我们在数学、计算机方面一直以来也缺乏顶级人才。”郁金泰回忆道。
双方一拍即合,每周一次的联合组会延续至今。毛颖院长和冯建峰院长通过优化华山医院和类脑研究院双方互相双聘制度,进一步完善合作机制。
如今,毛颖和郁金泰团队作为临床医生,主要负责把握重大临床需求,获取临床数据,指导团队制定与调整研究方案,以及从临床的角度解读结果、撰写论文。冯建峰和程炜团队则专注于算法开发和模型构建,利用深度学习和机器学习方法建立并优化多个早期诊断预测模型,用数据与算法解决临床问题。
学术交流外,双方还会组织团建活动。“我们在工作上是很好的战友,在生活中是很好的朋友,团队相互影响、共同成长,做出高质量、有影响力的成果。”郁金泰说。
在交叉融合的氛围中,团队中的青年学子也快速成长起来,医学院的学生们编程、算法能力越来越强,类脑院的学生们对生物医学和疾病的认识也越来越深刻。
下一步,团队将推动本次研究成果的临床转化,制定可用于疾病预测和诊断的生物标志物的异常值范围,进一步通过体内外实验验证潜在治疗靶点,并且基于新靶点研发新的药物,与企业合作研发用于早筛、早诊和疾病治疗的相关产品。
当基因检测已“飞入寻常百姓家”,蛋白质检测也将为人类打开另一扇了解疾病的重要大门。团队介绍,尽管目前对蛋白质组的全面检测费用较高,但如果只是定向检测某些蛋白,特别是针对AD、心脏病、糖尿病等常见多发重大疾病,价格可降到百元甚至几十元人民币,未来有望普及大众。
长远来看,团队将进一步利用人工智能新模型和新算法,整合多组学数据,促进精准医学发展。团队透露,人类健康与疾病的基因组图谱、代谢组图谱、多组学图谱,都在紧锣密鼓地绘制当中。郁金泰期待地说:
“如果我们能通过多组学的高度融合获取更多、更齐全的信息,我们就能超越原有的工作,让精准医学更精准,让‘科学算命’更科学。”