人类表型组计划重塑生命认知

什么叫表型?就是所谓可测量、可观察的性状、特征,包括结构性的、物理特征的,还有其组成性化学类的特征,也包括生物类的,如你跳得有多高、跑得有多快、是不是容易生病等等。生命科学的研究说到底就是搞清楚这些表型背后的生物学过程和生物学机制。

表型组是什么呢?就是把这些表型统统放在一起。

1980年以后,有一批遗传学家说,可以通过家系和人群的研究把你的表型或者疾病跟某一个基因联系起来。如果基因可以联系起来,再搞清楚这个基因是干啥的,那背后的机制就搞清楚了,所以遗传学当时就进入了基因组时代。接下去,人类历史上生命科学的第一个大科学计划启动了,就是人类基因组计划,其目的就是把人的基因组、所有的基因测一遍,最终在2001年正式宣布完成。

但是,在连接表型和基因的关系层面,研究进入了一个瓶颈期。原因是什么呢?遗传的机制本身就相当复杂,表型本身也很复杂。基因在一端,表型在另一端,在这当中有太多的东西、结构需要穿越,它们之间的关系又不是一一对应的关系,所以要直接连接基因和表型的话,确实非常困难。能不能想一些办法来解决这些问题?譬如基于基因组的疾病研究,样本量大到几万、十几万,甚至几十万。能不能想办法降低它的复杂度?表型组学(Phenomics)就被提出了。

但是,人体的表型具有复杂性、跨尺度性,还有动态性——你的心跳,早晚和睡觉的时候都会发生变化。我们目的是通过大量表型的分析,最终对疾病进行分型,对疾病的分型意味着我们对疾病的本质有更深入了解,有助于诊断和治疗。

所以,我们提出了一个大科学计划,需要多国科学家团队的合作,2016年召开了首届国际人类表型组大会,提出了核心任务和路线图。2018年正式启动成立了一个国际协作组,目前一共有20个国家参加。

为了征集表型数据,我们建立了一个大的平台。这些平台都在一栋楼里,志愿者在里面花两天一夜的时间完成24000个表型的测量,一个人要做24000个项目。按照要求完成了1000个人、每个人24000个表型的测量,构成了它们之间的关系图。特别有意思的是,我们从24000个表型中,发现了大约有5亿到6亿可能的关系。在这里面,我们发现了超过150万个强关联,那就意味着新的发现,然后我们获得了表型组导航图1.0版本。

举一个例子,我们用表型组的方法去研究人类的指纹。指纹背后的基因问题一直没能解决,但现在这项研究让我们找到了某个基因决定指纹,更令人吃惊的是,这个基因实际上不是跟皮肤有关系的,而是跟上肢的发育有关系,此次发现很大程度上颠覆了我们对表型决定的认识。

这个大科学计划就像我们要建设人类命运共同体一样,我们是要有一个科学的共同体,这是人类生存和发展必要的条件。

复旦大学校长、中国科学院院士 金力

《人类表型组计划重塑生命认知》

栏目编辑:郜阳

来源:作者:新民晚报 张炯强