推荐MORE

暨大设立“优秀澳门学生南粤奖学金”

暨大设立“优秀澳门学生南粤奖学金”

苏宁足球软件

瑞金医院曹亚南:代谢性疾病大数据和基因组学研究应用展望

日期:2020-06-07
我要分享

2019年10月8日,由天士力资本控股(北京)有限公司主办的第三届健康投资创新生态大会在北京举行。

会上,上海交通大学医学院附属瑞金医院内分泌代谢学科的曹亚南博士以“中国人代谢性疾病大数据和基因组学研究和应用”为主题,进行了分享,动脉网对其精彩内容进行了整编。曹亚南博士所在的瑞金医院有着100多年的历史,是国内最早成立内分泌学科的医院之一。

近10年来,该院内分泌学科一直处于全国顶尖地位。同时,内分泌科也是该院的重点学科之一。瑞金医院内分泌代谢学科一直围绕着内分泌疾病和代谢病,开展临床和基础研究,并在近20年的研究中,建立了生物样本库,并进行转化性研究。

近年来,在复杂性疾病和慢性病研究方面,大数据凸显出了强大的力量。通过对立研究,或是对特定人群、患者的研究,得到十几万,甚至上百万量级的数据,并通过大数据方式进行相关的科学研究或临床研究。

与传统的研究假设相比,大数据研究不具备偏向性,更高效,可为研究者提供更多线索。因此,在目前的医学研究包括新药靶点发现中,大数据正逐渐成为主要的研究方式。

目前,国际上大的数据库或样本库大部分都由北美或欧洲发起设立。有的数据库和样本库经过了几十年的建设,已经完成了从样本库、队列到数据库的转化。但是,东亚、南美洲和非洲等地区现在还没有大的队列研究,特别是从样本库到数据库的转化。

尤其值得我们关注的是,中国地区虽然开始重视标准数据库的建立,但数据还不够完善,这是未来工作的重要方向。

另外,近五年来,生物样本库的重要性越来越凸显。英国生物样本库(UKbiobank)的全自动化生物样本库可实现自动化仓储、自动化管理、自动化取放。通过对样本库进行数据转化,并运用AI进行整合,可以从数据中挖掘大量的新靶点和生物标志物。故此,这类样本库的价值受到了格外重视。

数据采集标准化为数据库赋予研究和应用价值

样本库需要优秀的样本来源。现在,全球良好的疾病队列、自然队列、社区队列或是特定人群队列,都要经过严格的临床管理设计和不断随访。

当前组学数据库以基因组学信息为主,希望通过基因组学数据和表型数据等进行关联分析,从中得到重要结果,需要良好的队列管理、随访,以及标准化的队列信息采集。

信息的采集需要做好标准化。实际上,在国内,临床信息采集的标准化仍然是一个非常严重的问题。不同的医院对于特定的生物信息采集(尤其是检查数据的采集),可能使用的是不同的方法,采用的试剂盒、采集设备不同,正常值也不一样,最终可能导致队列数据来源不同,标准不统一,直接进行比较会出现问题。

因此,在建设样本库和数据库时,必须做好数据采集标准化,这样才能赋予数据库后续的应用和研究价值。

基因组学是目前全球组学数据库的重点

目前,全球已有很多大规模的基因组学数据库。通过对人群中携带的基因变异进行检测,获得的基因变异数据库是非常重要的人群特征。不同的人群基因变异背景和结构存在非常大的差异,这与表型密切相关。

有些变异基因在人群中的分布频率较高,属于常见变异,这些基因变异大部分的对表型的影响较弱,很多基因变异的作用累加在一起影响表型。另外还有一些变异基因虽然在人群中的频率很低,但对表型的影响非常大,也可能是一些遗传性疾病的病因。这些基因变异和疾病发生的关系密切,其中有些是很好的生物标志物或药物靶点,是基因组学研究中的重点。

目前,针对生物样本库或大规模队列采集基因组信息的主要方法有两种:一种是高深度全基因组测序,这是目前数据质量最好的办法,但花费较高。另一种是利用基因芯片做基因分型检测,这种方法获得的基因变异数据相对较少,但成本低,不到全基因组测序的十分之一。

英国的Biobank项目主要采用了基因芯片方式,对50万人的样本进行了基因分析,并在《nature》等杂志上发表了系列研究成果。这些成果主要通过全基因组多态相关比较研究(GWAS),获得基因变异和人类疾病的相关性、发现罕见编码变异的生物学功能、药物基因组学相关生物标志物等,得到了大量有价值的信息。

国际上还有多个大规模基因组数据库,例如DiscovEHR,他们采集了5万人的外显子测序数据,发表了多项研究成果。2018年他们在《NEJM》杂志上发表了HSD17B13基因失活变异与慢性肝病相关性的研究,并继续开展靶向干预研究。

在过去5年至10年当中,GWAS研究已发现了非常多的靶点,已经有两款药物批准上市、2款处于III期临床、3款处于II期临床、17款处于I期临床,以及7款处于临床前阶段。

亟需针对代谢疾病和复杂性疾病建立中国人的数据库

大部分肿瘤的致病基因和体细胞突变在不同人群中的差异很小,其主要致病机制是相同的,所以基于欧洲人和其他人群研究的发现,对中国人同样适用。

但是,对于代谢疾病和复杂疾病,东亚人群,包括中国人,其遗传背景和欧美人群差异很大,在标志物、药物基因组等方面的差异也非常大,只借用欧美人群产生的知识和成果是不合适的。

目前,基因组学的大部分发现还是来自于欧洲人群,来自于亚洲或非洲等人群的数据比例很低。因此,中国未来应完善针对中国人的复杂疾病数据库和体系。

*封面图片来源:123rf

文 | 焦艳丽

微信 | LOVEISJYL

网站、公众号等转载请联系授权

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。文中出现的采访数据均由受访者提供并确认。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

心中有爱,字里有情

样本库 数据库 基因 曹亚南 队列