美国一项大规模人类多样性调查研究项目“All of Us”已取得实质性成果。2月19日,美国国立卫生研究院(NIH)等机构的研究人员对“All of Us”收集的多达24.5万个基因组进行了分析,发现了超过2.75亿个新的遗传标记,其中近150个可能与2型糖尿病有关。这项工作还发现了非白人群体遗传学研究的空白。相关研究报告在《自然》《通讯-生物学》《自然-医学》等多个期刊发表。

“All of Us”计划旨在从生物医学研究中代表性通常不足的种族和社会经济群体中招募100万人。图片来源:Barbara Alper/Getty

“该调查结果是我们所有人资源的精萃。”英国剑桥大学的计算基因组学家Michael Inouye表示,对于那些想知道自己的发现是否适用于广泛人群或仅适用于有限人群的遗传学研究人员来说,这将成为首选数据集。

可供研究的基因组长期以来缺乏多样性,美国范德比尔特大学医学中心的遗传学家Jibril Hirbo查看了一项截至2019年1月的研究数据,发现在大多数大规模疾病基因组研究中,78%的人是欧洲血统。Hirbo说,这加剧了现有的健康差距,特别是对非白人来说。

“All of Us”旨在通过关注历史上代表性不足的群体的基因组和健康状况来改善医疗健康状况。该项目首席数据官Andrea Ramirez表示,“All of Us”迄今已获得超过31亿美元的资金,并计划在2026年底前收集美国100万人详细的健康档案,从而弥补这一差距。

该项目于2018年开始招募参与者,并于2022年发布了第一批数据——约10万个全基因组。截至2023年4月,该项目已经招募了41.3万名匿名参与者,其中46%属于少数种族或民族,共享了近25万个基因组。

美国麻省总医院的人口遗传学家Alicia Martin说,“All of Us”的数据集是“一个巨大的资源,尤其是非洲裔美国人、西班牙裔美国人和拉丁美洲人的基因组,这在绝大多数大型生物库资源和基因组学联盟中都严重缺失”。

Ramirez说,《自然》杂志发表的一项关于2型糖尿病的研究就使用了包含多种基因组的数据库。在美国,约1/10的人患有2型糖尿病,该疾病可能由涉及各种基因的许多不同的生物机制引起。研究人员分析了来自几个数据库的遗传信息,其中包括“All of Us”,共涉及250多万人,其中近40%的数据来自非欧洲血统的个体。研究小组发现了611种可能导致疾病发展和进展的遗传标记,其中有145种以前从未被报道过。作者写道,这些发现可以用于开发“遗传知情的糖尿病护理”。

在另一项研究中,研究人员使用“All of Us”的数据来检查致病变异,即增加一个人患某种特定疾病风险的基因差异。他们发现,在欧洲血统的人的基因组中,2.3%的人有致病变异。然而,在非洲血统的人的基因组中,这一比例降至1.6%。

“这种差异不应该有生物学原因。”该研究合著者、美国休斯顿贝勒医学院的计算遗传学家Eric Venner警告说,这种差异可能是对欧洲血统的人进行更多研究的结果,事实上,研究人员在非欧洲血统的人的基因组中发现了比欧洲血统的更多未知风险变体。这突出了对非欧洲基因组进行更详细研究的迫切需要。

收集和使用来自不同人群的更多基因组和健康数据对于生成更准确的“多基因风险评分”尤为重要。这些数据提供了一个人因基因而患某种疾病的风险情况。

为了计算特定疾病的分数,研究人员开发了一种算法,该算法对患有或未患有该疾病的人的数千个基因组进行训练,可以通过将一个人的基因数据输入算法来计算他们的分数。

在最近发表的一篇论文中,研究人员使用了更具包容性的“All of Us”数据对23种疾病的得分进行了校准和验证,并推荐了10种优先用于临床的疾病,包括冠心病和糖尿病。Martin希望未来的研究能帮助医生解读这些分数。

Ramirez说,“All of Us”计划每年发布一批数据,代表新的参与者和基因组。Hirbo说,多样化的数据正在到来,现有的主要基于欧洲血统的人的基因组的算法将很快得到更新。

相关论文信息:https://doi.org/10.1038/s41586-023-06957-x

https://doi.org/10.1038/s42003-023-05708-y