2023年3月8日,Nature在线发表了丹麦奥胡斯大学Stig Uggerhøj Andersen和芬兰自然资源研究所Alan H. Schulman以及英国雷丁大学Donal Martin O’Sullivan联合团队及其合作者题为“The giant diploid faba genome unlocks variation in a global protein crop”的研究论文。该研究成功测序并组装了蚕豆的第一个高质量、染色体水平上的基因组,并利用该基因组剖析了蚕豆种子大小变异和种脐颜色变化的遗传基础;为科研人员提供了一个基因组学的蚕豆育种平台。

https://doi.org/10.1038/s41586-023-05791-5

蚕豆(Vicia faba)可很好地适应了一系列气候环境,是世界许多地方的主要食物来源,并能够帮助这些地区在缺乏动物蛋白情况下,为人们提供丰富的蛋白质来源。蚕豆栽培也可以使农民延长作物轮作,并为土壤提供氮(生物固氮)作为肥料。但与大米、小麦和玉米等主食谷物相比,豆类产量几乎没有从育种和农业革命中获益;豆类因此被称为“绿色革命的慢跑者”。这主要是因为蚕豆的基因组预测长达13Gb,大约是人类基因组的4倍大小,比大多数其他作物和豆科植物的基因组都要大。尽管全基因组测序和高通量遗传表征已成为水稻等作物的常规研究方法,但在蚕豆上的应用仍具有挑战性。

自交系“Hedin/2”具有高自育性和生产力,早熟的春季习性和特殊的纯合性;使用 PacBio HiFi长读长,研究人员对Hedin/2进行了基因组测序。结果显示,该基因组测序覆盖率达到20倍,并成功组装了约11.9Gb的序列,且一半以上为长度超过2.7Mb的重叠群。利用多个分析方法,该研究进一步组装了蚕豆在染色体水平上的高质量基因组;并表明它通过反转录转座子以及卫星重复扩增和消除之间的不平衡,使基因组扩展到了13Gb(Figure 1)。

Figure 1. 蚕豆基因组在染色体水平上的组装

尽管蚕豆的基因组很大;但研究人员发现它可能比谷物更适合基因作图,因为蚕豆多达三分之一的基因被锁定在非重组区域。通过比对262个与根瘤菌或丛枝菌根真菌共生相关的蒺藜苜蓿基因,并在蚕豆中找到假定的直系同源物;该研究发现,蚕豆基因中的内含子并不比基因组较小的被子植物大,只是基因间距离更大。此外,蚕豆谱系中的最后一次全基因组复制(WGD)事件大约发生在5500万年前,远早于亚科中的其他植物(Figure 2)。

Figure 2. 蚕豆基因组的进化与同线性分析

该研究发现,蚕豆基因组中的大多数胞嘧啶被甲基化修饰:CG中为95.8%,CHG中为88.2%,CHH中为14%;这使蚕豆成为甲基化程度最高的植物基因组之一。为了展示基因组序列的实际应用,研究人员开发了一种靶向基因分型分析,并使用高分辨率全基因组关联分析来剖析种子大小变异的遗传基础。结果显示,与种子大小最显著的关联位于4号染色体上Vfaba.Hedin2.R1.4g051440基因;该基因在蚕豆种子中高度表达,并位于先前鉴定的种子重量QTL区域内,与已知调节种子大小的拟南芥CYP78A基因同源(Figure 3)。

Figure 3. TE甲基化和种子大小的遗传基础

两种测序的基因型Hedin/2和Tiffany,不仅种子大小不同,它们的种脐颜色也不同。该研究发现,不同的PPO活性是豌豆和蚕豆种脐颜色变化的主要原因。通过比较基因型 Hedin/2(深色)和 Tiffany(浅色)的PPO基因簇的系统发育和结构,研究人员证实,调控VfPPO-2的表达可控制蚕豆种脐的颜色变化(Figure 4)。

Figure 4. PPO基因表达和种脐颜色的变化

综上所述,该研究成功测序并组装了首个染色体水平上的高质量蚕豆基因组,并分析了该超大基因组的进化、甲基化等特征;同时,剖析了蚕豆种子大小变异和种脐颜色变化的遗传基础。蚕豆作为重要的食物来源,该研究构造了一个基因组学的蚕豆育种平台,使育种者和遗传学家能够加速改善蚕豆的绿色革命。