香蕉是产量颇高的水果,也是热带、亚热带地区的主要粮食作物之一。栽培香蕉起源复杂,基因组杂合度高、分型困难,导致香蕉的基因组研究相对落后于其他栽培作物。三倍体香蕉是全球栽培香蕉的主力军,其中Cavendish香蕉(AAA)因易于运输而被大量栽种,其产量约占据香蕉市场的50%。Cavendish香蕉高质量分型基因组的组装和注释将有助于探究栽培香蕉的起源和驯化历史,为香蕉种质资源的遗传评价和种质创新奠定了坚实的基础。

中国科学院华南植物园与热带作物生物育种全国实验室-中国农业科学院深圳基因组研究所等,使用PacBio HiFi、ONT ultra-long和Hi-C测序数据,对巴西蕉(Cavendish的一个高产和优质品种)进行了从端粒到端粒(telomere-to-telomere,T2T)且区分单倍型的从头组装(图2A、B)。三个组装的单倍型基因组的大小分别为477.16 Mb、477.18 Mb和469.57 Mb,基因组总大小为1.42Gb。研究分别识别到19、17和17个端粒,除2号和10号染色体外均存在无端粒缺失染色体。经过补洞后全基因组仅在BXJ2上存在2个gap。BXJ1、BXJ2和BXJ3组装BUSCO评估分别为97.40%,97.80%和93.80%(图2E)。BXJ1注释了37,185个蛋白编码基因,重复序列比例为53.76%。BXJ2注释了37,241个蛋白编码基因基因,重复序列比例为54.14%。BXJ3注释了37,178个蛋白编码基因,重复序列比例为55.13%。

巴西蕉虽然具有单系起源,但三套亚基因组间显示出较大的差异,序列共线性水平较低(图2F)。此外,在不同亚基因组的不同染色体上,研究发现存在部分明显的易位,集中于1号、4号和7号染色体。研究对基因家族扩张收缩历史进行模拟发现,与果实品质及风味相关的基因家族发生了显著的扩张,包括蔗糖/二糖/寡糖代谢通路、淀粉代谢通路以及芳香物质合成相关通路。另一部分显著扩张的基因家族则富集到花粉发育通路,这可能和巴西蕉的单性结实和不育相关。科研人员进一步对巴西蕉全基因组的抗性基因进行筛选发现,相对野生芭蕉,巴西蕉中存在更少的抗性基因,特别是在3号以及10号染色体上的基因簇。长期以来,枯萎病严重威胁香蕉生长,研究发现3号抗性基因簇所在的区间正好位于此前报道的野生芭蕉抵抗枯萎病的QTL上,反映更少的抗性基因可能与巴西蕉易感枯萎病相关(图3)。此外,该工作首次在香蕉中解析了多倍体亚基因组的差异表达模式,发现了亚基因组间呈现高度差异表达,进一步印证了巴西蕉亚基因组之间的分化。三倍体香蕉基因组的成功解析为香蕉遗传学和育种提供了重要资源。

相关研究成果以Telomere-to-telomere haplotype-resolved reference genome reveals subgenome divergence and disease resistance in triploid Cavendish banana为题,在线发表在《园艺研究》(Horticulture Research)上。这是首次报道三倍体栽培香蕉的高质量分型参考基因组,是继2012年首个野生芭蕉基因组草图发表后,香蕉基因组学领域中又一重要进展。研究工作得到国家自然科学基金和中国科学院战略性先导科技专项的支持。广西民族大学的科研人员参与研究。

论文链接:https://doi.org/10.1093/hr/uhad153

图1. 巴西蕉

图2. 巴西蕉基因组特征

图3. NLR抗性位点在小果野蕉(MAv4)和巴西蕉基因组上的分布