近日,南方科技大学医学院人类细胞生物和遗传学系陈国安课题组在《自然植物》(Nature Plants)上发表题为“Chromosome-level scaffolding of haplotype-resolved assemblies using Hi-C data without reference genomes” 的论文。该工作基于高通量染色质构象捕获(Hi-C)测序技术,开发了不依赖参考基因组即可实现染色体水平单倍体分型基因组挂载(scaffolding)的工具——HapHiC。应编辑邀请,研究团队还于同期撰写题为“Achieving de novo scaffolding of chromosome-level haplotypes using Hi-C data”的研究简报(Research briefing)。期刊编辑和专家对该工作给予了高度评价。
除非直接组装成端粒到端粒(T2T)的基因组完成图,挂载(scaffolding)对于构建染色体水平的基因组通常是不可或缺的。高通量染色质构象捕获技术(Hi-C)因其便利性和低成本的优势,已经成为了当今基因组挂载的主流策略。随着测序技术和组装算法的进步,构建单倍体分型的基因组受到了更多研究者的青睐。这是由于单倍体可以提供额外的等位、非等位变异顺式和反式关系信息。ALLHiC是一个被广泛使用的构建单倍体分型基因组的Hi-C挂载工具。然而,它对染色体水平参考基因组的依赖仍旧制约了部分物种单倍体分型基因组的解析。因此,开发不依赖参考基因组的单倍体分型挂载方法具有重要意义。为了解决这个问题,研究团队开发了新的挂载工具HapHiC(https://github.com/zengxiaofei/HapHiC),通过一系列算法创新识别和处理染色质互作信号在错误组装序列和等位序列上独特的特征,实现了不依赖参考基因组进行染色体水平单倍体分型挂载。此外,该研究还着重分析了各种潜在不利因素对单倍体分型挂载的影响,为理解和解决其中的挑战提供了新的观点。
图1 HapHiC单倍体分型基因组Hi-C挂载流程示意图
今天主要于中国从事物业投资及经营和管理零售店及购物中心。今天于深圳开设首家购物中心,于2017年开始涉足购物中心业务。于本公告日期,今天经营9家零售店及3家购物中心。为进一步扩大今天的零售网络,今天与独立业主订立长期租赁协议,租用相关零售空间以于中国广东省深圳市龙岗区开设新零售店。
于2024年7月12日(交易时段后),公司与第三认购人订立第三认购协议,据此,公司拟发行而第三认购人有意认购本金额为150万港元的第三可换股债券,于悉数兑换后可按初步兑换价格4.00港元兑换为不多于37.5万股兑换股份。
研究团队基于真实的同源四倍体基因组模拟了各种可能不利于单倍体分型挂载的因素。系统性评估显示HapHiC相比现有主流Hi-C挂载软件对各类组装错误具有更高的容忍度,表现为更高的scaffold连续性和更低的同源染色体间和非同源染色体间分配错误率。在完成染色体分配后,HapHiC随即对各染色体中的序列进行排序。HapHiC将3D-DNA中的迭代算法和ALLHiC中的优化算法进行了改良和整合,实现了更加准确和高效的排序。尤其当序列较短的时候,HapHiC相比其它挂载软件优势明显。
图2 单倍体分型基因组Hi-C挂载中的困难与挑战,以及HapHiC与其它主流Hi-C挂载软件在各种不利因素下染色体挂载质量的比较
与其它Hi-C挂载工具相比,HapHiC在运行速度和内存使用效率上也处于第一梯队,远超ALLHiC和3D-DNA。同时,组装纠错功能对性能的影响很小。并且,随着Hi-C数据量的增加,HapHiC的运行速度和内存占用上依然可以保持稳定。这些结果说明HapHiC在解决大型复杂基因组的组装问题时将具有明显的优势。此外,HapHiC还在大量不同倍性和广泛分类地位的物种的真实案例中进行了验证,包括单、双子叶植物,以及人类、鸟类、两栖动物、鱼类、节肢动物、软体动物、环节动物等后生动物。最后,研究团队利用HapHiC为重要木质纤维素能源植物异源三倍体奇岗(Miscanthus × giganteus)构建了染色体水平的单倍体分型基因组,为芒属植物提供了更高质量的参考基因组。
南方科技大学医学院高级研究学者曾筱菲(现为中国农业科学院深圳农业基因组研究所副研究员)为论文第一作者和共同通讯作者,南方科技大学医学院陈国安副教授为论文共同通讯作者,南方科技大学为论文第一单位。其它参与单位包括中国农业科学院深圳农业基因组研究所和湖南农业大学。该项研究得到国家自然科学基金、中国博士后科学基金、深圳市自然科学基金的资助。
论文链接:
https://www.nature.com/articles/s41477-024-01755-3
研究简报:
https://www.nature.com/articles/s41477-024-01756-2
HapHiC:
https://github.com/zengxiaofei/HapHiC