Genome Research:中山大学岳家兴团队开发图形泛基因组的可视化解读新方法

时间:2025-02-17 12:11:48   热度:37.1℃   作者:网络

近年来,随着单分子长度长测序和端粒到端粒(Telomere-to-telomere, T2T)水平基因组拼装技术的发展和普及,旨在通过对代表种群遗传多样性的一系列高质量基因组的比较分析阐明种群水平基因组遗传变异模式及功能影响的泛基因组学(Pangenomics)研究成为了领域热点。在前期研究中,岳家兴博士及合作者也围绕酿酒酵母Saccharomyces cerevisiae这一经典模型,开展了一系列解析其全球种群遗传多样性景观的泛基因组学研究Nature Genetics, 2017, 49:913-924; Nature, 2018, 556:339–344; Nature Genetics, 2023, 55:1390–1399;Nucleic Acids Research,2024, 53(D1):D852-D863)。这些泛基因组学研究大大拓展了我们对于种群内基因组遗传变异多样性的认识,也为更高效和高质量地分析解读这些泛基因组学资源提出了新的挑战。

在此背景下,图形泛基因组(Pangenome graph)的概念应运而生。顾名思义,图形泛基因组以图形的形式对构成泛基因组的线性基因组集合做冗余信息整合和遗传变异表征,从而以一种非常精简的数据结构实现对种群遗传变异景观的全面覆盖。不过鱼与熊掌不可兼得,图形泛基因组的这种图形化表征形式也意味着它与我们通常使用的线性参考基因组相比会复杂和抽象很多。因此,怎么样化抽象为具象,实现对图形泛基因组的图形特征做有生物学意义的注释和解读成为了目前图形泛基因组领域内的一个重要挑战。

近日,中山大学肿瘤防治中心岳家兴团队在基因组学著名期刊Genome Research上在线发表了题为“Interactive visualization and interpretation of pangenome graphs by linear-reference-based coordinate projection and annotation integration”的研究论文。该研究提出和开发了一个基于线性参考基因组坐标映射实现对图形泛基因组的可视化解读的新方法VRPG。基于VRPG,研究者可以实时互动地对图形泛基因组进行高效查询和浏览和直观图形路径解析。此外,VRPG还可以实现对图形泛基因组和基于线性参考基因组的多种功能注释信息做同步互动浏览,推动对图形泛基因组中不同图形表征的生物学功能解读。VRPG的这些特点帮助更多的研究者方便、直观地把图形泛基因组运用到自己的研究工作中

图片

文章发表在Genome Research

VRPG提供对目前三大图形泛基因组构建策略(Minigraph、Minigraph-Cactus、PGGB)的全面支持,且完全开源透明,可通过GitHub下载安装(https://github.com/codeatcg/VRPG。为了进一步展示该方法的有效性和通用性,研究团队还进一步搭建了专门的案例展示网站(https://www.evomicslab.org/app/vrpg/)用于展示基于酿酒酵母ScRAP图形泛基因组(随本研究构建)和人类HPRC图形泛基因组(由人类泛基因组协作组HPRC构建)的可视化解读。

图片

图1: VRPG对人类HPRC图形泛基因组的展示实例。

图中展示区域为人类的APOE基因;APOE基因区的遗传变异与阿尔茨海默病和心血管病的发生密切相关。

VRPG基于其内置的路径解析功能可以高亮显示查询序列基因组在图形基因组中的实际通过路径,从而可以将我们所更熟悉的基于线性基因组比对过程中所发现的遗传变异类型直观的对应到它们各自的图形泛基因组表征中,实现对图形泛基因组的有效解读(图2)。

图片

图2: 在VRPG框架下,针对不同类型的遗传变异实现基于图形泛基因组的路径解析。

作为实例展示,研究团队分别用VRPG可视化了人类和酵母基因组中的一些代表性结构变异位点(如人类的DSCAM基因内含子倒位、CR1基因部分删除以及酵母的XIV号染色体flip/flop倒位、DOG2基因删除等)基于其各自图形泛基因组的图形表征,详细展示了VRPG的这种路径解析功能对于有效解读基因组结构变异的帮助(图3、图4)。借助这些实例展示,研究团队还进一步展示了VRPG内置的图形简化功能对于破解基因组复杂区域的图形表征的帮助

图片

图3: 在VRPG框架下,对人类HPRC图形泛基因组中DSCAM基因第32号和33号外显子之间的倒位(inversion)的可视化解读。

图片

图4: 在VRPG框架下,对酵母ScRAP图形泛基因组中DOG2基因删除(deletion)的可视化解读。

此外,研究团队还详细比较了VRPG和其它图形泛基因组的可视化工具的功能设计特点,并系统测评了这些工具在实际应用场景下的执行效能表现。与其它图形泛基因组的可视化工具工具相比,VRPG在这两方面的表现都很突出,适用于多种应用场景,有望成为今后研究和利用图形泛基因组的利器

中山大学肿瘤防治中心岳家兴副研究员为本文的唯一通讯作者,中山大学肿瘤防治中心苗泽圃为本文唯一第一作者。

原文链接:

https://genome.cshlp.org/content/35/2/296.full

上一篇: 最新Nature大子刊,皮肤贴片,按需产...

下一篇: European Radiology:热...


 本站广告