2018年9月10号,Nature Genetics发文“Integrative detection and analysis of structural variation in cancer genomes”系统阐释SV鉴定。
1、摘要。
结构变异(SV)可以通过多种机制促进肿瘤发生。尽管它们的非常重要,癌症基因组中的SV的识别仍然具有挑战性。这里,作者开发了一个结合光学图谱、Hi-C和全基因组测序的三种数据的流程,可以系统地检测正常或癌样本和细胞系的各种SV。这种识别每种方法的独特优势,并证明只有综合三种测序手段才能全面地识别基因组中的SV。通过结合HI-C和光学图谱,可以阐明复杂的SV。此外,作者观察到广泛的结构变异事件,影响非编码序列的功能,包括远端调控序列的缺失,DNA复制时间的改变,以及新的三维染色质结构域的建立。作者分析这些结果表明非编码区域的SV可能是癌症基因组中未被重视的突变驱动因子。
2.方法
利用七个癌细胞系中产生WGS数据,平均覆盖率>30×,构造了一个内部流程结合了LUMPY, Delly, and Control-FREEC三个软件,用于初始SV检测,然后执行数据过滤;光学图谱,平均覆盖率约为100×。使用RefAligner 6119 (Bionano Genomics) and pipeline 6498进行从头组装和SV检测,并进行进一步数据过滤;最后作者开发了一种使用Hi-C识别重排事件的,包括易位,倒位、缺失和串联复制的算法;经过比较和合并每个测序平台的结果,确定了数千个插入和缺失(>50 bp),数百个串联重复和染色体间易位,数十个倒位。
3、比较。
三种方法鉴定特征比较如下,可以看到光学鉴定的SV长度达到100kb以上,Hi-C可以达到Mb级别。
4、Hi-C鉴定染色体重排
在核型正常细胞的HI-C实验中,染色体间的相互作用是罕见的。然而,在癌细胞中却常见模式。例如,在CAKI2癌中细胞,我们观察到强的“染色体间”相互作用(图2a右),这可能是由于染色体6的融合所致。在19个H-C鉴定重排事件中,可以确认11个,其余8个为新的。。一个事件是在染色体16和6号染色体的两个不同区域之间(图2c)。另一种是涉及染色体1, 6, 18和20的重排。进行了FISH实验来验证新的预测易位,18个通过FISH或先前的数据来验证。
5、软件下载
https://github.com/dixonlab/hic_breakfinder.
有生信分析请留言
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史