2017年3月23日Science发表利用Hi-C完成传播寨卡病毒和西尼罗病毒的两种蚊虫的3条染色体序列的组装。
2017年4月27日Nature发表利用Hi-C完成大麦基因组的组装,并阐明大麦染色体的空间结构。
可谓引爆了Hi-C辅助基因组组装的热点.
但是同时我们也可以看出目前Hi-C技术并未形成较为成熟的开源分析软件.小编大体叙述以下见到的三款Hi-C辅助组装的软件:LACHESIS,3d-dna和SALSA。
SALSA(https://github.com/machinegun/hi-c-scaffold)是一个针对三代组装的基因组进行Hi-C辅助组装,提升Scaffold指标(不能获得染色体)的软件。此软件也具备纠错功能,但遗憾的是作者上传的代码存在问题,纠错功能改进的代码迟迟没有进行发布,且此软件外置参数太少,非软件开发人员必须熟悉该软件原理算法相应的进行参数调整才能取得较好的效果。此软件尚未正式发表。
目前国内公司做Hi-C很多,但是需要警惕准确性问题.
一是没有对Contig或者Scaffold进行纠错的挂染色体都是耍流氓;
二是单纯跑软件组装后没有用热图评估的绝对也是耍流氓.
小编目前从各公司宣传这一块了解到貌似只有百迈客做的比较好(小编不是做广告啊),其他公司未见到体现上述两点的东西,所以大家在选择测序公司上也要注意.
参考文献:
1. Dudchenko O, Batra SS, Omer AD, et al. De novo assembly of the Aedes aegypti genome using Hi-C yields chromosome-length scaffolds.[J]. Science , 2017.
2. Mascher M, Gundlach H, Himmelbach A, et al. A chromosome conformation capture ordered sequence of the barley genome[J]. Nature, 2017, 544(7651): 427-433.
3. Burton, J.N., et al., Chromosome-scale scaffolding of de novogenome assemblies based on chromatin interactions. Nat Biotechnol, 2013. 31(12): p. 1119-25.
4. Ghurye J, Pop M, Koren S, et al. Scaffolding of long read assemblies using long range contact information[J]. bioRxiv, 2016: 083964.
欢迎关注生信人