2月7号Nature Communication在线发表了使用Oxford Nanopore MinION测序仪对拟南芥基因组重新组装结果。
采用手持式Oxford Nanopore MinION测序仪以最小的成本和时间要求生成超长的Read,这使得在实验室板凳上对基因组进行测序成为可能。在这里,作者使用MinION测序仪将金标准拟南芥基因组(KBS-Mac-74登录号)进行测序,并使用普通的计算硬件(4核,16Gb RAM)可以将基因组组装到染色体臂水平(62个COntig,N50长度为12.3Mb)。使用两种独立的单分子技术,Bionano光学基因组图谱和Pacific Biosciences Sequel测序验证了组装的连续性和质量。新的拟南芥KBS-Mac-74基因组能够解决先前基于Sanger的BAC测序方法难以克服的数量性状基因座的定位问题。总之,即使为了仅解基因组单个区域的复杂的结构变异,采用完整的基因组组装方法如今正成为实现这一目标的最简单的方法。
下面具体介绍一下此文所做的工作。
首先测序Read的平均长度为11.4 kb(N50 7.5 kb),总计测了3.4 Gb。其中4条Read长度超过200 kb,包括269 kb的一个,14个超过100kb和2317超过50kb,可以说是少部分Read确实是特别长的。
minimap/miniasm是在一段时间内是专门设计用于处理长的有错误的Read的组装程序。作者使用此程序进行了组装,组装结果简称为ONTmin,同时也选用了Pacbio作对照(组装结果简称PB)。从表1可以看到,ONTmin组装长度最小(110.9 Mb),但有最少的Contig数目(62),N50(11.5 Mb)为第2大,最长的contig为13.8 Mb。
使用30×Illumina数据对组装结果使用racon进行三轮polish,随后再使用pilon进行第4轮Polish(表2)。从结果来看,racon显着改善了ONT组装结果的总长度并且将N50长度增加到了12.3Mb,最长Contig增加至14.8Mb(表1)。只有在第一轮racon和最后一轮的pilon对单碱基错配(假SNP),假插入和错误删除的校正(表2)有强烈的影响。
ONT可以组装出包括2.8kb端粒重复序列(图3e)和两个分别为16.5Kb和4.8kb的着丝粒重复序列(图3f)。当然 PB也组装出来了类似数量的着丝粒和rDNA序列。
此次组装有利于进行了SG3 的QTL定位。
总体而言,Polish使ONT组装在基础质量水平上和最先进的PacBio组装结果具有可比性了。
欢迎关注生信人
点击以下「关键词」,查看往期内容:
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史