1. Illumina
这个平台代表了合成化学在大规模并行排列中最常用的测序方法之一。文库制备完成后,将双链cDNA通过流动池(flowcell),并基于与接头序列的互补性将其与个别分子杂交。通过流动池保持在接头两端的杂交序列将被桥式扩增。这些新产生的序列将与流动池杂交,并且在多次循环之后流动池的一个区域将包含许多拷贝的原始双链cDNA。整个过程被称为簇生成。簇生成后,从双链cDNA中取出一条链,将试剂通过流动池进行合成测序。合成测序是这样一个反应,在每个合成回合中,加入的是由荧光信号可以确定的A,C,G,T的单个核苷酸,这些核苷酸被成像,使得位置和添加的核苷酸可以被确定、存储和分析。在流动池中特定位置重建的添加序列,对应于一个产生的双链cDNA簇,给出双链cDNA原始片段的精确核苷酸序列。
合成的轮数可以很少,例如从50个核苷酸(nt)至150nt。有两种测序的模式。如果仅在双链cDNA的一端进行测序,则是单端测序。如果从两端进行测序,则称为双端测序。Read的类型和长度的缩写通常是SR50或PE100,分别表示单端50nt或双端100nt。由于每个循环都需要清洗使用过的试剂和引入新的试剂,因此根据仪器型号和测序长度,仪器上的一次测序可能需要3到12天。Illumina提供了多种具有不同通量的仪器,Hi-Seq2500仪器在一次运行中可产生多达60亿个双端reads。在PE100上,这表示600Gb的数据。这比一项研究通常需要的序列数据大得多,因此,在实践中,文库可以加入索引(index)并且多个文库被标准化并组合以在单个流动池上运行。一般情况下,在一个16通道的流动池上有多达100个文库。如果这对于实验室来说测序容量太大,那么Illumina还提供了一个更小、更个人化、通量更低的测序仪。MiSeq系统可在PE250模式下产生30M reads,运行2天产生8.5Gb数据。
Illumina作为测序行业的龙头企业。最初由四位博士于1998年共同创建,总部位于美国加利福尼亚圣地亚哥,主要销售微阵列芯片,于2000年在纳斯达克挂牌上市。2006年收购Solexa公司,获得新一代高通量测序技术,从而成为目前市场上的主流测序技术公司。
Illumina 旗下测序仪器
GA系列:Genome Analyzer, Genome analyzer IIx
HiSeq 系列: HiSeq 2000, HiSeq 2500, HiSeq3000, HiSeq 4000
Miseq系列
HiSeq X系列: HiSeq X Five, HiSeq X Ten
NextSeq系列:NextSeq 500, NextSeq 550
NovaSeq系列:NovaSeq 5000和6000
Illumina测序原理
Illumina测序采用边合成边测序技术(Sequencingby sythesis,SBS), 步骤如下:
Illumina测序采用边合成边测序技术(Sequencing by sythesis,SBS).步骤如下:
步骤一.建库,在DNA片段两端加上序列已知的通用接头构建文库,文库加载到测序芯片Flowcell
步骤二. 簇生成。文库两端的已知序列与Flowcell基底上的Oligo序列互补,每条文库片段都经过桥式PCR扩增形成一个簇
步骤三. 簇扩增及测序。与步骤二同时进行。即在碱基延伸过程中,每个循环反应只能延伸一个正确互补的碱基,根据四种不同的荧光信号确认碱基种类,保证最终的核酸序列质量,经过多个循环后,完整读取核酸序列。
什么是Flowcell?什么是Lane?
上图展示的是FlowCell, 以HiSeq2000为例:
每个flowcell有8个泳道,一个泳道称为一个Lane,每条Lane上有两列,每列有多个有小格子,叫一个tile。
测序仪器不同,可以放置的FlowCell个数和Lane的条数也有所区别。
下面一张图展示建库以及簇生成。
Illumina仪器系列介绍
1) Genome Analyzer,GA最初是Solexa公司自己推出的NGS系统。2006年Illumina公司收购了Solexa,在不断测序和改良后,推出了GA IIx和HiSeq2000平台。目前GA系列已不再出售。
2) HiSeq 系列。HiSeq2000发布后,2010年华大基因利用国开行给的贷款购买了128台HiSeq测序仪,这笔订单是Illumina迄今为止最大的一笔订单。后续通量不断扩大升级, 价格/G不断降低. HiSeq X Ten又是2014年推出的一个更大升级,将10台HiSeq X连接起来,当然仪器价格会高,但如果达到通量,单G数据成本也会大大降低。由于HiSeq X Ten价格太高,通量太大,2015年又推出了HiSeq X five, HiSeq X Ten的缩小版,由五台HiSeq X组成,同时推出的还有HiSeq 3000/4000和NextSeq 550.
其中Hiseq X Five和HiSeq X Ten显示为单台Hiseq X的性能。
3) MiSeq
测序时间快,可以用小基因组或者外显子的测序。测序成本相对HiSeq要高
4) NextSeq
NextSeq 500 于2014年初登陆市场,测序通量介于MiSeq与HiSeq之间,是目前最为灵活的测序平台,可以进行高中低通量的需求,例如外显子、转录组、人的全基因组测序等。2015年,新推出了NextSeq 550系统,整合了高通量测序和芯片扫描功能,测序模块与NextSeq 500完全相同,适用于细胞遗传学和生殖健康。
5)NovaSeq™。2017年1月9日发布NovaSeq™系列,包括NovaSeq 5000和6000系统。这些仪器与Illumina其他的台式测序产品一样具有易用的特点,包括全自动机载簇生成、试剂盒以及简化的工作流程。该系统具有可扩展的通量,用户可以通过同时运行1个、2个或4个流动槽类型,灵活开展需要不同产出水平的测序应用。与Illumina其他测序系统相比,这两个型号在大多数测序应用中对单个样品有着更低的成本。
2. SOLID
SOLID代表通过寡核苷酸连接和检测进行测序,并且是由AppliedBiosystems(Carlsbad,CA)商业化的平台。顾名思义,测序化学过程是通过连接而不是合成。在SOLID平台中,DNA片段文库(最初衍生自RNA分子)以每个珠子一个分子连接到磁珠上。然后在乳液中扩增每个珠子上的DNA,使得扩增产物留在磁珠上。然后将所得的扩增产物共价结合到载玻片上。使用几种与通用引物杂交的引物,将具有荧光标记物的二碱基探针与引物竞争性连接。如果二碱基探针的第一和第二位置的碱基与序列互补,则会发生连接反应,标记将提供信号。引物通过单个核苷酸重置五次,因此在循环结束时,由于二核苷酸探针和至少一次第五个核苷酸、至少四个核苷酸将被询问两次。随后的二核苷酸探针的连接提供了第五个核苷酸的第二个询问,并且在五个引物重置之后,五个核苷酸将被询问至少两次。连接步骤一直持续到序列被读取。
独特的连接化学可以对核苷酸位置进行两次检查,从而提供高达99.99%高测序准确度。虽然像差异表达检测这种可能不是必要的用途,但对于检测检测单核苷酸多态性(SNPs)这是至关重要。5500W等最新的仪器去除了磁珠扩增,而是使用流芯片代替放大模板。两个流芯片的通量可达320Gb。与其他平台一样,可以使用indexing/barcoding来复合文库,以便可以在仪器上同时运行数百个库样本。
3. Roche 454
该平台也是基于通过合成化学的接头连接的双链DNA文库测序。双链DNA吸附在磁珠上并在水-油乳液中扩增。然后将磁珠放入发生测序反应的铬尖晶石板上。铬尖晶石板上大量的孔提供了NGS所需的大规模并行布局。检测方法与其他平台的不同之处在于,合成化学通过两步反应检测添加的核苷酸。
第一步在添加后裂解三磷酸核苷酸,释放焦磷酸。第二步通过酶ATP硫酸化酶将焦磷酸转化为三磷酸腺苷(ATP)。第三步使用新合成的ATP催化荧光素通过荧光素酶转化成氧化荧光素,并且这个反应产生一个由电荷耦合成像从铬尖晶石板捕获的光量子。游离的核苷酸和未反应的ATP在每次加入后被聚谷氨酸氨基肽酶降解。这些步骤会被重复直到反应达到预定次数。在每次添加核苷酸之后记录光产生和孔的位置,允许重建核苷酸的特性和每个孔的序列。
这种方法被称为焦磷酸测序,与其他平台相比,这种测序化学的优点在于它允许较长的reads。在此平台上可以读取多达1000个碱基的长度。Roche拥有这个平台,并提供目前的GSFLX +系统以及较小的GS初级系统。每次运行读取次数高达100万次,平均每次读取700次,在不到1天的运行时间内就可以获得700Mb的序列数据。
4. IonTorrent
这个较新的平台通过其他平台的合成化学测序,利用接头连接的文库,但具有独特的特征。它不是检测荧光信号或光子,而是在加入核苷酸和产生质子时检测孔中溶液pH值的变化。这些变化是微乎其微的,但IonTorrent设备利用半导体开发的技术以实现对核酸测序有用的灵敏度和大小的检测。已经指出的一个限制是均聚物可能难以阅读,因为如果序列中下一个核苷酸是相同的核苷酸是无法停止仅添加一个核苷酸的。IonTorrent可以检测到更大的pH变化,并使用此测量读取聚合物区域。
这个平台在单次运行中产生的reads总数比其他平台少。例如,在运行10Gb数据的质子仪器上,产生读长200个碱基的60-80M的Read数目是可能的。但是,其他平台上的运行时间仅为2-4小时,而不是1-2周。由于既不需要修饰的核苷酸也不需要光学测量仪器,这个平台的优点是仪器和试剂都价格合理。该机器占地面积小,不使用时可以关闭电源并轻松恢复使用,而且只需很少的维护。随着便利性、大小和速度的提高,其已经在微生物测序、环境基因组学和临床应用中发挥着相当大的作用。该平台在扩增子测序和使用由特定用户群体开发的扩增子测序的引物模板方面也非常流行。它的低成本、小占地面积,吸引着那些希望拥有自己的测序仪的实验室。
5. PacificBiosciences
这是第三代测序平台的代表。这种化学方法与第二代相似,因为它是一个合成测序系统;然而,主要区别在于它只需要一个分子并实时读取所添加的核苷酸。因此,被称为SMRT实时单分子,单分子化学意味着不需要进行扩增。必须记住,这个平台对DNA分子进行测序。
由太平洋生物科学仪器公司实施的SMRT使用零模波导(ZMW)作为其技术的基础。ZMW是空间受限的室,可以将光能和试剂引导到体积非常小的沸石(10-21L)。在太平洋生物科学平台下转化为一个单室,其中包含一个单一的DNA聚合酶分子和一个实时测序的单个DNA分子。使用特定的荧光核苷酸三磷酸,合成时在核苷酸链上添加的A,C,G或T可以被检测到,并拥有巨大的速度优势。作为一个实时的工具,运行时间可以很短,只要一两个小时,平均读长可以是5000nt。酶和合成化学的改进可以产生高达10,000nt的常规reads,最长reads可以达30,000nt。PacBioRS II仪器可以在单次运行中产生高达250Mb的序列,因此通量不会受到影响。
作为单分子DNA的直接测序结果,核酸修饰如5-甲基胞嘧啶,在测序DNA聚合酶的动力学上引起一致且可重复的延迟。在平台上已经开发出了对DNA修饰的测序方法。目前,在这个平台上可以检测到多达25个碱基的修饰。更详细介绍见:三代基因测序你所需要知道的都在这儿了
6.纳米孔技术(NanoporeTechnologies)
尽管当前测序的通量高、成本低,但仍在努力继续改进测序技术。虽然目前的纳米孔技术正处于原型或开发阶段。但是,他们对未来的RNAseq测序影响可能很大。纳米孔测序是第三代单分子测序技术,其中使用单一酶来分离DNA链并引导其穿过嵌入膜中的蛋白质孔,离子同时通过孔隙产生被测量的电流。电流对通过孔的特定核苷酸敏感,因此A,C,G或T阻碍电流不同地流动并产生在孔中测量的信号。这个系统的优点是它的简单性使其是小平台的设备尺寸(例如,早期的声明表明这将是一个USB 尺寸大小的设备),但是这个系统在技术上是具有挑战性的,因为需要在单分子尺度上测量电流的微小变化。Oxford Nanopore正努力将该技术商业化,但是Illumina也正在开发纳米孔测序。Oxford Nanopore通过人造孔直接测量RNA、DNA或蛋白质。虽然这种技术商业化程度目前有限,但非常有前景。目前的一些最新研究进展如下:
供稿:胡庭
欢迎关注生信人
点击以下「关键词」,查看往期内容:
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史