收藏|免疫浸润分析方法大全
生信干货
shuang ·2020年9月9日 23:08
通过发挥促肿瘤作用和抗肿瘤作用,浸润肿瘤的免疫细胞可以深刻影响肿瘤的进展以及抗癌治疗的成功。因此,肿瘤浸润免疫细胞的量化有望揭示免疫系统在人类癌症中的多方面作用,并参与肿瘤逃逸机制和对治疗的反应。我们可以使用生物信息学方法从人肿瘤的RNA测序数据中量化肿瘤浸润的免疫细胞。这里小编就来从不同的方面介绍几种从转录组学数据量化免疫细胞的计算方法。
TIminer(http://icbi.i-med.ac.at/software/timiner/timiner.shtml)是一种用户友好的计算框架,可以执行不同的肿瘤免疫基因组分析,包括:人白细胞抗原(HLA)分型,新抗原预测,肿瘤免疫原性的确定以及基于三种不同的免疫基因集概要,用GSEAP对肿瘤浸润免疫亚群进行定量分析。
xCell(http://xcell.ucsf.edu/)是最近发布的基于ssGSEA的方法,该方法可估计64种免疫细胞类型的丰度分数,包括适应性和先天免疫细胞,造血祖细胞,上皮细胞和细胞外基质细胞。xCell基于从不同项目和研究的大规模表达数据中提取的489个基因集(FANTOM5,ENCODE,Blueprint,Immune Response In Silico (IRIS),Human Primary Cell Atlas (HPCA)和Novershtern等)。对于每种细胞类型,通过四个主要步骤计算xCell丰度得分:(i)使用R包GSVA对489个基因集单独进行ssGSEA(ii)在属于一种细胞类型的所有基因集的ES进行平均;(iii)将特定平台的ES转换为丰度分数;(iv)使用类似于用于流式细胞术数据分析的spillover方法校正紧密相关的细胞类型之间的相关性。尽管最终的xCell丰度分数不能直接解释为细胞分数,但它们与真实的细胞比例具有高度相关性。
MCP-counter(http://github.com/ebecht/MCPcounter)是一种基于标记基因集来量化肿瘤浸润免疫细胞、成纤维细胞和上皮细胞的方法。对于每种细胞类型和样品,将丰度得分计算为细胞类型特异性基因表达值的几何平均值。由于分数以任意单位表示,因此不能直接将其解释为细胞分数,也不能在细胞类型之间进行比较。但是,使用定量验证显示估计分数与真实细胞分数之间具有高度相关性,从而证明了MCP-counter在样品间比较中的价值。为了证明这些估计的预后价值,MCP-counter已用于量化32个非血液学肿瘤中19000多个样本中的免疫细胞和非免疫细胞。 二、基于表达特征对细胞混合物进行反褶积的肿瘤浸润免疫细胞量化方法1.Linear least squares regressionAbbas等人提出了一种基于线性最小二乘回归的方法来解决反卷积问题。为了测试从microarray表达数据的免疫细胞组分的反卷积方法,他们建立了一个涵盖17个血液衍生的免疫细胞亚群特征矩阵。分别使用流式细胞仪或库尔特颗粒计数仪作为金标准技术,对免疫细胞系进行了验证。尽管只评估了所考虑的细胞类型的有限,但测试证明真实和估计的细胞分数之间具有高度相关性。DeconRNASeq R包使用约束最小二乘和二次规划来确定具有最小误差的反卷积解来分析RNA-seq数据。该算法在模拟数据上得到了验证,该模拟数据是通过混合来自五个人体组织(大脑,骨骼肌,肺,肝和心脏)的RNA-seq数据生成的,并利用Illumina’s human Body Map 2.0的RNA-seq数据构建的特征矩阵并进行了验证。尽管没有开发出新颖的免疫特征,但该工具原则上可以应用于任何特征矩阵。
PERT是为了解决由于不同的微环境和发育条件而引起的基因表达的变异性从而提出了的模型。PERT使用非负最小二乘法解决反卷积问题,PERT方法在对脐带血样本的microarray数据进行去卷积方面显示出优异的性能。CIBERSORT算法(https://cibersort.stanford.edu/)考虑了由microarray数据构建的特征矩阵,22种免疫细胞表型的表达特征,包括不同的细胞类型和功能状态的免疫细胞。CIBERSORT使用ν-SVR估计细胞分数。通过对血液和淋巴结活检细胞混合物的microarray数据进行验证,CIBERSORT被证明在在9个免疫细胞亚群和3个免疫细胞亚群的同时反褶积方面具有较高的准确性。通过对四种恶性免疫细胞类型的模拟混合物进行测试,它还证明了对不同程度的噪音和未知的肿瘤具有鲁棒性。
TIMER(https://cistrome.shinyapps.io/timer/)利用IRIS数据库衍生的一系列免疫特异性标记以及从HPCA microarray数据中提取的免疫细胞表达特征来估算32种癌症中6种免疫细胞的丰度。从RNA-seq或microarray数据得出的每个研究的癌症表达基质都与免疫细胞表达基质融合,并用Combat标准化,以消除批次效应。通过从免疫细胞标记中选择与肿瘤纯度负相关的基因,可以分别识别每种癌症类型的特征基因。最后,对于每种癌症类型,考虑选定的免疫细胞标记物,从归一化的免疫细胞谱构建特征矩阵。TIMER已应用于32种TCGA癌症类型的10,000多个样本。
EPIC(https://gfellerlab.shinyapps.io/EPIC_1-1)是一种估计免疫和癌细胞比例的工具。EPIC使用约束最小二乘回归将非负性约束条件明确纳入反卷积问题,并强加每个样本中所有细胞分数的总和不超过一。经过文献数据验证后,对来自四个黑素瘤患者的淋巴结的RNA-seq数据进行了进一步的EPIC测试。EPIC估计与免疫细胞和未鉴定细胞的流式细胞仪计算的细胞分数高度吻合。
quanTIseq(http://icbi.i-med.ac.at/software/quantiseq/doc/index.html)是专门为RNA-seq数据开发的反褶积工具。quanTIseq不仅在文献数据集,血液来源的免疫细胞混合物和模拟数据上,而且在来自不同癌症类型的肿瘤RNA-seq数据上均具有很高的去卷积性能,并已用于量化8000多种免疫细胞组分TCGA大量肿瘤用RNA序列分析。
三、基于细胞组分和表达谱的同时反褶积的肿瘤浸润免疫细胞量化方法DSA(https://github.com/zhandong/DSA)是一种完整的反卷积算法,使用一组从混合组织样本中提取在特定细胞类型中高度表达的标记基因,从而推断复杂组织中的细胞组分和表达谱。对来自三种恶性免疫细胞系混合物的microarray数据进行了测试,该算法如实地重建了真实的细胞组分和表达谱。对来自六种不同免疫细胞类型混合物的模拟数据进行的验证表明,估计的表达谱与真实的表达谱之间存在高度相关性。
MMAD(http://sourceforge.net/projects/mmad/)是一种反卷积算法,当已知细胞比例或特征谱时,既可以执行部分反卷积,也可以基于标记基因进行完全反卷积。使用模拟数据和实验小鼠表达数据证明了成分表达谱的准确重建。
另外,还有deconf,ssKL和ssFrobenius等几种方法利用非负矩阵分解(NMF)来交替进行细胞比例和表达谱的最小二乘估计。Quantifying tumor-infiltrating immune cells from transcriptomics data