今天给大家分享一篇有关于环状RNA的研究[Integrative Analysis Reveals Key Circular RNA in Atrial Fibrillation]。circRNA (环状RNA)是一类新兴的RNA物种,在基因表达调控中发挥着重要的调控作用,由于其丰富、稳定、细胞或组织特异性表达,可作为许多疾病的诊断生物标志物。然而,circRNA与房颤之间的关系尚不明确。为了揭示circRNA与房颤的关系,对circRNA进行了综合分析,并在房颤淋巴细胞中识别了失调的circRNA。基于富集分析注释了失调的circRNA的功能,发现了参与炎症反应生物过程的几个circRNA。
流程:
(1)数据收集和格式转换。使用SRA Toolkit从SRA数据库下载6例房颤患者和6例健康个体的RNA测序数据,并将SRA格式的文件转换成双末端的FASTQ文件。
(2)RNA测序数据分析。对于基因的表达定量,使用hisat2将样本的RNA-seq读段映射到UCSC人参考基因组(hg19),生成的SAM文件由SAMtools排序,通过具有GENCODE注释的StringTie来量化基因表达。对于circRNA的检测和定量,使用BWA-mem比对工具将RNA-seq读段映射到hg19,用GENCODE注释的CIRI-2对circRNA进行预测和定量。
(3)差异表达分析。DESeq2是基于负二项分布的差异表达分析包,通过DESeq2来识别差异表达基因和circRNA,并在WebGestalt进行GO和KEGG富集分析。
(4)蛋白质相互作用分析。使用STRING在线软件检索由不同表达的基因编码的蛋白质的相互作用。
(5)miRNA靶点预测。Miranda被用来预测circRNA的miRNA结合位点。从MiRTarBase中获取miRNA-mRNA相互作用。结合miRNA与mRNA的逆向共表达分析,预测miRNA与mRNA相互作用对。
(6)竞争性内源RNA预测。ceRNA通过与mRNA竞争miRNA而起作用,每对circRNA-mRNA共有的miRNA数量应该明显更多。对于每个circRNA-mRNA对,Fisher精确检验用于评估共享miRNA的显著性。
(7)circRNA的功能注释。使用Cytoscape软件合并和可视化PPI和ceRNA网络。通过对合并网络中的一个节点内与这些circRNA连接的基因进行KEGG通路富集分析来预测circRNA的功能。
结果:
1.从房颤和健康个体中识别淋巴细胞中的circRNA
从SRA数据库中收集了6例房颤患者和6例健康个体的RNA测序数据。测序数据分析共识别出52024个circRNA,其中房颤和健康个体中均识别出28384个circRNA(图A)。基因组注释显示这些circRNA主要来自外显子(77%),其次是内含子(13%)和基因间区(10%),表明相当一部分circRNA在淋巴细胞中未注释的剪接位点被环化(图B))。此外,对于每个样品中circRNA表达水平的分布,发现大多数circRNA以低水平表达(图D)。然而,每个样品中还有约25%的circRNA以更高水平表达。
2. 房颤中失调基因和circRNA的识别
为了识别失调的基因和circRNA,作者分别对基因和circRNA表达谱进行了差异表达分析。与健康个体相比,分别识别了713个上调和994个下调基因,以及250个上调和126个下调的房颤中的circRNA(图A,B)。对失调的circRNA表达谱的层次聚类分析显示,房颤个体的样本可以与健康个体样本清楚地区分(图C),表明失调的circRNA可以作为淋巴细胞中潜在的房颤诊断生物标志物。
3. GO和KEGG分析失调的circRNA亲本基因
circRNA与其亲本基因之间存在密切关联,可能影响其亲本基因的表达。为了研究房颤样本中与正常样本相比失调的circRNA的亲本基因功能,对其亲本基因进行了基因集富集分析。Go功能分析表明,上调基因主要参与染色体分离调控,DNA修复等过程(图A)。下调基因主要富集在与组蛋白修饰,子宫胚胎发育和生殖系统发育相关的类别(图B)。KEGG通路分析显示,上调的基因主要富集在与RNA转运,细胞周期,p53信号通路相关的通路中(图C)。下调的基因主要与同源重组,癌症中的转录失调相关(图D)。
4.外显子区域中失调的circRNA的选择性环化
选择性RNA环化只通过反向剪接位点来确定,可以基于注释的转录本推断出circRNA的基因结构。为了避免模糊基因结构的出现,在这种分析中仅包括外显子circRNA。结果发现24个基因有2个以上的circRNA亚型,其中20个产生2个亚型,4个产生3个亚型(图A)。还观察到包括NCOA1、ANKRD36BP2等在内的6个基因产生了具有相反表达模式的circRNA亚型(图B),表明这些表达转换的circRNA亚型可能具有相反的功能。
5.通过整合潜在的ceRNA和PPI网络对circRNA的功能注释
作者以严格模式预测了Mirandami的43307个miRNA-circRNA之间的相互作用。还从MiRTarBase中收集了实验验证的322389个miRNA-mRNA相互作用。为了构建ceRNA网络,通过Fisher精确检验估计了circRNA-mRNA对的显著性。此外,还分别将上调和下调的蛋白质编码基因定位到PPI网络。为了描述circRNA的生物学功能,将潜在的ceRNA网络与PPI网络合并,并对合并网络中一个节点内与circRNA相关的基因进行KEGG富集分析。最后发现,5个circRNA在富集分析中显示出最高的显著性,其中4个富集在细胞因子-细胞因子受体相互作用(图A)。值得注意的是,作为趋化因子受体的CCR5是ceRNA网络中三个circRNA的靶点,表明这三个circRNA可通过CCR5增强细胞因子-细胞因子受体相互作用的活性。此外如图B所示,circRNA富集的通路主要与炎症相关,表明这些通路的circRNA可能参与炎症反应的生物学过程。
总的来说,本研究识别了6个基因,包括NCOA1,ANKRD36BP2,PAPD4,PRRC2C,SCLT1和EIF2AK1,产生了具有相反表达模式的circRNA亚型,并且描述了一些与房颤炎症反应相关的circRNA。本研究提高了对房颤中circRNA作用的理解,而且为房颤相关研究提供了潜在功能性circRNA的候选者。
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史