前段时间小编的老班长给小编投了一个稿,关于TANRIC的,但是呢小编在搜资料的时候,发现人家已经有很好的整理的资料的。于是今天分享给大家。
文章来源:艾博思生物
lncRNA研究利器之"TANRIC":一个探索癌症中lncRNA功能的交互式开放平台
导语
德州大学安德森癌症中心(The University of Texas MD Anderson Cancer Center)的一群生物信息分析专家就把 对大数据进行了深入的挖掘,集成软件平台 The Atlas of Noncoding RNAs in Cancer ( TANRIC)供大家使用。点击本文左下方【阅读原文】即可直达网站首页。
《Cancer Research》报道摘要
长链非编码RNAs(long noncoding RNAs,lncRNA)已经成为癌症生物学中的关键参与者。使用最新的大规模RNA-seq数据集,特别是那些来自癌症基因组地图集(The Cancer Genome Atlas,TCGA)的数据集,我们开发了“癌症非编码RNAs地图集”(TANRIC;http://bioinformatics.mdanderson.org/main/TANRIC:Overview),一个用户友好的,开放访问的网络资源以交互式探索癌症中的lncRNAs。它以20种癌症的大量患者队列中的lncRNAs表达谱为特征,包括TCGA和独立数据集(总共> 8000个样品)。TANRIC使得研究者能够在临床环境下快速且直观地分析感兴趣的lncRNAs(已注释的lncRNAs或任何用户定义的lncRNAs)和其他分子数据,包括肿瘤类型内或跨肿瘤类型。软件开发者使用TANRIC鉴定了大量具有潜在生物医学标记的lncRNAs,其中许多显示与以确立的治疗靶标和跨肿瘤类型的生物标记,或者跨细胞系的药物敏感性强烈相关。TANRIC代表了研究lncRNAs在癌症中的功能和临床相关性的一种有价值工具,极大地促进了lncRNA相关的生物学发现和临床应用。
“TANRIC”数据资源
平台开发者利用了大量数据资源,主要包括三类:
第一类:6309个病人样品,其中包括6083个原发肿瘤样品,226个转移肿瘤样品,样品涵盖20中TCGA肿瘤类型以及它们相关的564例费肿瘤组织样品。详细信息如下:
bladder urothelial carcinoma (BLCA),
brain lower grade glioma (LGG),
breast invasive carcinoma (BRCA),
cervical squamous cell carcinoma and endocervical adenocarcinoma (CESC),
colon adenocarcinoma (COAD),
cutaneous melanoma (SKCM),
glioblastoma multiforme (GBM),
head and neck squamous cell carcinoma (HNSC),
kidney chromophobe (KICH),
kidney renal clear cell carcinoma (KIRC),
kidney renal papillary cell carcinoma (KIRP),
liver hepatocellular carcinoma (LIHC),
lung adenocarcinoma (LUAD),
lung squamous cell carcinoma (LUSC),
ovarian serous cystadenocarcinoma (OV),
prostate adenocarcinoma (PRAD),
rectum adenocarcinoma (READ),
stomach adenocarcinoma (STAD),
thyroid carcinoma (THCA),
uterine corpus endometrioid carcinoma (UCEC).
第二类:癌细胞系百科全书(Cancer Cell Line Encyclopedia cell lines ,CCLE)
第三类:文献研究在的资源分别来自531个样品的RNA-seq数据,三种肿瘤类型为:
lung adenocarcinoma
clear-cell renal cell carcinoma
glioblastomas
TANRIC数据库已经在库的RNA-seq资源已经包括了8143个样品。
“TANRIC”开放式数据平台
TANRIC一个交互式的数据分析和可视化的平台,三大类型的数据包括lncRNA注释信息,RNA-seq数据以及profling数据。分析类型主要由两种,一种是用户定义类分析,一种是平台预定义类分析。分析类型包括:lncRNA表达分析,基因组数据分析,临床数据分析。数据平台还包括了总结信息,可视化信息以及数据下载条目。
“TANRIC”发现大量具有临床意义的lncRNA
a)在配对的正常和肿瘤样品中差异表达lncRNA:柱状图代表组织中总的表达的lncRNA数量,红色代表差异表达的lncRNA数目
b)在肿瘤亚型中差异表达的lncRNA:柱状图代表组织中总的表达的lncRNA数量,蓝色代表在已知的肿瘤亚型中差异表达的lncRNA数目
c)柱状图代表组织中总的表达的lncRNA数量,绿色代表在不同临床期中差异表达的lncRNA数目,浅绿代表不同临床期一致减少或者一致增加的差异表达lncRNA数据
d)饼状图表示不同肿瘤类型具有生物标志意义的lncRNA数量百分比
“TANRIC”发现lncRNA与临床上有功能基因或者药物敏感性相关性
a)代表不同癌症类型中,与SCNA,mRNA和体细胞突变相关的lncRNA数量
b)多种癌症类型lncRNA-gene配对中,根据临床上可用功能基因分类,柱状图代表lncRNA-gene频率
c)Manhattan plot图代表lncRNA与CCLE细胞系药物IC50相关性,每一个点代表一个lncRNA与一个药物相关性,不同颜色代表lncRNA与不同药物的相关性
“TANRIC”发现lncRNA表达谱可以揭示临床上以及功能上的肿瘤亚型
a)lncRNA表达亚型分类与相关的肿瘤亚型分类呈现出广泛而强烈的相关性
b)lnRNA表达亚型与病人的生存期相关
c)通过lncRNA表达定义的肿瘤亚型中展现重要的信号通路差异表达,热图代表FDR统计学意义,其中包括lncRNA表达的肿瘤亚型以及蛋白表达通路指数。
“TANRIC”应用简单举例
我们点击进去分别选择肿瘤类型、输入关注的 lncRNA 名字、要研究的样品类型和关联分析的数据情况,然后提交查询即可。对于很多新的lncRNA没被NCBI等数据库收录的,这时候如果按照基因名是无法查询的,对此TANRIC也提供了基于lncRNA上外显子位置信息进行查询的方式,以 HOTAIR 为例,另外一种查询方式是:chr12: 54356092-54357908 ; 54359748- 54359867 ; 54360060-54360161 ; 54362401-54362698(分别是HOTAIR 上 4 个外显子的区域信息),这种方式查询的效果和直接查询 HOTAIR 是一样的。最后点击提交,我们只需静静的等待最终的结果即可。
在 LncRNA expr 那一列会提供每个样品的表达量信息,包括正常的组织和癌组织。需要注意的是这里的表达水平都是 log2 之后的值,也就是如果要做差异表达分析需要先转化过来才能比较,后续就可以计算 fold change 和做组间差异显著性检验了。
在 Diff subtype 那一列会计算 lncRNA 表达量与哪些临床指标相关,例如 TNM 分期等。在 Survival 那一列会计算 overall survival 与表达水平的相关性,以便于寻找具有临床意义的 biomarker 。
lncRNA 可以通过不同的作用机制影响下游基因的表达,在这里 TANRIC 通过计算候选lncRNA 和每个编码基因之间的相关系数,以此推断候选 lncRNA 直接作用的下游基因,并且以散点图的方式进行展示。
随着RNA调控机制研究的深入,有人提出了 ceRNA(competing endogenous RNAs)假说,该假说认为 microRNA 可以通过结合 mRNA 导致基因沉默,而 ceRNA 可以通过竞争性地结合 microRNA 来调节基因表达,越来越多的文章证明 lncRNA 也是可以发挥 ceRNA 功能的。对此,TANRIC 也是通过计算候选 lncRNA 和每个 microRNA 之间的相关系数,以此推断候选 lncRNA 直接作用的 microRNA 情况。
------------艾博思原创,转载注明出处!
欢迎关注生信人