23+Circulation|一篇经典的单细胞思路
生信干货
虎哥 ·2020年11月13日 03:28
Hello,大家好呀,今天和大家分享一篇最近发表在Circulation(IF:23)上的单细胞测序文章思路,感兴趣的小伙伴可以竖起耳朵喽!美国Baylor医学院的Ying H. Shen 团队采用单细胞转录组测序技术对人类降主动脉血管壁进行分析,综合描述了升主动脉瘤中分子特征,该结果发表于心血管领域顶级期刊《Circulation》中,题目为“Single-Cell Transcriptome Analysis Reveals Dynamic Cell Populations and Differential Gene Expression Patterns in Control and Aneurysmal Human Aortic Tissue”首先对于我这种单细胞小白,我一般会用R语言来进行分析,原因也很简单,Seurat真的很不错呢!下图来自运来兄,从图中我们可以看出整个Seurat的经典分析思路,分别是数据读--均一化和标准化—特征选择与提取—聚类—差异分析—可视化降维—细胞周期分析等,并且在每一步中的方法也是多种多样的。比如我在进行单细胞分析中,发现在感染中的细胞周期基因对我细胞分群的影响超大,那么我在分群当中就需要考虑是否要去掉周期相关基因等。
经典套路一 细胞分群
对来自3名志愿者的正常主动脉组织和8名ATAA患者的主动脉瘤组织进行单细胞分析,共获得48128个细胞,根据差异基因以及标记基因将其分为11个主要亚群,包括两群平滑肌细胞、成纤维细胞、间充质干细胞、内皮细胞、单核细胞/巨噬细胞/树突状细胞、T淋巴细胞、自然杀伤性细胞、肥大细胞、B细胞和血浆来源细胞。
从图一中我们可以看出作者满满套路,其实这里面很重要的一点就是细胞死活,一定要去染死活,否则真的好容易完蛋(我有深刻的历史教训,哈哈哈)。在图1B中我们看见作者使用单一marker,其实我个人分了无数群之后,发现除了免疫细胞好分之外,很多细胞分群真是个硬功夫,你见过即表达内皮又表达上皮的细胞marker吗,你认为他是新亚群吗,你敢做湿实验验证一下吗?哈哈哈哈哈,我感觉很多新的细胞亚群其实是先知道后用单细胞去讲故事,用单细胞讲新细胞亚群的故事其实真的很难。。。我有无数次想讲。。。。对了,其实免疫细胞也有不好分的细胞,你们见过既表达CD3D又表达KLRD1的细胞吗,我见过,并且都是,我实在是不太明白该叫T,NK还是NKT细胞。。。经典套路二 细胞分群细分
为进一步研究非免疫细胞群特征,研究者对该群细胞进行聚类分析,共得到15种非免疫细胞类群,并对其不同亚群的特征及细胞间通讯进行评估。这里其实我需要重点提一下,10X捕获的细胞应该是有偏向性的,当然这也与细胞的性质有关,如果我们在不进行分选直接上机会出现免疫细胞占绝大多数,后期不利于分析,但如果使用流式分选,一样的问题,细胞存活率是关键,用什么抗体进行分选更是关键。
在15个非免疫细胞亚群中,5个为平滑肌细胞亚群。收缩表型的SMC具有ACTC1,ACTA2,MYL9等基因的高表达,但胶原及蛋白聚糖表达较低。相比之下,应激态SMC具有多种应激相关基因,如FOS,ATF3,JUN及HSPB8的表达,表明该类细胞应激反应的 激活。增殖性平滑肌细胞亚群高表达细胞周期蛋白和分泌表型基因,如MGP,TPM4,MYH10等。肌成纤维细胞包含肌细胞和成纤维细胞相关基因,包括ACTA2,MYL9,COL1A2,COL8A1。相比于其他SMC亚群,肌成纤维细胞的胶原及蛋白聚糖表达量更高。
研究者发现在应激性平滑肌细胞和T_HSP, T_Stress细胞亚群中JUN,FOS及HSP基因均为保守性标记基因。既往研究表明37℃胶原酶分离组织时会导致这三种基因的表达升高,因此这三种类群可能由于组织消化导致、并非代表生理状态下类群。 我在做病毒感染后的单细胞分析中,发现多数细胞在感染进程下炎症相关基因表达都是十分一致,包括什么上皮内皮,都一样,和免疫细胞相比,他们表达一些炎性基因也很强。经典套路三 特定基因功能分析

为探索ATAA组织中的关键性改变,研究者进一步对比了不同细胞类群中的差异基因。GSEA分析表明,氧化磷酸化在7个亚群中上调。但虽然线粒体为氧化磷酸化的主要场所,多种细胞亚群中线粒体基因数量却减少,染色质中氧化磷酸化相关基因增多。对每种细胞中的基因进行比较后发现40个细胞亚群中有24种细胞出现显著的线粒体基因表达减低。因此研究者猜想ATAA组织可能存在细胞线粒体功能的减低,因此在线粒体相关基因抑制状态下,染色质氧化磷酸化基因主要用于维持细胞内能量供应。 哈哈哈,虽然我不是研究有关ATAA代谢方面的,但我几乎可以肯定作者的结论是先前就已经知道了,然后在去用单细胞中氧化磷酸化有关基因的普遍降低来验证此观点。我们发现作者使用的是GSEA去做基因富集,其实做基因富集的方法又很多,包括GO,GSVA等。哪种好,我个人其实没有什么偏好性,感觉结果不会差很多。经典套路四 公共数据库的应用

图5:ERG在平滑肌细胞、成纤维细胞及内皮细胞中的潜在作用接下来,研究者计算了富集基因与染色质区域的距离,发现这些差异基因与已知SNP距离相比于随机选择基因更近。研究人员然后提取出主动脉瘤相关SNP并与本研究得到的差异基因进行关联分析,发现11个基因在对照组和ATAA组中16种细胞内有显著差异,其中TWIST1与EGR为两种编码转录组的基因,后者高表达与54个人体主动脉组织和细胞中。与之相关的SNP为RS2836411.研究者发现ERG在增殖性平滑肌细胞,部分炎症表型细胞、成纤维细胞和内皮细胞中表达减低。GO分析表明该内皮细胞下调基因主要富集于细胞凋亡、活性氧相关反应以及内质网相关通路中。成纤维细胞亚群1和增殖性平滑肌细胞亚群中分别有18个基因和6个基因可能受ERG调控。以上结果表明ERG可能为调节主动脉壁正常功能的关键基因,其可能在维持平滑肌、内皮及成纤维细胞的功能中发挥重要作用。公共数据库的应用对于文章最后结论的推广至关重要,其实单细胞方面的数据库就已经很多了,比如PanglaoDB,Single Cell Portal等,学会使用公共数据库,不仅可以帮你充实数据,最重要的,可以帮老板省钱,哈哈哈哈。其实整篇文章中还缺少一个在单细胞中非常重要的分析,就是套路四细胞之间的配受体相互作用,现在的配受对表也很多,软件也可以试一试Cellchat,都将会为文章增色不少哒!参考文献
Li Y, Ren P, Dawson A, Vasquez HG, Ageedi W, Zhang C, Luo W, Chen R, Li Y, Kim S, Lu HS, Cassis LA, Coselli JS, Daugherty A, Shen YH, LeMaire SA. Single-Cell Transcriptome Analysis Reveals Dynamic Cell Populations and Differential Gene Expression Patterns in Control and Aneurysmal Human Aortic Tissue. Circulation. 2020 Oct 6;142(14):1374-1388. doi: 10.1161/CIRCULATIONAHA.120.046528. Epub 2020 Oct 5. PMID: 33017217; PMCID: PMC7539140.