科研成果的快速展示在如今的科研中扮演着重要的角色,知识的快速传递和共享在互联网时代对科学的进步越发重要。在这样一种大背景下,预印本(preprint)——一种一经上传不需审稿即刻公开的“研究草稿”——应运而生了。国际上,通过社交媒体进行宣传的预印本稿件非常普遍。
目前在国内,preprint的报道还较为罕见。为了将最新的生信进展传递给广大读者,我们的小编特地为大家挑选了过去一个月内康奈尔大学预印本服务器bioRxiv上面的6篇“呼之预出”的生信类稿件,并对这些稿件进行带有个人风格的概述和简评,欢迎大家拍砖。
3D组合拳
Integrating Hi-C and FISH data for modeling 3D organizations of chromosomes (1)
染色体的三维结构是目前组学研究的重要课题。基于3C(chromosome conformation capture)技术的Hi-C在近几年迅速风靡全球。此外,传统的FISH(荧光原位杂交)通过对光学信号的分析,也是研究三维基因组学的有力武器。然而,尽管互相补充,这两种方法在使用上从未有过真正意义上的“交集”。来自清华大学的曾坚阳教授所领导的团队提出了一种全新的方法GEM-FISH,该方法综合了Hi-C同FISH数据对染色体三维结构进行modelling,一举改变了两种技术单兵作战的格局。该方法基于分治算法(divide-and-conquer),先利用Hi-C和FISH数据得到TAD(Topologically associating domain)水平的3D模型,再对每一个TAD的内部进行处理。作者认为,这套组合拳可以对基因组的三维结构进行更加精准的建模。
3C技术示意图(来自维基)
黑熊冬眠
Genome assembly and gene expression in the American black bear provides new insights into the renal response to hibernation (2)
来自美国Jackson Laboratory等科研单位的合作团队在bioRxiv中发文表示他们完成了对美洲黑熊Ursus americanus基因组的高质量组装!
图片来自North American Bear Center的网络资源
众所周知,黑熊在冬眠过程中的肾脏代谢降至非常低的水平。作者们在完成基因组测序之后又进行了RNA-seq。通过比较深秋(late fall)刚刚进入冬眠和早春(early spring)行将苏醒的黑熊的肾脏转录组,作者找到了169个差异表达基因(differentially expressed gene),其中101个在冬眠后下调,68个上调。鉴定差异表达基因所采用的软件是DESEQ-2,标准是FDR 0.05以下。虽然对这些基因功能的进一步分析并未发现有任何pathway enrichment,作者认为cytokine suppression genes表达的的上调和lack of increased expression of cytokines and genes involved ininflammation都是十分有价值的发现。作者还表示该结果对人类慢性肾病(Chronic Kidney Disease)的研究也将有一定帮助。
Make PHAST faster
phastWeb: a web interface for evolutionary conservation scoring of multiple sequence alignments using phastCons and phyloP (3)
著名的PHAST(PHylogenetic Analysis with Space/Timemodels,注意和噬菌体分析预测软件phast不同)在2002年问世以来,一直没有GUI(graphical user interface)的支持。最近,PHAST的开发者(Adam Siepel)所领导的团队推出了该软件包在线版本。想做phastCons和phyloP的朋友可以通过访问http://compgen.cshl.edu/phastweb/,更加轻松简洁地使用PHAST,而不必担心不习惯于命令行指令了。
只需要提交序列比对即可,格式可以是MAF,fasta,或者phylip
注意运算时间和物种数以及序列长度的关系如下图所示:
以上截图来自网站:http://compgen.cshl.edu/phastweb/
When deep learning and Riboseq come together
DeepRibo: precise gene annotation of prokaryotes using deep learning and ribosome profiling data (4)
来自比利时根特大学(Ghent University)的三名科学家提出了一种卷积神经网络(CNN)和循环神经网络(RNN)相结合的方法,DeepRibo,用以预测原核生物中的开放阅读框(ORF)。该方法综合分析riboseq和原核生物中基因的核糖体结合序列Shine-Dalgarno(SD)序列,并采用了来自不同原核生物的许多riboseq数据集进行了training。此外,作者对DeepRibo的预测结果利用质谱数据进行了验证,结果显示DeepRibo效果拔群。
染色体碎裂与癌症
Comprehensive analysis of chromothripsisin 2,658 human cancers using whole-genome sequencing (5)
染色体碎裂(chromothripsis)是一种最新发现的在包括癌症的一些疾病中发现的现象。该现象,简而言之,就是染色体在DNA replication时发生意外而被打成碎片并以其他方式重组,该过程中可能会发生染色体片段的丢失。该现象此前已有报道。
图片来自维基
来自哈佛医学院、北京大学、PCAWG Structural Variation Working Group等多家单位的科学家们通过对2,658 tumors spanning 39 cancer types的全基因组测序数据的分析,发现了染色体碎裂在癌症中是普遍存在的(pervasive)。作者还发现染色体碎裂在有些时候会在多条染色体中都有发生。此外,在重组方式上,除了传统的非同源末端连接(non-homologous end-joining;NHEJ)外,作者还发现有signatures of replicative processesand templated insertions。
图片来自原文(CC-BY 4.0)
昆虫的味觉起源
The origin of the odorant receptor gene family in insects (6)
对空气中化学物质的感知可以传递重要的嗅觉信息,而这需要气味受体(odorant receptor,OR)的参与。OR在陆生动物的进化中有多次独立起源(7)。2014年,来自德国耶拿的马普化学生态学研究所的Missbach, Dweck (8)通过对两种早期分支(early split)的昆虫(分别来自衣鱼目Zygentoma,下图紫色,和石蛃目Archaeognatha,下图绿色)的触角的转录组测序,发现它们都缺少OR,只有一种与OR相关的受体Orco(olfactory coreceptor )。由于这两种昆虫都没有翅膀,Missbach, Dweck (8)认为OR在昆虫中的起源实在昆虫进化出飞行能力之后,意味着OR和对飞行生活的适应有关。该项研究发表在著名期刊《电子生活》(elife)。
图片来自(6)(CC-BY 4.0)
石蛃目(左),石蛃目(右),图片来自维基
而在这篇preprint中,作者通过对马普所团队所测转录组的同种衣鱼Thermobia domestica的全基因组测序,和详尽的基因系统发育分析,发现OR基因不仅是存在于包括石蛃目和衣鱼目昆虫在内的所有昆虫中,而且拷贝数还很高;但是,OR基因在其他的非昆虫六足类动物(non-hexapods)且于潮湿环境里生存的双尾目和弹尾目(Diplura, Collembola,见上图)的基因组里都难觅踪迹,从而反驳了此前马普所Missbach等人的结论。据此,作者作出如下几个判断:
OR的起源是昆虫独有的,无论有无翅膀,推翻2014年马普所Missbach, Dweck (8)的结果
由于昆虫皆为陆生,作者推断昆虫OR基因对于适应陆生生活有重要意义
OR的起源是昆虫中第一例分子水平上的共源性状(synapomorphy)
左为共源性状,注意与平行进化的关系(右)。图片来自维基
尽管这个工作很出色,但小编个人认为前两点尚有待进一步考察,理由是除昆虫外的其他六足类动物、以及昆虫中的早期分支的基因组还太少;而且本文中全基因组测序的结果找到了31个编码OR的基因(43种转录本,上上上图),而马普所Missbach, Dweck (8)的转录组测序只找到3个OR转录本,结果相差甚多,比较奇怪。而第三点,个人认为升华过高(如果维基的synapomorphy条目没有欺骗我)。让我们拭目以待文章正式刊发出来这些地方会不会有所改动。
okay,看了这么多精彩的预印本稿件,也希望大家可以多尝试预印本这种形式,促进科学交流和知识共享,使自己的工作让更多的科学工作者先睹为快。
参考资料
1. Abbas A, He X, Zhou B, Zhu G, Ma Z, Gao J-T, et al. Integrating Hi-C and FISH data for modeling 3D organizations of chromosomes. bioRxiv. 2018.
2. Srivastiva A, Sarsani V, Fiddes I, Sheehan S, Seger R, Barter M, et al. Genome assembly and gene expression in the American black bear provides new insights into the renal response to hibernation. bioRxiv. 2018.
3. Ramani R, Krumholz K, Huang Y, Siepel A. phastWeb: a web interface for evolutionary conservation scoring of multiple sequence alignments using phastCons and phyloP. bioRxiv. 2018.
4. Clauwaert J, Menschaert G, Waegeman W. DeepRibo: precise gene annotation of prokaryotes using deep learning and ribosome profiling data. bioRxiv. 2018.
5. Cortes-Ciriano I, Lee J-K, Xi R, Jain D, Jung YL, Yang L, et al. Comprehensive analysis of chromothripsis in 2,658 human cancers using whole-genome sequencing. bioRxiv. 2018.
6. Robertson HM. On the origin of the odorant receptor gene family in insects: evidence from the dragonfly Ladona fulva and the mayfly Ephemera danica. bioRxiv. 2018.
7. Hansson BS, Stensmyr MC. Evolution of insect olfaction. Neuron. 2011;72(5):698-711.
8. Missbach C, Dweck HK, Vogel H, Vilcinskas A, Stensmyr MC, Hansson BS, et al. Evolution of insect olfactory receptors. elife. 2014;3:e02115.
更多精彩内容,欢迎关注生信人
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史