写在前面
作为一名科研狗,重来,是研究生,想来最重要的就是课题能否顺利的进行,当满心欢喜的搞好了实验设计发给老板,一天不到就被打回来,内心那是满满的崩溃。但是和小伙伴出去浪一下,不对,是学术交流一下,听他们说说不靠谱的实验设计做不下去了,要换题重头来,马上就释怀了,还有点窃喜老板指出了至关重要的问题。所以今天我们就聊聊我之前实验设计的关键性的问题--------lncRNA非常低的保守性。这个问题对于只想发个5分以下文章的朋友来说无关痛痒,请自动忽略。但是如果你想让自己的文章高大上,加一点动物实验,那么问题来了,你最爱的那个lncRNA在小鼠中有同源序列吗?研究发现,人与小鼠间lncRNA的保守性仅20%,那么你是否是那幸运的20%呢?如果不在那20%还有没有办法做动物实验呢?接下来我们康康如何找到lncRNA的同源序列。
20%的幸运儿
最简单的方法就是NCBI(https://www.ncbi.nlm.nih.gov/)直接搜索,就拿经典的lncRNA Xist举个栗子,首先进入NCBI选择Gene*****数据库(https://www.ncbi.nlm.nih.gov/gene/),输入Xist,如果你在Results by taxon这个位置看到了Mus musculus******,*那么恭喜你,你就是幸运的那20%,你研究的lncRNA在人和小鼠当中都存在。

剩下的只需要进入这个基因的具体信息界面,点进去找到Genomic-FASTA格式保存序列就大功告成了。

80%的大多数人
当然对于我们大多数人而言,可能就没那么幸运了。所以这里我们就来说一下80%的情况。这个时候我们可以参考一片一篇2018年发表在nature medicine上的文章,作者团队是最初是在小鼠中发现一个lncRNA MeXis并研究其作用,最后在人体细胞中验证功能。这里我们就借鉴这个文献的方法来尝试去寻找那80%的解决办法。

我们边讲解文章边展示相关步骤,首先交代一下文章背景,LXR一种固醇激活的核受体,可调节维持胆固醇稳态的相关基因表达,与动脉粥样硬化的发病息息相关,作者最初目的是研究LXR在动脉粥样硬化发展中的作用。通过激活小鼠腹膜巨噬细胞中LXR后做转录组分析,获得了受到调节的一系列lncRNA。
基于之前的研究,作者知道Abca1是LXR的一个调节因子。由于lncRNA的功能常与邻近基因功能相关(所谓的cis调控)。所以基于基因组位置定位。作者找到了Abca1邻近的lncRNA MeXis(AI427809)。作者在人体细胞验证时,同样以ABCA1的定位作为参考。接下来我们实际操作一下。
- 这次我们使用UCSC(https://genome.ucsc.edu/)数据库,在数据库主页选择Mouse CRCm38/mm10

- 输入Abca1,选择第一个基因。
- 默认的是不存在其他物种同源性比对的结果的。所以我们需要调整出同源性区域。在Comparative Genomics的conservation选择full。
- 接下来选择lncRNA MeXis(AI427809)区域,可以看到鼠MeXis在人类中的同源区域。点击同源序列区域进入到Multiz Alignments 界面,将鼠标放在Human的B的位置会显示MeXis对应在人类中的同源序列区域是chr9:107,813,887-107,833,248,
- 知道保守性区域之后,我们在在human GRCh37/hg19中定位到lncRNA TCONS00016111, 有的同学可能看不到这个lncRNA,你只需要把Genes and gene predictions中的lincRNAs选成full就ok啦。

通过以上的步骤,我们就找到了两个lncRNA了。最后对找到两个lncRNA的序列在MAFFT (https://www.ebi.ac.uk/Tools/msa/mafft/) 或者其它序列比对的软件中blast一下看看究竟有多少同源序列。

这个就是找到同源lncRNA的方法,当然啦,可能这种方式找到的lncRNA在位置上有一定误差,可能部分重合,还要结合后续实验验证,今天就到这里啦。
总的来说
对于lncRNA的跨物种研究,由于其保守性相对来说很低,所以想要找到相同基因在不同的物种上,可能需要花费一些时间。以上提供了一个简单的操作方法。有需要进行跨物种的研究lncRNA的,可以试一下。另外对于跨物种序列的比较。一般而言都是通过进化分析来看的。关于进化分析的基本操作以及可视化。可以参考我们第二个和第三个帖子。
网友评论