在整个基因转录翻译的过程当中,基因是在细胞核发生转录,然后出核到细胞质当中发生翻译。所以lncRNA而言。由于lncRNA的功能主要还是通过影响其他基因来实验的。所以lncRNA在不同的位置影响的功能肯定也就是不一样的。如果在细胞核,那就是参与转录调控了,经典的方式还是影响通过ceRNA的方式来进行调控,而如果在细胞质的话,那就参与转录后调控了,比如和mRNA形成互补双链来增加mRNA的稳定性。所以在研究lncRNA的时候,如果能知道lncRNA的定位还是很有必要的。今天就给大家介绍几个预测lncRNA定位的数据库。
老基因查询
如果我研究的那个基因是其他人已经研究很多的基因了。这种的一般都会有人去做其细胞定位的。这个时候,我们可以使用RNALocate(http://www.rna-society.org/rnalocate/)进行查询。这个数据库通过文本挖掘的方式,来挖掘了已经有研究报道的基因的定位。
这个数据库提供了我们检索的功能,我们只需要提供相关的基因名就可以来检索到结果了。
image.png
通过检索,我们就可以得到这个基因目前研究的定位的具体结果了。如果有结果的话,数据库会把相关的句子列出来。来证明其文章挖掘的正确性。同时如果这个定位结果来自于数据库,也会吧数据库的信息列出来。
image.png
需有注意的是,这个数据库是2017发表的。所以说关于基因定位的信息也就搜集到17年之前。所以如果这几年的基因研究结果就没在里面了。
新基因查询
如果我们研究的基因是新的基因的话,那就不能通过上面的数据库来进行查询了。这个时候就只能通过预测来做了。目前对于定位预测的方式主要还是基于基因序列来的。下面介绍的两个预测数据库也是基于上面RNALocate的数据来的。由于在RNALocate已经知道了很多lncRNA的定位了,所以基于这些RNA的定位的序列。来进行机器学习来获得一个相关的模型。进而对输入的基因序列来进行位置预测。
所以,这两个数据库我们只需要数据目标序列就行。而两个数据库的差别其实也就是算法的不同而已。
lncLocator
lncLocator(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/) 打开页面是这样子的。我们需要做的就是简洁的3步。
image
拿这个网站自带的示例来具体操作一遍,然后提交就可以得到结果。
(其中第二步邮箱只是为了保存数据结果,以后查看更方便,这里暂时不选择了)
image
提交后,我们就可以知道这个序列在每个地方的具体评分了。
image
iLoc-LncRNA
iLoc-LncRNA(http://lin-group.cn/server/iLoc-LncRNA/predictor.php)也是一样,我们只需要数据基因序列即可。
image
依旧拿网站自带的example示例,输入后提交即可
image
image
自制的有可能有效的方法
PS:这个方法是之前在看另外一个数据库的时候想到的。至于有没有效,我觉得可以尝试一下。
之前我们的介绍ENCODE数据库的时候,提到他们做了很多细胞;组织的测序结果。而在里面对于细胞系的测序结果。他们其实还分了细胞核测序以及细胞质测序的结果。所以呢,基于这个结果,我们就可以知道某一个基因/lncRNA是在核表达还是在细胞质表达了。但是呢,这些ENCODE做了细胞系可能不全,只是其中代表性的几个。所以呢,有可能我们研究的疾病相关的细胞系就没在里面也是正常。所以并不一定适用于所有人。
image.png
数据库总结
由于lncRNA的定位确实影响其功能的发挥。所以,在进行研究之前进行一下预测总是没有坏处的。不然万一设计了ceRNA的实验,结果发现在细胞核里面不表达这个lncRNA。那就尴尬了。。
欢迎关注公众号:数据库百科,一个介绍医学科研相关数据库使用的公众号
image.png










网友评论