表达谱数据分析的时候,经常包括各种各样的分析。比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等。NetwordAnalyst是一个一站式分析转录组数据的数据库。在这里我们可以分析常见的一些分析。
image.png
基本介绍
数据库一共包括 五种分析方式:
- 输入网络数据:比如从蛋白相互作用数据库下载下来的网络对应数据来进行可视化。其实功能类似于简易版的
cytoscape。下图就是输入数据后得到的默认网络。 -
gene list input:如果我们已经有目标基因了,需要进行富集分析;蛋白相互作用分析等。同时我们也可以输入多个数据集的结果,然后得到venn图相关的重叠结果进行分析。 -
Gene Expression Table: 我们来输入RNA-seq或者microarray的表达矩阵,来进行下一步分析。 -
Raw RNA-seq Data: 输入RNA-seq的 fastq格式的数据来进行下游分析。 -
Multiple Gene Expression Tables: 输入多个数据集的表达矩阵,来对多个数据集进行整合的分析。
由于网站的功能很多,但是后续分析的结果类似,所以我们就用Multiple Gene Expression Tables来进行演示。
Multiple Gene Expression Tables
数据输入
点击Multiple Gene Expression Tables后,我们可以看到这样上传数据的界面。上传的表达矩阵的样本不能大于1000。
image.png
我们通过点击Add New来上传表达矩阵。表达矩阵应该是是这样的一个格式。
第一行是样本的变化,同时用 #来增加一个NAME的表示代表第一列为基因名。
第二行是本次实验设计的分组。
后面的行数则为表达矩阵,第一列是基因ID。
PS:
image.png
我们使用实例文件来进行分析,实例文件包括三个数据集,两个RNA-seq以及一个芯片数据。
image.png
上传数据完成后,点击Proceed下一步。这里会提示我们是否想要下载一个融合的数据集,如果想要下载的话,可以点击Download。我们点击Next可以进行下一步
image.png
质量评估
分析的第一步就是对数据进行质量评估,评估每个样本的分布,这个网站提供了两种对于样本评估的方式。PCA图和密度图
image.png
同时网站还提供了,对于不同数据集进行batch effect批次效应的矫正。
image.png
通过通过矫正完,可以看到矫正完的PCA图和密度图。
image.png
进行批次效应完事儿,我们点击Proceed。
荟萃分析
通过完质量评估,并且去掉批次效应后,我们可以进行荟萃分析来结合不同数据库的结果来得到重叠的结果。数据库提供了不同的进行数据结果融合的方法,同时也给了推荐指数。
image.png
我们选择第一个点击submit,然后点击Proceed。
差异基因
通过上面两部,我们可以得到差异表达基因。
image.png
同时我们点击View可以看到这个基因在每个数据集当中的变化。
image.png
接下来我们点击Proceed。
下游分析
在下游分析中,网站给了现有的一些常用的分析。这些平时我们都是通过不同的软件来做的,但是这个网站整合到一起了。
PS:而且用一种正确的方式整合到一起了。(真的会有人会用差异分析的结果去做GSEA的)。
image.png
由于分析的结果较多,我们以Netword Visual Analytics来对来对其中的结果进行说明。剩下的大家可以自己去点点看。点击Netword Visual Analytics后,会让我们来选择用什么数据集。我们可以选择重叠的数据集也可以选择各自的数据集。我们选择融合的数据集。
image.png
点击完后,我们可以看到,很多目前文章里面做的网络都可以进行做。其中包括·蛋白相互作用分析(PPI); 转录调控网络; 疾病/药物相关网络;共表达网络
image.png
而且网站对于一个分析也有很多其他的数据库可以选择。例如基因的蛋白相互作用(Generic PPI)。就可以选择string或者IMEx数据库。
image.png
我们选择好点击OK后,即可得到。对于网络的分析的一个初步的结果
image.png
下载
所有分析的结果,我们都可以下载下来
image.png
PS:其实目前很多基础的芯片数据分析的文章用这个网站就够了。而且方法也对,不会让一些不是很懂用法的虽然使用分析方式。当然同样的,这些也是最基本的分析方法,特别的还是需要自己分析的。









网友评论