Cistrome DB是目前最全面的研究ChIP-seq和DNase-seq的数据库,用于人和小鼠转录和表观遗传基因调控数据的收录。截止目前为止,总共收录了30451人和26013小鼠的转录因子、组蛋白修饰和染色质可及性样本,并且还在不断的维护和纳入新数据。
可以说,学会使用cistrome,是每个表观遗传学者必备的技能,下面就来学习具体的使用方法。
1. 搜索你感兴趣的实验,细胞或组织
Cistrome DB包含两种搜索数据的方法:
- 选择实验、物种或者生物来源
-
通过关键词高级搜索
2. 每个数据集的结果展示
每个ChIP-seq和DNase-seq样本都有唯一的数据集ID,Cistrome DB对每个数据集进行统一分析,给出物种、因子、生物来源、发表时间和处理过程的注释结果。单击感兴趣的数据集,结果页面包含详细的数据注释、质控报告、分析结果和下载选项。此外,也可以发送数据到Cistrome分析页面进行分析。



质控结果包括uniquely mapped reads、peaks总数、FRiP、启动子区/外显子区/内含子区/基因间区peaks占比、TSS分布图等。
单击每个motif编号,查看详细motif logo。
3. 批量样本基因组展示
CistromeDB还提供批量数据查看功能。选择感兴趣的数据集,单击WashU Browser或UCSC Browser进行关联研究,比如研究辅因子、染色质调控子和组蛋白之间的关系。
4. 获得ChIP-seq预测靶基因和搜索感兴趣的靶基因
Cistrome DB提供两种靶基因选择的方式:
- 直接查看BETA分析的预测靶基因列表“get top putative targets”
- 在“Check a putative target”中搜索关注的靶基因,并进行可视化
此外,cistrome还有两个其他功能,分别是CistromeDB Toolkit和Cistrome-GO。
CistromeDB Toolkit
用于检索哪个因子调控了用户感兴趣的基因,哪个因子结合在用户的基因组区域或者和用户的peak有显著重叠。
①输入关注的基因BRCA1,查找因子的结果
横坐标表示调控潜势(RP),纵坐标表示不同的因子
纵坐标表示调控潜势(RP),横坐标表示不同的因子
②输入基因组区间:chr7:27,066,839-27,266,927,查找因子的结果
X轴表示输入区间的重叠peak比率,Y轴表示不同的因子,y轴上的点表示相同的因子
只展示前20(或更少)因子,Y轴表示样品中总peak的重叠峰比,X轴表示不同的因子,x轴上的点表示相同的因子
③输入bed文件,查找因子的结果
X轴表示 giggle score(与输入peak集的相似性),Y轴表示不同的因子,y轴上的点表示相同的因子
只展示前20(或更少)因子,Y轴表示 giggle score(与输入peak集的相似性),X轴表示不同的因子,x轴上的点表示相同的因子
Cistrome-GO
用于转录因子ChIP-seq peak或者TF干扰表达的差异表达的功能富集分析(此部分应用较少,就不废话啦)。
文章转自微信公众号:嘉因生物
网友评论