JASPAR是一个免费公开的转录因子数据库,在该数据库中收录了转录因子的mitif信息,可以用来预测转录因子与序列的结合区域。
01
Jaspar简介
该数据库提供了以下9种不同来源和类别的转录因子信息
该类别下都是从文献中收集的,有实验证据支持的真核生物转录因子motif信息,而且经过了人工核对,是一个非冗余的,高质量的转录因子motif数据库,所以也是整个数据库中的核心。
由于其高质量量,非冗余等特性,通常情况下,该类别信息都是我们的第一选择。每个motif编号以MA开头。
该数据集包含了233个调控人类非编码基因的转录因子motif信息,是根据Xie et al. (PNAS 2007)文章中的数据收集整理的,编号以CN开头
该类别下保存的是转录因子的类别class信息,多个转录因子可以拥有相同的调控序列,将调控序列相同的转录因子归为一类。每个class的编号以MF开头
该类别下是运用体外技术分析了104个小鼠的转录因子后得到的motif信息,每个motif编号以PB开头
点击了解详情,添加小助手,免费获取JASPAR数据库使用教程(共69页高清图片PDF集)
和PBM类似,只不过该类别下是 C. elegans bHLH的19个转录因子的信息,物种不同,该类别下的motif编号以PL开头
该类别下包含的是小鼠的转录因子motif信息,是从文献Berger et al (Cell 2008)整理得到的,每个motif编号以PH开头
该类别下分析的是哺乳动物进化保守基因的转录因子motif信息,每个motif的编号以PF开头
该类别包含的是RNA聚合酶结合区域的motif序列,每个motfi编号以PL开头
该类别包含的是human剪切位点的motif序列,数据量很小,一共只有6个motif, 每个motif编号以SA开头,示意如下
每个collection都是一个小的子集,core 是整合了所有这些子集,从而构建的非冗余数据集。在core数据集中,将物种分层了一下6大类别
02
Jaspar页面介绍
如下是Jaspar主页面,左边是工具栏;中间显示的是数据库中收录的六大类生物,可点击查看每个大类中收集的数据总量;右侧是用户使用导航,第一次使用的用户可以点击JASPAR interactive tour ,可跟随该导航一步步学习网站的使用方法。
根据所研究的物种,选择对应的库,这里以Nematoda(线虫纲)为例,点击进入。
在Scan序列输入框中输入我们想要查找的启动子区域序列或增强子区域序列或其它关注的区域,注意需要输入FASTA格式。
在左侧列表中勾选待预测结合的转录因子,或者将同一物种的转录因子都勾选上,点击SCAN即出现结果展示。Score评分越高,表示该转录因子与输入序列结合的可能性越大。
留言与评论(共有 0 条评论) “” |