做生物的想发文章怎么办?转录调控来解析(huyou)!
最简单的情形:
1. 我在研究一个非常重要的基因A,功能已经做得差不多了,现在想深挖,第一步就是想知道哪个转录因子调控这个基因A;
2. 我发现了一个新颖的转录因子B,非常想知道这个TF到底在调控哪个基因。
研究方法不过几种:
1. RNA-seq分析差异基因,间接推测调控的转录因子。
2. 基于大量的ChIP-seq公共数据挖掘,用TF的抗体抓TF,同时抓下来TF结合的DNA,提取DNA,测序,就知道TF结合了哪些DNA,推测DNA附近的基因受该TF的调控。
3. motif分析预测,每个转录因子都有一个DNA结合结构域(DBD),喜欢结合在特定DNA序列上,也就是motif。去基因组上搜索motif所在的位置,其附近的基因就有可能受该TF的调控。
4. 做实验验证,DNase/ATAC-seq,用DNase-seq或ATAC-seq找开放区,预示着这样的区域有调控因子结合。在开放区找motif,如果有您感兴趣的TF的motif,那么这个TF很可能就在这里有结合,从而调控附近基因。
数据库:
- 非常好用,当你有一段能结合DNA的蛋白序列(NCBI上通常有),就能搜出具有类似motif的TF。
什么是motif:
motif是比较有特征的短序列,会多次出现的,一般认为它的生物学意义重大,做完CHIP-seq分析之后,一般都会寻找motif 。查找有两种,一种是de novo的,要求的输入文件的fasta序列,一般是根据peak的区域的坐标提取好序列 。另一种是依赖于数据库的搜寻匹配,很多课题组会将现有的ChIP-seq数据进行整合,提供更全面,更准确的motif数据库。
motif的定义:motif: recurring pattern. eg, sequence motif, structure motif or network motif
DNA序列如何找motif?
蛋白质序列如何找motif?
待续~
参考:嘉因
转录因子调控了谁?挖全天下所有高通量实验数据,只为您解决这一个问题
研究单个基因的生物信息学分析工具(大全)