来源公众号:Scientific Visualization 作者:humannet
这是个非常经典也很容易被教材略过的问题 👍
简短答案是:
细胞核并不会”扫描”全基因组去找基因,而是通过染色质标记 + 特定DNA序列(启动子/增强子)+ 转录因子预定位 + 染色质空间区室化,把目标基因”已经在局部富集/暴露”,让RNA聚合酶Ⅱ复合物能快速、特异性结合。
下面分层给你拆解细胞是如何做到又快又准的。
一、先澄清一个误区:不是”全基因组搜索”
人类基因组 ~30亿bp,若RNA聚合酶随机扩散找一个启动子:
- 理论搜索时间 >> 细胞实际转录启动时间(秒~分钟级)
- 实际细胞用的是局域化 + 靶向招募 + 排除大多数区域
核心策略是 “先排除,再富集,再识别”。
二、第一层:染色质区室化 — 把基因”放在活跃区”
通过Hi-C / 染色质构象捕获已知:
- 染色质分为:
- A compartment(常染色质):转录活跃,位于核内部,富含H3K4me3、H3K27ac、开放染色质
- B compartment(异染色质):沉默,靠核周边/核仁
✅ 活跃基因已被物理隔离在转录友好区室
→ 转录机器(PolⅡ、Mediator、TFⅡD)也偏好富集于A区室
类比:不是翻整本电话簿,而是先锁定”某城市某街区”
三、第二层:组蛋白修饰 — 标记”这里是可表达基因”
核心组蛋白 H3/H4 N 端修饰形成 组蛋白密码(Histone Code):
| 标记 | 含义 |
|---|---|
| H3K4me3 | 启动子活跃 / 准备转录 |
| H3K27ac | 增强子/启动子激活 |
| H3K9me3 / H3K27me3 | 抑制/异染色质 |
- 阅读蛋白(Reader) 识别这些修饰:
- TAF3(TAFⅡD亚基)→ 结合 H3K4me3
- Bromodomain蛋白 → 结合 H3K27ac(含 p300/CBP、BRD4)
👉 转录起始复合物被招募到已有正确组蛋白标记的启动子附近,而不是盲目搜。
四、第三层:序列特异性转录因子(TF)— 真正”定位钥匙”
1️⃣ 少量”先锋因子(Pioneer Factors)”
- 如 FoxA1、PU.1、Oct4、p53
- 能结合部分闭合染色质中特定顺式元件(增强子/启动子)
- 打开局部核小体 → 招募其他TF和Mediator
2️⃣ 组织特异性/诱导型 TF
- 结合 保守顺式元件:
- TATA box、Inr、CAAT box(启动子)
- 远端增强子(ENCODE项目鉴定百万级)
- TF在核内自由扩散(ms级),与DNA碰撞:
- 非特异性 → 解离快(μs)
- 特异性 → 停留长(s)→ 稳定结合
📌 关键:TF浓度在核内相对较高 + 1D sliding along DNA(约几十bp),极大加速正确位点识别。
五、第四层:增强子–启动子 looping(染色质环)
- 激活后,Cohesin + CTCF + Mediator 介导:
- 远端增强子 ↔ 靶基因启动子 空间靠近(~50–100 nm)
- RNA PolⅡ被招募到增强子 → 通过loop接触启动子
✅ 这样即使基因组线性距离远(几十kb–Mb),三维空间上已”贴在一起”
六、第五层:预装配 & 转录工厂(Transcription Factories)
- 核内存在转录工厂:PolⅡ/通用TF富集区
- 被”标记好、激活好”的多个基因启动子可被拉入同一工厂同时转录
- 某些基因在静息态已有:
- paused PolⅡ(暂停于+20~+60 nt)
- 受信号(如MAPK→ELK1)解除暂停 → 快速表达
👉 解释为何早期响应基因(c-fos、c-myc)可在 <5 min 大量转录
七、整合流程示意(文字版)
核区室(A区)
→ 组蛋白标记(H3K4me3/H3K27ac)
→ 先锋TF结合增强子
→ 染色质开放 + Mediator/Cohesin loop
→ 通用TF + PolⅡ招募到启动子
→ 起始 / 解除暂停 → mRNA合成
八、为什么够”快”?(定量直觉)
- TF扩散系数在核 ≈ 1–5 μm²/s
- 扫描几十kb DNA via 1D sliding (~10–50 bp) + 3D hopping
- 正确位点识别通常在 秒级
- 预标记 + 预loop + paused PolⅡ → 可 <1–2 min 检测到新转录本
一句话总结
细胞核不”搜索基因”,而是通过染色质分区、组蛋白修饰标记、特异转录因子识别、染色质环化,把目标基因预先暴露在转录机器富集的微环境中,实现快速、高特异性定位与激活。



扫码安装网站APP(Android版)
近期评论