《干细胞分化时染色质重组情况.docx》由会员分享,可在线阅读,更多相关《干细胞分化时染色质重组情况.docx(11页珍藏版)》请在三一办公上搜索。
1、干细胞分化时的染色质重组情况JesseR. Dixon1,2*, Inkyung Jungl*, Siddarth Selvaraj1,3*, Yin Shenl, Jessica E.Antosiewicz-Bourget4, Ah Young Lee1, Zhen Ye1,Audrey Kim1, Nisha Rajagopal1, Wei Xie5, Yarui Diao1, Jing Liang6, Huimin Zhao6, Victor V. Lobanenkov7, Joseph R. Ecker8,James A. Thomson4,9,10 & Bing Ren1,11高阶染
2、色质结构正成为一个新兴的基因表达的重要调节器。虽然染色质的动态结构已经确 定在基因组上,其在哺乳动物发展的完整的染色质动态结构范围和谱系规格还有待确定。 通过在人类胚胎干细胞和四个人类干细胞导出谱系定位全基因组染色质,在谱系我们发现 广泛染色质重组现象。我们观察到,尽管自缔合染色质域在分化期是稳定的,染色质在域 间和域内的间显著的相互作用,改变了 36%基因组内活跃或不活跃的染色体。通过单倍体 解决染色质相互作用定位图和转录组数据集,我们发现多数的等位基因表达与等位基因偏 倚染色质的启动子和增强子有关。我们的研究结果提供了一个全局视图的染色质动态和研究不同人类细胞谱系中远程控制的研究资源。 三
3、维基因组织越来越被认为是一个基因表 达的重要监管结构1-4。最近高通量的染色 质结构研究已经开始能阐明我们基因组的 全局组织4-10。例如,最近我们和其他研 究者发现间期染色体可以分为若干兆基大 小的拓扑域和较小的子域(也称为拓扑关联 域或TADs)6-9。这些TADs形成更高层次 的结构像“A”和“B”隔室5,6。这些“A” 和“B”隔室与基因组的其他功能密切相关, 如早起或晚期DNA复制时间和核板关联 11,12。尽管有这些研究,我们还不能完全 了解人类细胞的染色质动态结构和它对细 胞身份的影响。这里我们分析了 H1型人类 干细胞和四个人类干细胞谱系的全基因组 高价染色质,中内胚层(ME)
4、,间充质干细 胞(MS),神经组细胞(NP)和类滋养细胞(TB)13。这些谱系代表早期发育胚外和胚 内在表观基因组图谱13中已经具有各自特 点,在每个13,14的谱系中已经具有含 mRNA-seq, 13-24 组氨酸修饰的 ChIP-seq, base-resolution methylC-seq 和 DNaseI 高敏(DHS)的数据集。同样的,这些实验系统提 供了一个用潜在的基因表达和染色质表达 方式来和高价染色质可变性进行比较的机 会。此外,用一个新的方法来逐步定位高分 辨染色率染色体跨度阶段的等位基因 Lauren捕获数据(Hi-C)15,我们逐步定 位H1基因组来分析等位基因特异性
5、活动和 染色质结构。据我们所知,这是目前为止高 价染色质结构,等位基因特异性染色质结构 和状态,和等位基因特异性基因表达相关的 最全面的数据集的分析。数据生成和分析我们在H1型人类干细胞和每个四个人类型 谱系中的两种生物重复进行了 Hi-C实验5, 生成了一个完整的3.85千万的独特阅读对(补充表1)。我们规范化Hi-C数据16的 固有偏差,用许多指标证实我们Hi-Cdata高 重现性和准确性数据(扩展数据图1a-b,补 充信息表2)。广泛的A/B室开关OlQ2 ES . MF岫 ME _:二(L02 伯-0.02 NP岫 NP -0.025 MbHS -C02氛 I I Normalized
6、 interacton frequencyd150co-s期d印NP 伯 MS IMFMIo j I n ;逐 衲 LiS-*- 1 1 圈1 I染色质结构的动态重组期间人类胜胎干细胞的分化。a,第一主成分(PCl)fi和Hi-C交互热图HIES和Hl-derived谱 系-FC1值是用来确定给定地区的A / E室的位置一用正的PC1值 代表A隔室蓝邑),用负值表示E室区域(黄色)。虚线在显示ES 细胞的边界。PC1 b,k-meang聚类Mwo)值在4。kb的基因组 区域,改变a / E室状态至少需要一个谱系.C, k - means聚类pci值周围的tad边界(b表示边界位 置)。色在分化
7、时鑫化分布基因变化状态间(“A”或) 基因表达的或者保持不变(“稳定”)1* * *已2. 2310216, P 值通过Wilcoxon试;可对应四分位范围)。电阅读两个基 因的基因组,一个(OTX2)显示表达和FC1值之间的一致性 而第另一个(TMEM260)却没有oHi-C相互作用地图提供了多个层次的基因 组织4。先前的研究证明了基因组组织被划 分为A和B隔室,其中包含相对活跃和不活 跃的部分5,11。目前,A和B隔室在分化时 的改变和它们如何与谱系紧密相关的机制 还不清楚。我们观察到不同的细胞类型的 A/B隔室中都具有很大的空间可塑性,一个 谱系分析中至少有有36%的基因开关隔室(方法;
8、图1A和拓展数据图2A-C)。许多 A/B隔室转换具有谱系特异性(图.1b)。值 得注意的是,这似乎是一个B隔室在人类干 细胞变成成MScells或inIMR90成纤维细胞 时进行大的扩张。这两种细胞已证实在分化 过程中进行阻遏性的扩张异染色质的修改 13,17。在这方面,在它们的基因组中似乎有 类似的空间组织。我们观察别改变他们的A / B隔室通常与一个或一系列TADs对应(图 1 a,c和扩展数据图2 d,e),这表明TADs是动 态染色体变化隔室的单位。与他人loci18-20 之前的研究一致,我们发现从A隔室到B隔 室的转变减少了基因的表达,而从B到A隔 室的变化显示出更高的基因表达(
9、图1 d)。此 外,谱系限制性隔室A域,与其他域相比往 往包括更多的谱系限制性基因(扩展数据图 3 a)。这虽然有一定意义,但表达变化的整体 模式是微妙难解的。我们推测这种轻微的相 关性可能是由于一部分基因影响隔室变化, 尽管大多数基因仍不受影响,我们确认718 个公变的基因与基因表达和隔室开关有关 (图1 e,扩展数据图3 b,c,和方法)。这些基因 是富含低CpG含量的非协调启动子(21.8%对 15.6%非协调基因,P值8310211,确切概率法), 和几个重要的基因本体(GO),特别是有关细 胞外蛋白质和细胞外矩阵的基因(补充表3)。 总的来说,这些结果表明,在全局层面,在A和 B隔间
10、具有一个高度的可变性,此时有微妙 的相应变化基因的表达,表明A和B隔间细 胞的特异的基因表达,但不是决定性的基因 表达模式。域级的染色体动力学接下来我们研究了亚染色体的高价染色体 结构规模。先前的研究表明,染色体是由细胞 型不变性的TADs组成6,8。在这六个谱系 研究的中,我们观察到虽然定位的TADs在细胞型之间保持稳定(图2),但域内的染色质结 构发生很多变化。在域内我们观察到一个现 象,细胞类型间的整个域的大部分的隔室相 互作用的发生增加或减少(图2 b)。这表明 TADs的子集在一个给定的谱系进行协调变 化,广域方面相互作用的频率改变。每个谱系 中数百的TADs家族发生这样的改变(图2
11、 b 和扩展数据图3 d),这种相互作用频率的变 化或许与活跃的标签如DNS,H3K27ac和CTCF结合,负相关的压制性染色质修改如 H3K27me3和H3K9me3相关(图2 c,详情见TB勺堂照 MS-腋作用 一总人4 4 土而图2 |染色质的相互作用频率的全域改变和染色质 状态a,在H1谱系和IMR90成纤维细胞中染色质相互作 用的图。它也显示在胚胎干细胞内域的调用和每个 谱系的方向性指数(DI)b,ES和MS中相互作用频率 的变化。ES中动频率高的区域用蓝色表示,MS中频 率高的区域用黄色表示。TADs拥有一个共同的增加 或减少域间的相互作用频率分别贴上黄色或蓝色, 并将频率数列出。
12、域内非共同改变的地方显示灰色 的。C,相互作用频率变化和染色质标记间每一个变 化染色体的TADs(n523)箱线图的皮尔森相关系数。法)。TADs同时也提高域间的B转向A相互 作用频率,此时域的A向B的转换频率往往 下降(扩增数据3e,f).与这个变化域的活动 一致,域内基因在染色质中的活动,增加了域 间的相互作用频率,而基因域内的相互作用 调节频率往往下降(扩展数据图3 g,h)。 染色质状态和动态相互作用为了理解染色质动态变化和其他基因和外 遗传性特征,我们整合了理解染色质动力学 之间的关系和其他基因和外遗传性特征,我 们整合分析了组氨酸调控的Hi-C数据,DHC, 和六个谱系中的CTCF
13、结合数据。具体来说, 我们试图通过染色质状态特征模式变化来 预测染色质的相互作用频率。我们将基因组 分为40 kb大小的区域并计算每个域内分化 时染色质发生的变化。然后,我们建立了一个 基于染色质特征的随机林分类模型来分类 本区相互作用区的增加或减少的频率(见方 方法)。该模型能够分类基因组区域相互作 用的增加或减少的频率,有73%的准确度(图 2 d图100%;扩展数据图4),增加到80%以上 时,我们只考虑基于得到的频率差异最高的 预测值(图2 d图30%)。这个随机林模型不 仅表明染色质状态变化特性下的作用频率 信息,它还能确定哪些染色质标记最有预测 力。具体来说,每个染色质的标签的基尼
14、系数 “减少,,一个给定的重要分类特征。在这方 面,我们发现H3K4me1密度变化量是最重要 的远程预测染色质的相互作用变化的特征 (图2e和扩展数据图4b,c)o 如 H3K4me1 主要存在在准备中的或活跃增强子21,22,晶须对应这1.53四分位范围内的最高值和最低值。 d,随机林模型在预测域是否在增加或减少频率的准 确性(n5768,793),随机选择Hi-c数据中的10歌数据 子集测试。这个准确性也能检查使用实际数据(蓝 色),环状排列(绿色)和一个随机排列的数据(黄色)。 作为预期,随机排列数据有50%的准确率。精度是 考虑到前30,40,50%或预测的基础上统计的频率差 异(误差
15、的标准差从10个随机选择的数据子集中选 取)。e,列举的染色质显示从10个随机选择的数据 子集的基尼指数根据分类的重要性线图。晶须在 1.53四分位范围对应的最高值和最低值。并作为增强剂参与特异的细胞间的相互作 用循环23,这些结果显示增强子动力学可 能在调节谱系中相互作用发挥着重要的作 用。与这一假说相符,40 kb大小的区域更高 的增强剂密度拥有更大的相互作用频率(扩 展数据图4 d,e)。等位基因特异性染色体组织人类正常的二倍体细胞的每个染色体包含 两个副本。在给定的亲代染色体变异的集合 (也称父母的单体型)可用于确定两个同源染 色体之间功能差异。先前的研究已经发现大性(橙色)显示了相比
16、其它地区PC1的差异值量的等位基因在基因表达上存在差异,包括 DNA甲基化、染色质状态24-29。除了个人 基因研究位点30-32,也包括对同源染色体 间的高价的可变性染色质结构。最近我们研 究室的工作15证明Hi-c数据重建单体型染 色体范围,它允许染色质状态和研究基因表 达为一个真正的二倍体。我们生成单倍型染 色体范围合并,93.5%的所有的杂合变异体的 H1-c的组合数据集全基因组测序15(图3)。a 肝唳圭散 AHtaumMiiiiii 丹的相 too:更年埴斗至打古坞 J.I - O.I - _ _云生芹 1 ,二:二二卜a a% 6 u 临 eee1,幅 1# 幅 24%a- SS
17、tJEH心丽牌顽l. 一 L.dLLl I UnshoudiK7M,i心函m iim mm .顾 ubii5- 1100 kb |h22.300X81殂.QM.0MIINI III I H illi I IIIHIIIIIIHIHI 1 IIi liii am iiiiiiimiiiiiiiii Niiu mu 11 iliumiii h .hk Mill. I .IhiilJli llii I j:a h. .s s .hu* IDkt:ng1BI123.T4C, 叫二 叫二 底 叫无11Q朋咫Tlh I JI I .等U芸区FISIDG SIS?) j- pi nlJLR. i i-.:
18、-I !. J5 H3KW43E M ps M n g 疽fDH&pl LtlA EWih . puiCtU rNdi * pi HsKaT* pHlSs |pl OwqEq. 归3:dItt-.ECC.OMII2DH 或OQO|腿/I 一 RqW 4 I flHW IMe1sho aoL)4DP*卷 dclELU U0-E扣1.10醐_.曲鄙太底C基因连接上可测的苓位基因抑制基因乙酰化DNasel巨尔逊相关羔数盅尔迎相关惑数01.0-1.001.0IlliI I I I I强 口中弱HI3K4me31I(MS)顼一40 bait locus- - - - o o o O 心9(8 7 M 商
19、IXWIOCE 臣 tclwhslunoopnlaj uo 一急 1604mRNAf = 0.003任何细胞类型的等位基因之间只有0.6 -2.3%的基因组A / B的隔的有所同不同(扩 展数据图5 f)。值得注意的是基因组中不常 见的区域显示了在等位基因中A/ B室之间 变化的状态(图3 d),其中并不富含等位基因 偏移或已知的印迹基因(扩展数据图5.g.h)。 相反,包含等位基因偏倚或印记的基因组区 域的基因有一个一个微妙而显著的增加等 位基因间A / B室可变性的数值(图3 e)。同 样,等位基因的基因组区域在A / B室变化上 分数有更大的染色质状态变化数值(图3)。 这表明尽管大多数
20、等位基因偏倚和印迹基 不同的个体谱系中等位基因偏倚的什么程 度会影响基因表达这仍然不清楚。为了解决 这个问题,我们重新分析解决的但媒体 mRNA-seq数据和确认五个H1-c谱系中的基 因表达。总共有1787个基因在一个或多个 谱系表达出等位基因偏移,研究表示,约24% 的可测基因(错误发现率(FDR)10%,图4)。大 多数等位基因的差异表达不是“开/关”/而是 反映在等位基因表达水平(图4b)。此外,等位 基因偏倚基因包括谱系特异性基因和既定 的表达基因(扩展数据图6 c,d),等位基因模 式也对其有影响(图4c,d)。在极少数情况下 不同间细胞基因开关表达有差异。如我们所料,基因受富含等
21、位基因偏倚的基 因组印记的表达的控制(图4e),尽管这只约 1%的等位基因偏倚基因(图4)。虽然印迹基 因经常发生集群,大多数等位基因偏倚表达 不常在基因组(扩展数据6e)。综上所述,这些 数据显示大部分等位基因偏倚基因表达是 由于基因组印记机制。一个可能的调控 机制,可能导致等位基因偏倚表达出等位基 因偏倚附近顺式调控活性元素。的确, 基因组的区域在组蛋白乙酰化作用下的等 位基因,组蛋白甲基化、CTCF binding和DHS 比随机选择的基因组区域更接近等位基因 偏倚基因(图4 g)。此外,等位基因基因表达 与DNA甲基化或启动子的调控有着密不可 分的关系(图4h,i)。247个基因含有杂
22、合变异 体基因的启动子区域和谱系中至少出现一 个偏倚分化,主要表现出等位基因偏倚主要 因为染色质的修改或在启动子DNA甲基化 (图4 h)。有趣的是,29%的可测试的基因偏倚 基因表达式显示没有显示出染色质状态中 存在基因偏倚或启动子中DNA甲基化(图 4h),提高启动子基因的外元素表达的可能 性。我们确定了 726,969和5769等位启动子13 展示了在组蛋白乙酰化作用、DHS、和DNA 甲基化(图5)下的等位基因。我们观察到组 蛋白乙酰化作用和增强子间等位基因表现 出等位基因DHS(图5)。然而,我们观察在不 同谱系中DHS或乙酰化定义增强子之间只 有温和的一致性。(图5)。这可能反映了
23、更 大的确定的等位基因之间的差异甲基化区 域。另外,这可能反映增强剂的存在, 但并没有没有一个严格DNA甲基化和增强 子或DHS差异34,35。增强子上等位基因偏 倚作用通常更靠近基因,这也说明了等位基 因偏倚在增强剂缺乏等位基因偏倚是表达 (图5b和扩展数据图6f)。640个等位基因中 大多数(66%)的显示强大的Hi-c与等位基因 增强子的相互作用也显示了等位基因和启 动子之间的活动。(图5c,扩增数据图7和方 法)。此外,增强子基因对与相对强劲的Hi-c 相互作用显示出等位基因增强子活动和等 位基因表达之间比较更大的相关性(图5 d)。 为了测试等位基因增强子的确与等位基因 偏倚基因是否
24、形成特定的联系我们执行6个 等位基因偏倚启动子的4 c-seq31,36并识 别出这些6个等位基因有4个显示出增强子 显示特定的4C相互作用。(图5 e,E补充数 据图8和补充表4)。综上所述,我们的研究 结果强烈支持这个等位基因增强子活性与 这个可能的机制等位基因的表达的机制相 关。为了确定等位基因偏倚增强子监管等位 基因偏倚的机制是够也参与染色质远端合 假定的目标基因之间的循环我们读取整个 Hi-c基因上等位基因偏倚增强子。我们发现 含有更高活性增强子的等位基因通常有更 高的含目标启动子染色质相互作用(扩展数 据图9)。之前的高分辨率4c-seq结果分析再 一次证实了这一结果31。两个位点
25、(HAPLN1 和MAN1C1 )显示出基因表达水平下增强型 启动子的相互作用(图5f和扩展数据图9), 尽管这一等位基因4c-seq没有统计学意义。 剩下的两个位点(FAM65B PXK)在同样的靶 点启动子中似乎拥有几乎相等的相互作用 频率。总的来说,这些结果显示等位基因偏倚 增强子对等位基因偏倚基因表达有一定影 响,其主要是通过稳定DNA环之间的两个 等位基因或通过潜在等位基因偏倚、增强型 启动子相互作用。讨论我们已经提出了 H1型人类干细胞和4个谱 系下全基因组染色质的互动地图。我们观察 到高阶的染色质结构在ES细胞分化时在多 个层次的动态重组。我们发现ES细胞分化 时A和B隔室间在大
26、量的开关,和表达水平。 这些结果与前人的研究是相似的20,37-39, 只有基因的一些部分的表达受到改变,而其 他基因不受影响。改变室的状态可能影响基 因转录因子或此区域的其他的调节蛋白,这 可能对某些基因成分特别重要。此外,我们发现区域染色质改变的相互作用 TADs频率。这些地方的变化是适于预测 H3K4me1和增强子元素的密度水平的变 化。这与最近的5 c研究,表明Smc1、中介 和转录位点7相符富集区特异性相互作用 更强的观点相符。总的来说,这些结果表明, 增强子在在整个基因组结构塑造当地高阶 染色质可能起着重要的作用。此外,通过分析 每个父母的等位基因染色质的模式相互作 用在,我们观察
27、到全局高阶等位基因之间的 染色质结构的变化。在这项研究中染色质交互地图还能生成重 建单倍体H1基因型。这个数据集第一个研 究跨多个细胞类型的单个个体等位基因偏 倚表达,以及顺时元件染色质的分析。我们的 数据将作为更有价值的工具,更好地理解基 因调控网络控制多能性和人类胚胎 干细胞的分化。Online ContentMethods, along with any additional Extended Data display items AndSourceData, are available in the online version of the paper; references uni
28、que to these sections appear only in the online paper.Received 25 November2013; accepted 12 January 2015.1. Smallwood, A. & Ren, B. Genome organization and long-range regulation of geneexpression by enhancers. Curr. Opin. Cell Biol. 25, 387 - 394 (2013).2. Phillips, J. E. & Corces, V. G. CTCF: maste
29、r weaver of the genome. Cell 137,1194 - 1211 (2009).3. Lettice, L. A. et al. Disruption of a long-range cis-acting regulator for Shh causes preaxial polydactyly. Proc. Natl Acad. Sci. USA 99, 7548 - 7553 (2002).4. Gorkin, D. U., Leung, D. & Ren, B. The 3D genome in transcriptional regulation and plu
30、ripotency. Cell Stem Cell 14, 762 - 775 (2014).5. Lieberman-Aiden, E. et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289 - 293(2009).6. Dixon, J. R. et al. Topological domains in mammalian genomes identified byanalysis of chromati
31、n interactions. Nature 485, 376 - 380 (2012).7. Phillips-Cremins, J. E. et al. Architectural protein subclasses shape3Dorganizationof genomes during lineage commitment. Cell 153, 1281 - 1295 (2013).8. Nora, E. P. et al. Spatial partitioning of the regulatory landscape of theX-inactivation centre. Na
32、ture 485, 381 - 385(2012) .9. Sexton, T. et al. Three-dimensional folding and functional organization principlesof the Drosophila genome. Cell 148, 458 - 472 (2012).10. Rao, S. S. et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell 159, 1665 - 168
33、0 (2014).11. Ryba, T. et al. Evolutionarily conserved replication timing profiles predict longrange chromatin interactions and distinguish closely related cell types. GenomeRes. 20, 761 - 770 (2010).12. Peric-Hupkes, D. et al. Molecular maps of the reorganization of genome-nuclear lamina interaction
34、s during differentiation. Mol. Cell 38, 603 - 613 (2010).13. Xie, W. et al. Epigenomic analysis of multilineage differentiation of human embryonic stem cells. Cell 153, 1134 - 1148(2013) .14. Maurano, M. T. et al. Systematic localization of common disease-associated variation in regulatory DNA. Scie
35、nce 337, 1190 - 1195 (2012).15. Selvaraj, S., Dixon, J. R., Bansal, V. & Ren, B. Whole-genome haplotype reconstruction using proximity-ligation and shotgun sequencing. NatureBiotechnol. 31, 1111 - 1118 (2013).16. Hu, M. et al. HiCNorm: removing biases in Hi-C data via Poisson regression.Bioinformati
36、cs 28, 3131 - 3133 (2012).17. Hawkins, R. D. et al. Distinct epigenomic landscapes of pluripotent and lineagecommittedhuman cells. Cell Stem Cell 6, 479 - 491 (2010).18. Brown, K. E. et al. Association of transcriptionally silent genes with Ikaros complexes at centromeric heterochromatin. Cell 91, 8
37、45 - 854 (1997).19. Kosak, S. T. et al.Subnuclear compartmentalization of immunoglobulin loci duringlymphocyte development. Science 296, 158 - 162 (2002).20. Holwerda, S. & de Laat, W. Chromatin loops, gene positioning, and gene expression. Front. Genet. 3, 217 (2012).21. Heintzman, N. D. et al. Dis
38、tinct and predictive chromatin signatures of transcriptional promoters and enhancers in the humangenome. NatureGenet.39,311 - 318 (2007).22. Heintzman, N. D. et al. Histone modifications at human enhancers reflect globalcell-type-specific gene expression. Nature 459, 108 - 112 (2009).23. Sanyal, A.,
39、 Lajoie, B. R., Jain, G.&Dekker, J. The long-range interaction landscape of gene promoters. Nature 489, 109 - 113 (2012).24. Heinz, S. et al. Effect of natural genetic variation on enhancer selection and function. Nature 503, 487 - 492 (2013).25. McVicker, G. et al. Identification of genetic variant
40、s that affect histonemodificationsin human cells. Science 342, 747 - 749 (2013).26. Kasowski, M. et al. Extensive variation in chromatin states across humans. Science 342, 750 - 752 (2013).27. Kilpinen, H. et al. Coordinated effects of sequence variation on DNA binding, chromatin structure, and tran
41、scription.Science 342, 744 - 747 (2013).28. Kuleshov, V. et al. Whole-genome haplotyping using long reads and statistical methods. Nature Biotechnol. 32, 261 - 266(2014) .29. Xie, W. et al. Base-resolution analyses of sequence and parent-of-origin dependent DNA methylation in the mouse genome. Cell 148, 816 - 831 (2012).30. Splinter, E. et al. The inactive X chromosome adopts a unique three-dimensionalconformation that is dependent on Xist RNA. Genes Dev. 25, 1371- 1383 (2011).31. Holwerda, S. J. et al. Allelic exclusion
链接地址:https://www.31ppt.com/p-5281932.html