表观遗传学前沿 第1章染色质的结构与功能 11细胞核的结构与功能 真核细胞的重要特征是有细胞核,电镜观察真核细胞时,细胞核是最大的可见部分,核内含有一些相当难以辨别的结构(图11)。细胞核包含了真核生物几乎所有的遗传物质(在线粒体和叶绿体中还含有少量的DNA)。细胞核与细胞质之间有双层的核膜相隔,核膜中间有一个内腔与内质网相连,核孔复合体(NPC)横跨核被膜,是细胞核与细胞质之间输送生物大分子的通道,能将蛋白质及RNA运入、运出细胞核。内质网中的空间与两层核膜间的空间是连续的,内外层核膜的脂双层与每一个核孔是连续的。两个中间丝网络提供了核膜的机械支持;细胞核中的中间丝形成一个特殊的结构,称为核纤层。细胞核的亚单位核仁是核糖体RNA合成的场所,没有膜结构。 图11间期细胞核的形态结构(引自Alberts et al,1998) 细胞核的大小范围从直径1μm到大于10μm不等,细胞核的大小与其所包含的DNA的多少有关,酵母细胞的细胞核只有1μm左右,而非洲爪蟾的卵母细胞细胞核直径约为400μm。大多数细胞有一个细胞核,但有的细胞也有多个细胞核,少数细胞没有细胞核。球形和椭圆形是细胞核最常见的形状,不同物种细胞核所占细胞总体积的比例是不一样的,细胞核的形态和表型是区分不同细胞类型的两个要素。 图12核膜(引自Andersson et al,1999)。 显示了双膜层、核孔复合物、 核纤层以及外膜层同粗面内质网的连续性 111细胞核的结构 1核膜与核纤层细胞核以核被膜为界限,核被膜由外核膜和内核膜组成(图12)(Andersson et al,1999;Fahrenkrog et al,2001;Rout et al,2001)。核膜由磷脂双分子层和特定的蛋白质组成。外核膜与内质网连通,表面附有核糖体,负责蛋白质的合成。外核膜与内核膜之间的膜间腔与内质网的膜间腔连通。 核纤层位于核内膜之下,核纤层是多细胞动物细胞核的一个普遍特征,它是纤维状的网络结构(Broers et al,2004;Goldman et al,2002;Gruenbaum et al,2005;Hutchison et al,2001;Taddei et al,2004)。核纤层蛋白被称为中间纤维蛋白,其成丝的大小(直径10~20nm)在肌动蛋白微丝(7nm)和微管(直径25nm)之间,核孔复合体锚定在核纤层。核纤层相关蛋白(LAP)中的一些蛋白质介导核纤层和内核膜之间的相互作用。核纤层支持细胞核结构,同时也与染色质相互作用。 第1章染色质的结构与功能 2核孔复合体NPC核孔复合体位于内核膜和外核膜的融合部位,是一个双向结构(Fahrenkrog et al,2001;Rout et al,2001;Schwartz et al,2005),由30多种不同的多肽组成,它们是核孔蛋白,而且许多核孔蛋白含有短序列重复,例如GlyLeuPheGly、XXPheGly,这些短序列重复在转运过程中与转运因子相互作用。核孔复合体的结构类似于桶,镶嵌在双层膜上,形成一种环状的结构(图13)。 图13核孔复合体的高分辨率扫描电镜图(引自Lodish et al,1999)。 两栖类卵细胞分离的NPS的细胞质面,细胞质颗粒覆盖在NPS的胞质环 3染色体占据细胞核内的每一条染色体都有其特定的位置,占领一定的区域(Gilber et al,2005;Parada et al,2002;Sanger et al,1997),染色体末端的端粒被锚定在核被膜上,这对防止染色体纠缠有作用。细胞核包含染色体区和染色体间区,有染色体定位的区域即染色体区,附近没有染色体的区域为染色体间区,染色体间区存在着带有poly(A)尾巴的RNA。 4核仁细胞核内最明显的亚单位是核仁。多数细胞核只有一个核仁,但有的细胞核内也有多核仁,核仁的大小与细胞中核糖体数量有关。核糖体RNA合成和加工,核糖体亚单位装配都是在核仁中进行的。核仁中含有编码rRNA的DNA,当rRNA转录被人为中断时,核仁消失,当转录被允许时,核仁重新出现。 112细胞核的功能 水及相对分子质量小于100的不带电荷的分子,可以通过磷脂双分子层自由扩散,其他的分子和生物大分子必须通过核孔复合体进出细胞核。 1通过核孔复合体选择性运输蛋白质 (1)蛋白质的入核:核孔是一个选择性通道,它只允许携带有正确氨基酸信号的蛋白质进入。一般情况下,被转运蛋白质包含定位于细胞核的信息,没有定位信号的蛋白质也可以通过与有定位信号的蛋白结合而被运输,而且蛋白质进入细胞核之后,定位信号依然存在不会被去除。这种定位信号被称为细胞核定位信号(NLS),是一段短链氨基酸序列,普遍包含基本氨基酸——赖氨酸和精氨酸。入核蛋白的运输是受体介导的过程,实验表明蛋白质入核是可饱和的,入核受体常称为核转运蛋白家族(Goldfarb et al,2004)。 核蛋白入核可以分为两个步骤(Harel et al,2004):一是核孔处依赖NLS的结合(停泊 docking);二是迁移进入核质。促进结合活性的NLS受体,这种受体伴随着运输物质通过NPC,在细胞核内释放运输物质,之后再回到细胞质继续下一轮的转运,通过PNC增强迁移活性的物质是Ran GTPase。目前已鉴定了两种类型的NLS受体:可以直接结合到核孔上的NLS受体,这种受体是由α输入蛋白和β输入蛋白组成的;核孔上需要其他的特殊受体介导结合的NLS受体,以确保有效的输入,有的运输蛋白在入核过程中并不止利用一个核转运受体,另外,并非所有的蛋白质都通过核转运蛋白输入到细胞核中,例如信号分子βcatenin,直接与核孔蛋白相互作用进入细胞核。 (2)蛋白质的出核:从细胞核中输出蛋白质也是受体介导的,出核信号被称为核输出信号(NES)。在细胞质中合成的某些蛋白质,被输入细胞核,然后再输出细胞核,这种蛋白质大多是转录因子,通过它们的定位来控制其活性。一些蛋白质在细胞核和细胞质之间连续循环的过程被称为细胞核细胞质穿梭(核质穿梭),这些蛋白不仅有NLS使之定位到细胞核中,而且有NES。 核转运蛋白和核孔蛋白的相互作用对于通过核孔的迁移是至关重要的,核运输的方向性部分决定于核转运蛋白与某些核孔蛋白的特异作用。 Ran GTPase控制细胞核运输的方向(Kalab et al,2002;Dasso,2002)。Ran是一个小的GTPase,它普遍存在于所有的真核细胞中,在细胞核和细胞质中都有分布。RanGTPase通过Ran促进GTPase水解,而RanGEF促进了Ran上的GDP交换为GTP。RanGAP存在于细胞质中,而RanGEF定位在细胞核中。Ran通过结合核孔蛋白控制细胞核转运,并影响它们结合物质的能力。 核转运蛋白与大多数核孔蛋白通过苯基丙氨酸氨基乙酸(FG)重复相互作用,这些FG重复排列在核孔中央通道内;研究表明一些核转运蛋白与特定的核孔蛋白有高度亲和性;Ran不仅介导运输物质与核转运蛋白的相互作用,而且介导核转运蛋白和核孔蛋白的相互作用;虽然核转运蛋白可以双向穿过核孔,但大多数只是单方向携带运输物。 (3)核转运模型:一个简单的细胞核转运基质模型显示通过易化扩散穿过通道的运动(Rout et al,2001;Becskei et al,2005)。这个模型中,转运受体可以与核孔蛋白有短暂的低亲和性相互作用,没有方向性结合反应,运动的方向由核孔任一侧Ran依赖的终止步骤决定。这个模型的一个更复杂的解释是,转运的方向是由于随着运输物/受体复合物穿过NPC通道,转运受体和核孔蛋白之间亲和力梯度的增加。 另一个模型是观察排列于核孔通道内的许多包含FG的疏水核孔蛋白(BenEfraim et al,2001)。这些核孔蛋白的FG结构域被认为是没有组织的,在核孔通道中创造疏水的环境。在选择阶段模型中,核孔蛋白富含FG区之间的相互吸引力构成了核孔蛋白质的中央屏障,这个屏障使大多数蛋白质不能通过。这个模型进一步提出在NPC通道这个特殊的环境中,转运蛋白具有选择性的亲和力。这将核孔排除许多蛋白质通过核孔的能力与核转运蛋白复合体的易化扩散相联系。这个模型的证据依然处于初级阶段,但是入核的快速动力学支持这个模型,而且观察到核转运蛋白与核孔蛋白的FG重复相互作用。然而,这个模型没有解释大的复合物,如mRNA复合物如何转运。 荧光显微镜技术开始用于探测单个分子,并且这些方法正在被应用到细胞核转运的研究中(Ribbeck et al,2001;Yang et al,2004)。研究表明,蛋白复合体通过NPC通道的运动非常快(平均10ms),大多数核孔蛋白运输物复合体的运动在NPC通道是随机的,并且速率限制步骤可能脱离中央通道进入细胞核。这些研究还说明1个NPC可以同时运输至少10个底物分子(和它们的受体),并且一个NPC每秒可以转运约1000个分子。 在真核生物中核被膜的存在在一定水平上使基因表达和细胞周期得以调控,这在原核生物中是不可能的。蛋白质输入和输出都是可调控的,对于核运输调控的重要性有许多例子。细胞通过对转录因子在细胞核和细胞质之间运动的调控来控制转录,从而实现对应激和生长控制信号的应答。例如,通过调控周期性和非周期性(永恒)转录因子的核转运来控制生理节律(Zhu et al,2003)。此外,在细胞核和细胞质之间蛋白激酶及其调节子的运动对于推动细胞周期的进行和外界刺激的应答是非常重要的。 蛋白质的入核和出核可以在多个水平上受到调控:第一,运输物质与转运受体之间的相互作用的能力可通过对运输物质的直接修饰而调控,如磷酸化修饰等;第二,运输物质可以锚定在细胞的一个区域,因此锚定解除前它不能与转运子一起移动;第三,NPC本身转运蛋白质的能力是被调控的对象。 2多种RNA的输出在真核细胞中,几乎所有的RNA都是在细胞核中产生,mRNA/tRNA和包含rRNA的核糖体亚基必须从细胞核中输出。通过NPC转运到细胞质中,在细胞质中行使翻译功能。大多数RNA不包含输出信号,但是为了输出细胞核必须结合在包含NES的蛋白质上。事实上,细胞中的RNA总是与蛋白质形成复合体,以保护RNA分子与其他细胞组分的相互作用。作用于蛋白质转运的NPC也同样用于RNA输出。RNA输出是受体介导和能量依赖的;每种RNA的转运需要不同的可溶性转录因子。每一类型的RNA的输出至少需要一类特殊类型的限速因子,所有输出的RNA都利用相同的NPC,所以NPC的数量是不限制的。这些研究没有说明每类RNA转运中涉及多少因子,输出单一种类的RNA有多少因子是共享的和有多少因子是唯一需要的。 (1)tRNA在细胞核中转录,它们在细胞核中加工,然后被运到细胞质,在细胞质中它们被氨基化并参与翻译。只有完全加工好的tRNA才能被输出。细胞核tRNA的输出是由专一的转运受体介导的,并且需要Ran,输出蛋白t是tRNA的转运受体,属于核转运蛋白家族中的一员(Shaheen et al,2005;Takano et al,2005)。输出蛋白t是唯一能直接结合tRNA的核转运蛋白,它优先与完全加工的tRNA结合。 (2)mRNA的转录和加工发生在细胞核内部,需要hnRNP从转录位点转移到细胞核周边的NPC上(Aguilera et al,2005;Saguez et al,2005)。转录位点也是大多数mRNA的加工位点,加工完成以后,mRNA从染色体区域释放到染色质间区。mRNA通过染色质间区扩散到细胞核周边。mRNA以RNA蛋白质复合体的形式输出细胞核。转录过程中与mRNA确定加工的位点,同时包装mRNA进行细胞核输出。在细胞核中与mRNA结合的蛋白质在核输出后,与mRNA解离并返回细胞核。一小部分蛋白质在核输入之前即迅速地与mRNA分离。mRNA输出信号可能存在于与mRNA结合的蛋白质中,mRNA的输出是可调控的,但调控机制尚不清楚。 (3)小核糖体蛋白颗粒(snRNP)是在mRNA前体剪接和其他核mRNA加工中起重要作用的RNA蛋白复合体。snRNP中存在的U snRNA在细胞核内产生。然而,在哺乳动物细胞中功能性snRNP的形成需要U snRNA的核输出、在细胞质中修饰、与胞质中的蛋白质结合,以及U snRNA复合体的核输入,进入核内的U snRNA复合体最终装配成为snRNP。 核糖体亚基在核仁中装配,通过输出蛋白输出。 核糖体包括两个亚基,它是由大约80个蛋白质和4个核糖体RNA(rRNA)组成的大型复合体。亚基分别在核仁中组装并被输出到细胞质进行最后的组装(Johnson et al,2002)。核糖体亚基是可以通过NPC运输的最大的复合体成员,核糖体亚基是核孔通道可以通过的上限。由于这些亚基的尺寸很大,当一个核糖体亚基通过NPC通道时其他的大分子就不能被运输。 核糖体亚基的组装和输出是非常复杂的过程,并且高度依赖细胞核运输。核糖体蛋白在细胞质中合成,之后被输入到细胞核,进入核仁。在核仁中,核糖体蛋白与rRNA前体相互作用,在核仁中被转录并组装成因子。随着正确的组装,每一个亚基通过NP被输出。在细胞质中,亚基与转录起始因子、mRNA组装形成成熟的翻译核糖体。 迄今为止已经被研究的所有的核糖体蛋白和细胞核输入都使用核转运蛋白家族成员和Ran GTPase。但是,至少还有一些核糖体蛋白利用不止一个专一的输入因子。例如在酵母中,核转运家族的两个不同成员介导相同核糖体蛋白的输入(Cullen et al,2003;Libri et al,2003)。因为正确的核糖体产生对于细胞的存活是至关重要的,所以要确保有充分的组分用于组装。 核糖体亚基的输出是可饱和的,表明它是受体介导的。核糖体亚基不与其他的RNA蛋白复合体相互竞争输出,表明核糖体亚基使用不同转运受体。甚至细菌核糖体也可被输出,表明真核生物的输出组件可以识别这些核糖体(Oeffinger et al,2004)。 (4)microRNA在细胞核内通过转录产生,局部加工形成有发夹结构的前体,通过输出蛋白v输出细胞核,最终在胞质中加工成熟(Ambros et al,2004)。microRNA在基因表达的调控方面具有重要作用,可调控许多生理途径,包括发育、分化、细胞程序性死亡(细胞凋亡)、器官形成和细胞增殖(Kim et al,2005)。microRNA与胞质中的靶mRNA结合,从而阻断它们的翻译甚至促进这些生命过程的逆转(Zamore et al,2005)。 12染色质结构 细胞分裂时,核内染色质凝缩而成的线状结构,对碱性染料染色很深,故名染色质(chromatin)。染色质是由DNA与蛋白质组合成的复合物,也是构成染色体的结构,存在于真核生物的细胞核内。原核生物也有染色质,存在于拟核内(Postow et al,2004)。 121染色质纤维 人细胞平均含有60亿碱基对的DNA,分布在46条染色体上,每个碱基对的长度是034nm,60亿碱基对的DNA加起来有2m长,每个碱基对结合6分子水,直径只有10μm的细胞核如何能容下2m长的水溶性DNA染色质呢?研究发现遗传物质以核小体作为基本结构逐步进行包装压缩,经30nm染色质纤维、超螺线管、最后压缩包装成染色体,总共经过四级包装。由DNA和组蛋白组成的染色质纤维细丝是许多核小体连成的念珠状结构。 1从DNA到核小体核小体的装配是染色体装配的第一步,一个核小体的直径是10nm,由167个碱基对的DNA组成缠绕在组蛋白八聚体周围,每个碱基对长度为034nm,一个核小体伸展开来的长度是70nm,由此推算,DNA包装成核小体,大约压缩了7倍。 2核小体到螺线管(solenoid)核小体通过自身形成螺旋的方式形成致密的、外径为30nm的管状结构,称为螺线管,又称30nm染色质纤维。从完整的细胞中常常可分离到10nm的核小体纤维和30nm纤维,只要改变提取液的盐浓度可将二者分开。 10nm纤维是由核小体串联成的染色质细丝,主要在低离子强度及无H1组蛋白情况下产生,当离子强度较高级H1存在时,以30nm纤维为主。 30nm纤维染色质丝,是由10nm纤维压缩形成的粗丝。有人认为30nm纤维染色质丝是由细丝螺旋盘绕而成的螺线管,这种螺线管是分裂间期染色质和分裂中期染色体的基本组分。螺线管进一步压缩形成超螺旋;有人认为粗丝是Z型锯齿结构模型,人们认为30nm纤维从中心轴开始形成圆环,最后环状的链至少经过了超过一种的包装而形成有丝分裂染色体。 3从螺线管到超螺线管30nm的染色质纤维进一步螺旋化,形成一系列的螺旋域(coiled domain)或环(loop),这些环附着在支架(scaffold)蛋白上。螺旋域的直径是300nm。然后,螺旋环进一步形成超螺旋环(supercoiled loop),或超螺旋域,此时的直径为700nm,每个环估计含有50~100kbDNA,推测染色质环仍然是基因协同结合在一起,其中包括Ⅱ型拓扑异构酶,推测该酶调节DNA的超螺旋程度。DNA从螺线管的超螺线管 图14DNA经由核小体包装成 染色体的基本过程估计又压缩了40倍。 4从超螺线管到染色体超螺线管进一步螺旋化,形成直径为1~2μm,长度为2~10μm的中期染色体,从超螺线管到染色体大约压缩了5倍。由此推算,DNA经核小体到染色体,总共压缩了8400倍。将DNA经由核小体包装成染色体的基本过程见图14。 122染色质分为常染色质和异染色质 在细胞中,常染色质DNA只占全部DNA的一小部分,其他大多数区域是异染色质。 1常染色质(enchromation)是基因密度较高的染色质,多在细胞周期的S期进行复制,且通常具有转录活性,能够生产蛋白质。常染色质染色较浅且均匀且松散,常染色质在真核生物与原核生物的细胞中皆存在。与原核生物不同,真核生物基因组DNA的遗传信息首先在细胞核内由基因转录为mRNA前体,经剪接加工后,mRNA在胞质的核糖体中翻译成为多肽,经过折叠、修饰等成为具有生物功能的蛋白质,也就是说,细胞内特定蛋白质的选择性表达首先取决于基因组中特定蛋白编码基因的活化。 2异染色质(heterochromatin)是间期细胞核中,染色质丝折叠程度高,处于凝缩状态,碱性染料着色深的那一部分染色质。它具有早凝集晚复制的特点,通常无法转录成为mRNA。异染色质以浓集状态存在。在细胞周期的S期中,异染色质比常染色质更晚进行复制,且只在真核生物中存在,着丝粒及端粒皆属于异染色质,雌性体内去活化的X染色体(也就是巴尔氏体)也是异染色质。 (1)组成型异染色质和兼性异染色质。异染色质可分为组成型异染色质和兼性异染色质。 组成型异染色质较稳定,通常位于着丝粒、端粒及核仁组织区,DNA常不转录,是永久性的异染色质结构,不含或含很少的结构基因。 兼性异染色质,含正常编码的DNA,可自由伸展,使附近基因失活,表现为斑点位置效应(PEV),可和常染色质相互转化,其基因呈抑制状态。人们认为不同组织的细胞,或不同发育期的细胞,正是由于染色质的不同部位形成不同程度的高级有序的异染色质,导致基因开启关闭,从而细胞表现出不同的生理功能、代谢类型和结构状态。 异染色质和常染色质是可以相互转化的,有资料表明,组蛋白尾富含的碱性氨基酸(如Lys和Arg)使其带的正电荷对异染色质的形成和解聚是至关重要的,而各种修饰可以改变组蛋白尾的静电荷,从而使染色质处于不同水平的凝缩状态。如H3 Lys9甲基化促进异染色质的形成,它是异染色质蛋白(HP1、SWi6)的特异结合位点,而H3 Lys4甲基化抑制异染色质的形成。异染色质的形成也直接受基因的控制,有两类拮抗基因E(var)和Su(var),前者抑制异染色质的形成,而促进常染色质的形成;后者促进异染色质形成,抑制常染色质形成。 异染色质最突出的功能是对基因的调控,包括两个相反的过程,一个是通过一种与“异染色质化”有关的过程,使许多碱基的染色质结构关闭;另一方面是通过稳定更多的已开放的染色质结构来避免这种关闭的结构状态的存在。此外,异染色质的形成对印记(imprinting)、剂量补偿、重组和染色质浓缩是必要的。 (2)异染色质的形成。在染色质上并无特征性的因素决定哪里是异染色质形成的位点。异染色质蛋白复合物优先向重复DNA部分聚集,如常见的高等真核生物的臂间异染色质和基因间区域。斑点位置效应表明异染色质能沿染色质扩散,从而引起附近DNA序列遗传的不活泼。组蛋白尾的修饰是异染色质形成的重要原因。 3染色质结构的顺式调控和反式调控尽管核小体的基本结构相同,但基因一旦处在30nm直径以上的高级结构甚至异染色质中,该基因就不可能转录。除此以外,真核细胞的基因及其转录活化需要的顺式调控元件(cis acting element)在染色质中的状态对转录效率也至关重要。如果一个基因和它的重要转录元件(如启动子、增强子等)被特定的染色质结构间隔开,也不能进行转录。 体内核小体结构的动态调整过程表现为核小体有序的周期性结构因特异转录因子的加入或去除而改变。染色质结构调整导致基因起始转录过程中的4个阶段:①“串珠状”核小体甚至更高级结构中的基因处于非活化的基态;②当蛋白质因子通过其DNA结合结构域结合到染色质上,局部的染色质转变为去阻遏状态,这一过程不需要ATP和转录因子的反式活化结构域的参与;③蛋白质因子结合染色质后,依赖于ATP的存在介导了染色质结构的调整,使染色质成为活化状态;④结合于染色质的蛋白反式活化结构域参与募集启动子结合蛋白和转录起始前复合体,基因开始转录。由此可见,染色质结合蛋白中的DNA结合结构域是染色质结构动态调整的关键,而其中的反式活化结构域主导基因的转录。 4 X染色质和Y染色质X染色质即巴氏小体或X小体,为紧贴细胞核膜内面的团块状结构,直径约1μm,染色程度较其他染色质深。其形态不一,常呈三角、半圆、平凸或球形。利用放射自显影技术的研究发现,女性的两条X染色体中有一条DNA复制延迟,称迟复制X。迟复制的X染色体在间期时表现为X染色质。当细胞内有一条以上X染色体时,在间期时除一条X染色体外,其余的X染色体均表现为X染色质,因此间期细胞核中的X染色质数目等于X染色体数减去1。当X染色体结构异常时,X染色质的形态也会有相应的改变。如X等臂染色体时,出现大的X染色质,双着丝粒X染色体时,出现双叶或大的X染色质。 Y染色质又称Y小体或荧光小体。Y染色体用荧光染料染色后,呈亮暗不一的荧光带,在Y染色体长臂的远侧段呈明亮的荧光区。在间期时Y染色体长臂远侧段的强荧光特性仍然存在,经荧光染色后,呈强荧光亮点,直径为025~03μm,位于细胞核内的任何部位。 13核小体 真核生物基因组DNA储存在细胞核内的染色体中。核小体(nucleosome)是构成真核生物染色质的基本结构单位,各核小体串联而成染色质纤维。核小体DNA长度约为165个碱基对,其中缠绕在组蛋白八聚体周围的核心DNA(core DNA)约165圈,约合147个碱基对;而相邻的核小体之间的自由区域(linker DNA)为20~50个碱基的长度,也就是说基因组的75%~90%被核小体所占据。组蛋白八聚体由进化上高度保守的H2A、H2B、H3和H4各两个拷贝组成。核小体核心颗粒在组蛋白H1的作用下形成稳定结构,核小体的进一步组装会干扰DNA复制、基因表达和细胞周期进展的过程。 131发现历史 早在1956年,为双螺旋模型提供X衍射证据的Wilkins和另一位科学家Vittorio Luzzati对染色质进行了X衍射研究,发现染色质中具有间隔为10nm的重复性结构。蛋白质和DNA本身的结构从来不会表现出这种重复性。推测可能是组蛋白和DNA的结合方式迫使DNA折叠或缠绕成具有10nm周期的重复结构。 1971年,Clark和Felsenfeld首先用葡萄球菌核酸酶(staphylococcal nuclease)来作用于染色质,发现有一些区域对核酸酶敏感,有一些则不敏感,不敏感的区域比较均一,这暗示染色体中存在着某些亚单位。 Hewish和Burgoyun(1973)用内源核酸酶消化细胞核,再从核中分离出DNA,结果发现一系列DNA片段,它们相当于长约200bp的一种基本单位的多聚体。表明组蛋白结合在DNA,以一种有规律的方式分布,以致产生对核酸酶敏感的只是某些限定区域。 Noll(1974)用外源核酸酶处理染色质,然后进行电泳,证实了以上结果,他测得前三个片段的长度分别为205bp、405bp、605bp长,每个片段相差200bp,即染色质可能以200bp为一个单位。这正好和以下电镜观察的结果相印证。 与此同时Olins夫妇(1974)和Pierre Chambon等(1975)在电镜下观察到大鼠胸腺和鸡肝染色质的“绳珠”状结构,小球的直径为10nm;Olins并把这种小球称为n小体(nbody即nu body)。 X衍射图表明组蛋白的多聚体都是紧密相联,并无可容纳像DNA分子那样大小的孔洞,所以不可能由DNA之“绳”穿过组蛋白之“珠”,而只可能是DNA缠绕在“珠”的表面。电泳的结果和电镜观察到“绳珠”结构之间是什么样的关系呢? 1974年,哈佛大学Kornberg和Thomas用实验回答了这一问题。他们先用小球菌核酸酶稍稍消化一下染色质,切断一部分200核苷酸对单位之间的DNA,使其中含有单体、二聚体、三聚体和四聚体等。通过凝胶电泳证明每一组分子大小及纯度,并用电镜来观察。结果发现单体均为10nm小体,二聚体则是两个相联的小体,三聚体和四聚体分别由3个小体和4个小体组成,表明200核苷酸的电泳片段长度级差正好是电镜观察到的一个“绳珠”单位。根据这些实验数据,他们提出了一个完整的新型染色质结构,称为核小体(nucleosome),提出了染色质结构的“绳珠”模型。 人们接着用化学交联、高盐分离组蛋白,以及X衍射等方法进一步研究组蛋白多聚体的结构、排列以及怎样和DNA结合的,从而建立了核小体模型。1984年Klug和Butler进行了修正。每一核小体结合的DNA总量为200bp左右,一般在150~250bp变化范围。连接两个核小体的连接DNA(linker DNA)是最容易受到这种酶的作用,因此微球菌核酸酶在连接DNA处被切断,此时每个重复单位的DNA长约200bp,而且是和五种组蛋白相结合,保持着核小体的结构。也就是“绳珠”结构的绳被切断,剩下一个一个的“珠”。 图15核小体结构示意图 132核小体的结构 核小体指核小体核心颗粒加上它的一个邻近的DNA连接子(图15)。核小体DNA长度约为165个碱基对,其中缠绕在组蛋白八聚体周围的核心DNA(core DNA)约165圈、合147个碱基对;而相邻的核小体之间的自由区域(linker DNA)为20~50个碱基的长度。组蛋白八聚体由进化上高度保守的H2A、H2B、H3和H4各两个拷贝组成,每一组蛋白由一结构域和伸出核小体表面的组蛋白尾巴组成。核小体核心颗粒在组蛋白H1的作用下形成稳定结构,进一步组装成高级结构(Kornberg 1974;Noll,1974;Finch et al,1977;Oudet et al,1975;Luger et al,1997)。不同组织、不同类型的细胞,以及同一细胞里染色体的不同区段中,盘绕在组蛋白八聚体核心外面的DNA长度是不同的。核小体的形成将DNA分子转化成一个染色质索,大约为它原始长度的1/3,完成了第一级的DNA包装压缩。 组成核小体核心的所有4个组蛋白是属于相对比较小的蛋白质,含有高比例的正电荷氨基酸(Lys和Arg)。正电荷帮助组蛋白与DNA的负电荷糖磷酸骨架紧密结合。DNA和组蛋白之间的接触面是很广泛的,每个核小体内会形成142个氢键。这些氢键大约有半数是在DNA磷酸二酯骨架与组蛋白氨基酸骨架之间形成的。巨大的疏水作用和盐连接也使得DNA和蛋白质在核小体中保持在一起。这些巨大的相互作用部分解释了为什么事实上任何序列DNA都可以同组蛋白核心结合。 这种空间构象使得缠绕在组蛋白八聚体上的DNA链并非所有部分都与组蛋白结合,那些暴露部分的DNA可能会被DNases所切割。每个核心组蛋白也由长的N端氨基酸尾巴从DNA组蛋白核心延伸出去,这些组蛋白尾部受到几种不同类型的共价修饰来控制染色质结构的多种特性。 133相位 基因组DNA序列与核小体的相对位置不是随机的,可以用核小体相位(phased positioning)来表示,如核小体旋转定位(rotational positioning)表示以DNA相对于核心组蛋白八聚体表面的方向性;而核小体平移定位(translational positioning)则代表核小体在特定基因序列上所占据的位置。 在功能上,核小体在特定的DNA上的相位是决定基因在细胞内能否被活化和转录的关键。核小体相位是一个涉及DNA、转录因子、组蛋白修饰酶和染色质重塑复合体等分子间相互作用的复杂过程(见本书第2章)。核小体在基因组上的精确位置如何由这些因素确定,仍然是一个未知的问题。 14染色体 染色体是染色质经过多级压缩包装而成,是染色质的高级结构,仅在细胞分裂时才出现。染色体是细胞分类中期染色质的形态,通常长05~30μm,直径为02~3μm。形状有棒状、球状、带状、颗粒状等。按着丝粒位置可分为V、L、T型染色体。染色体有种属特异性,随生物种类、细胞类型及发育阶段的不同,染色体在数量、大小和形态上存在着差异。大多数生物的体细胞具有12~50条染色体,例如果蝇有8条染色体,而人的为2n=46条染色体。染色体的长度为02~50μm,一般为1~10μm。 141染色体的化学组成 1组蛋白组蛋白是结构蛋白,它与DNA组成核小体。根据其凝胶电泳性质把组蛋白分为H1、H2A、H2B、H3、H4,它们都含有大量的赖氨酸和精氨酸,其中H3、H4富含精氨酸,H1富含赖氨酸,H2A、H2B介于两者之间。 组蛋白的N端尾巴游离于核小体之外可进行多种类型的转录后修饰,包括乙酰化、甲基化、磷酸化、泛素化、SUMO化、ADP核糖基化及生物素化等。这些修饰可以组合在一起出现,共同组成了所谓的“组蛋白密码(histone code)”调控基因表达。 2非组蛋白种类很多,有20~100种,其中常见的有15~20种,包括酶类(如RNA聚合酶),与细胞分裂有关的蛋白如收缩蛋白、骨架蛋白、核孔复合物蛋白以及肌动蛋白、肌球蛋白、微管蛋白、原肌蛋白等,它们也可能是染色体的结构成分。 142染色体的DNA 真核生物染色体的DNA中含有大量的重复序列,而且功能DNA序列大多被不编码蛋白质的非功能DNA隔开。一种生物单倍体基因组DNA总量称为C值。真核生物DNA序列大致分为三类:非重复序列、中度重复序列、高度重复序列卫星DNA。 143染色体的特征性结构 在细胞周期的有丝分裂中期,染色体的形态结构比较稳定,所以一般多描述的形态结构都是中期染色体。染色体中期外部形态有端粒、核仁组织区、着丝粒、异染色质、染色粒、疖等特征。 1着丝粒(centromere)是一个细长的DNA片段,不紧密卷曲,连接两个染色单体,是染色体分离与运动装置。着丝粒缺少时染色体不能在纺锤体上运动,不能分离并导致染色体的丢失。它将染色单体分为断臂(p)和长臂(q)的结构,由于着丝粒处的染色质较细、内缢,又叫主缢痕(primary constriction)。此处DNA具高度重复,为碱性染料多深染。 着丝粒分为有固定位置着丝粒、无固定位置着丝粒、多着丝粒、全身性着丝粒。一般多为有固定位置着丝粒。 着丝粒又称动原体,是染色体运动区域,也是姐妹染色单体在分开前相互联结的部位,着丝粒的两侧是异染色质区,是短的DNA串联重复序列(Hyman et al,1995;Wiens et al,1998)。有两个基本的功能:在有丝分裂前将两条姐妹染色单体结合在一起,第二个功能为动粒装配提供结合位点。 2动粒(kinetochore)是由着丝粒结合蛋白在有丝分裂期间特别装配起来的、附着于主缢痕外侧的圆盘状结构,内层与着丝粒结合,外层与动粒微管结合。每一个中期染色体含有两个动粒,位于着丝粒的两侧。 3次缢痕(secondary constriction)(核仁形成中心区)是染色体上的一个缢痕部位,由于此处部分的DNA松解,形成核仁组织区,故此变细。它的数量、位置和大小是某些染色体的重要形态特征。每种生物染色体组中至少有一条或一对染色体上有次缢痕。 4核仁组织区(nucleolar organizing region,NOR)是细胞核特定染色体的次缢痕处,含有rRNA基因的一段染色体区域,与核仁的形成有关,故称为核仁组织区。核仁是NOR中的基因活动而形成的可见的球体结构。具有核仁组织区的染色体数目依不同细胞种类而异,人有5对染色体即13、14、15、21、22号染色体上有核仁组织区。 5随体(satellite)是位于染色体末端的、圆形或圆柱形的染色体片段,通过次缢痕与染色体主要部分相连。它是识别染色体的主要特征之一。根据随体在染色体上的位置,可分为两大类:随体处于末端的,称为端随体;处于两个次缢痕之间的称为中间随体。 6端粒(telomere)是正常染色体游离的特化部分。端粒为一复合结构,为若干个不规则的折叠染色丝团形成,不具黏性,不能与其他染色体端粒结合,也不与断裂的染色体末端结合,这对保持染色体结构的稳定具有重要意义。 端粒能保护染色体末端DNA不被降解、融合,不与染色体内部的DNA发生重组。端粒位于细胞核的边缘,在组成核结构时它有特殊作用。保证了核糖体复制到5′端,维持染色体的稳定性。同源染色体的端粒,能再核膜上联接在一起,常是联会的起点,联会复合体也常从这里开始形成。有的端粒有着丝粒的作用,这样的端粒称为新着丝粒。 7染色粒粗线期染色体上分布念珠状突起,突起部分染色较深,是DNA局部螺旋化产生的结构,它可能是DNA复制、RNA合成和RNA加工的单位。也有人认为它是基因功能区。异染色质染色粒比常染色质染色粒要深、要大,被称为“大染色粒”。此外靠近着丝粒的染色粒要大一些,染色体末端的染色粒要小一些,因此做粗线期染色体的分析应包括染色粒的大小、数目和配置,绘制粗线期染色体图是可靠的形态特征。 8疖玉米、苜蓿粗线期染色体上有疖。疖是局部深染部分,也是一种有价值的形态标志,它的位置和数量对于特定的种来说是恒定的,它所在的位置多在染色体的末端或亚末端,中间区较少。 9带与环双线期果蝇唾液腺染色体有带,蛙的卵母细胞双线期有侧环,这也是染色体的重要形态特征。 15核仁结构与功能 核仁(nucleolus)是真核细胞间期核中最明显的结构。在光镜下染过色的细胞内,或者相差显微镜下的活细胞中,或者分离细胞的细胞核内,都容易看到核仁,它通常是单一的或者多个匀质的球形小体,呈中圆形或椭圆形的颗粒状结构,没有外膜。 核仁是细胞核中一个均匀的球体,由纤维区、颗粒区、核仁染色质、基质等部分组成,主要功能是进行核糖体RNA的合成。核仁的大小、形状和数目随生物的种类、细胞类型及细胞代谢状态而变化。蛋白质合成旺盛、代谢活跃的细胞,如分泌细胞、卵母细胞的核仁大,可占核体积的25%。各种生物的核仁数目一般是一定的,如非洲爪蟾有两个核仁。人类的细胞只有一个核仁。 151核仁的化学组成 蛋白质:约占干重80%,如核糖体蛋白、组蛋白、非组蛋白及多种酶类。 RNA:约占干重的10%。蛋白质合成旺盛的细胞,RNA含量高。 DNA:占8%,主要存在于核仁相随染色质中。 152核仁的结构 核仁呈圆形或卵圆形,无界膜包围,是由多种组分形成的一种网状结构。在光镜下,核仁通常是均质的球体,具有较强的折光性,易被酸性或碱性染料着色;在电镜下,核仁裸露无膜、由纤维丝构成,包括纤维成分、颗粒成分、核仁相随染色质和核仁基质。 153核仁的形成 核仁是一种高度动态的结构,在细胞周期过程中,在有丝分裂期间表现出周期性的消失与重建,即形成消失形成,这种变化称为核仁周期(nucleolar cycle)。而核仁染色体的凝集(前期)与解凝集(末期),决定核仁的消失和重现。当细胞进入有丝分裂时,核仁首先变形和变小;其后染色质凝集和停止核糖核酸(RNA)合成,包含有核糖体RNA(rRNA)基因的DNA袢环逐渐收缩回到相应染色体的核仁组织区;核膜破裂进入中期,这时核仁消失;在有丝分裂末期时,核仁组织区DNA解凝集,rRNA合成重新开始,极小的核仁重新出现在染色体核仁组织区附近。核仁的重建过程与原有的核仁组分的协助和参与有关。核仁形成的分子机制尚不清楚,但需要rRNA基因的激活。 154核仁的功能 核仁是细胞合成核糖体的工厂,涉及rRNA的转录加工和核糖体大小亚基的装配(核仁在rRNA转录与核糖体装配中的作用)。由于核糖体是合成蛋白质的机器,只要控制了核糖体的合成和装配就能有效地控制细胞内蛋白质的合成速度,调剂细胞生命活动的节奏。因此,从某种意义上说,核仁实际上操作着蛋白质的合成。 参 考 文 献 AGUILERA A2005mRNA processing and genomic instability[J].NatStructMolBiol,12:737738 AHMAD K,HENIKOFF S2001Centromeres are specialized replication domains in heterochromatin[J].JCell Biol,153:101110 AHMAD K,HENIKOFF S2002The histone variant H33 marks active chromatin by replicationindependent nucleosome assembly[J].MolCell,9:11911200 AMBROS V2004The functions of animal microRNAs[J].Nature,431:350355 ANDERSSON S G,KURLAND C G1999Origins of mitochondria and hydrogenosomes[J].CurrOpinMicrobiol, 2:535544 ANGELOV D,VITOLO J M,MUTSKOV V,et al2001Preferential interaction of the core histone tail domains with linker DNA[J].ProcNatlAcadSci,98:65996604 BAYLISS R,CORBETT A H,STEWART M2000The molecular mechanism of transport of macromolecules through nuclear pore complexes[J].Traffic,1:448456 BECKER P B,HORZ W2002ATPdependent nucleosome remodeling[J].AnnuRevBiochem,71:247273 BECSKEI A,MATTAJ I W2005Quantitative models of nuclear transport[J].CurrOpinCell Biol,17:2734 BENEFRAIM I,GERACE L2001Gradient of increasing affinity of importin beta for nucleoporins along the pathway of nuclear import[J].JCell Biol,152:411417 BROERS J L,HUTCHISON C J,RAMAEKERS F C2004Laminopathies[J].JPathol,204 :478488 CONTI E,IZAURRALDE E2001Nucleocytoplasmic transport enters the atomic age[J].CurrOpinCell Biol,13:310319 CULLEN B R2003Nuclear RNA export[J].JCell Sci,116 :587597 DASSO M2002The Ran GTPase:theme and variations[J].CurrBiol,12:R502R508 FAHRENKROG B,STOFFLER D,AEBI U2001Nuclear pore complex architecture and functional dynamics[J].CurrTopMicrobialImmunol,258:5117 GAVIN I,HORN P J,PETERSON C L2001SWI/SNF chromatin remodeling requires changes in DNA topology[J].MolCell,7:97104 GILBERT N,GILCHRIST S,BICKMORE W A2005Chromatin organization in the mammalian nucleus[J].IntRevCytol,242:283336 GOLDFARB D S,CORBETT A H,MASON D A,et al2004Importin alpha:a multipurpose nucleartransort receptor[J].Trends Cell Biol,14:505514 GOLDMAN R D,GRUENBAUM Y,MOIR R D,et al2002Nuclear lamina:building blocks of nuclear architecture[J].Genes Dev,16:533547 GRIFFITH J D1999Mammalian telomeres end in a large duplex loop[J].Cell,97:503514 GRUENBAUM Y,MARGALIT A,GOLDMAN R D,et al2005The nuclear lamina comes of age[J].NatRevMolCell Biol,6:131 HAMICHE A,KANG J G,DENNIS C,et al2001Histone tails modulate nucleosome mobility and regulate ATPdependent nucleosome sliding by NURF[J].ProcNatlAcadSci,98:1431614321 HAREL A,FORBES D J2004Importin beta:conducting a much larger cellular symphony[J].MolCell,16:319330 HILLEREN P,MCCARTHY T,ROSBASH M,et al2001Quality control of mRNA 3′end processing is linked to the nuclear exosome[J].Nature,413:538542 HO J H,KALLSTROM G,JOHNSON A W2000Nmd3p is a Crmlpdependent adapter protein for nuclear export of the large ribosomal subunit[J].JCell Biol,151:10571066 HOOD J K,SILVER P A2000Diverse nuclear transport pathways regulate cell proliferation and oncogenesis[J].BiochimBiophysActa,1471:M31M41 HUTCHISON C J,ALVAREZREYES M,VAUGHAN O A2001Lamins in disease:why do ubiquitously expressed nuclear envelope proteins give rise to tissuespecific disease phenotypes? [J].JCell Sci,114:919 HYMAN A A,SORGER P K1995Structure and function of kinetochores in budding yeast[J].AnuRevCell DevBiol,1:471495 JANKOWSKY E,GROSS C H,SHUMAN S,et al2000The DExH protein NPHII is a processive and directional motor for unwinding RNA[J].Nature,403:447451 JANKOWSKY E,GROSS C H,SHUMAN S,et al2001Active disruption of an RNAprotein interaction by a DexH/D RNA helicase[J].Science,291:121125 JENSEN T H,DOWER K,LIBRI D,et al2003Early formation of mRNP:license for export or quality control? [J].MolCell,11:11291138 JENUWEIN T,ALLIS C D2001Translating the histone code[J].Science,293:10741080 KADAM S,MCALPINE G S,PHELAN M L,et al2000Functional selectivity of recombinant mammalian SWI/SNF subunits[J].Genes Dev,14:24412451 KALAB P,WEIS K,HEALD R2002Visualization of a RanGTP gradient in inter phase and mitotic Xenopus egg extracts[J].Science,295:24522456 KIM V N2005MicroRNA biogenesis:coordinated cropping and dicing[J].NatRevMolCell Biol, 6:376385 KITAGAWA K,HIETER P2001Evolutionary conservation between budding yeast and human kinetochores[J].NatRevMolCell Biol,2:678687 LEI E P,SILVER P A2002Intron status and 3′end formation control cotranscriptional export of mRNA[J].Genes Dev,19:27612766 LIBRI D,DOWER K,BOULAY J,et al2002Interactions between mRNA export commitment,3′end quality control,and nuclear degradation[J].MolCell Boil,22:82548266 MILLER B R,FORBES D J2000Purification of the vertebrate nuclear pore complex by biochemical criterial[J].Traffic,1:941951 MOSAMMAPARAST N,PEMBERTON L F2004Karyopherins:from nucleattransport mediators to nuclearfunction regulators[J].Trends Cell Biol,14:547556 NARLIKAR G J,FAN H Y,KINGSTON R E2002Cooperation between complexes that regulate chromatin structure and transcription[J].Cell,108:475487 OEFFINGER M,DLAKIC M,TOLLERVEY D2004A preribosomeassociated HEATrepeat protein is required for export of both ribosomal subunits[J].Genes Dev,18:196209 OHNSON A W,LUND E,DAHLBERG J2002Nuclear export of ribosomal subunits[J].Trends BiochemSci,27:580585 PARADA L,MISTELI T2002Chromosome positioning in the interphase nucleus[J].Trends Cell Biol,12:425432 PLATH K,MLYNARCZYKEVANS S,NUSINOW D A,et al2002Xist RNA and the mechanism of x chromosome inactivation[J].AnnuRevGenet,39:233278 POON I K,JANS D A2005Regulation of nuclear transport:central role in development and transformation? [J].Traffic,6:173186 POSTOW L,HARDY C D,ARSUAGA J,et al2004Topological domain structure of the Escherichia coli chromosome[J].Genes Dev,18:17661779 RABUT G,DOYE V,ELLENBERG J2004Mapping the dynamic organization of the nucleat pore complex inside single living cells[J].NatCell Biol,6 :11141121 RAYGALLET D,QUIVY J P,SCAMPS C,et al2002HIRA is critical for a nucleosome assembly pathway independent of DNA synthesis[J].MolCell,9:10911100 RIBBECK K,GORLICH D2001Kinetic analysis of translocation through nuclear pore complexes[J]. EMBO J,20:13201330 RICHMOND T J,DAVEY C A2003The structure of DNA in the nucleosome core[J].Nature,423:145150 ROBERT F,YOUNG R A,STRUHL K2002Genomewide location and regulated recruitment of the RSC nucleosome remodeling complex[J].Genes Dev,16:806819 ROUT M P,AITCHISON J D2001The nuclear pore complex as a transport machine[J].JBiolChem,276 :1659316596 SAGUEZ C,OLESEN J R,JENSEN T H2005Formation of exportcompetent mRNP:escaping nuclear destruction[J].CurrOpinCell Biol,17:287293 SANGER R H,GREEN M R1997Compartmentalization of eukaryotic gene expression:cause and effects[J].Cell,91:291294 SCHWARTZ T U2005Modularity within the architecture of the nuclear pore complex[J]. CurrOpinStructBiol,276:1659316596 SHAHEEN H H,HOPPER A K2005Retrograde movement of tRNAs from the cytoplasm to the nucleus in Saccharomyces cerevisiae[J].ProcNatlAcadSci,102:1129011295 SUNTHARALINGAM M,WENTE S R2003Peering through the proe:nuclear pore complex structure,assembly,and function[J].DevCell,4:775789 TAKANO A,ENDO T,YOSHIHISA T2005tRNA actively shuttles between the nucleus and cytosol in yeast[J].Science,309:140142 TSUKIYAMA T2002The in vivo functions of ATPdependent chromatinremodelling factors[J].NatRevMolCell Biol,3:422429 VERREAULT A2000De novo nucleosome assembly:New pieces in an old puzzle[J].Genes Dev,14 :14301438 YANG W,GELLES J,MUSSER S M2004Imaging of singlemolecule translocation through nuclear pore complexes[J].ProcNatlAcadSci,101:1288712892 ZAMORE P D,HALEY B2005Ribognome:the big world of small RNAs[J].Science,309:15191524 ZHU H,CONTE F,GREEN C B2003Nuclear localization and transcriptional repression are confined to separable domains in the circadian protein CRYPTOCHROME[J].Curr Biol13(18):16531658 第2章核小体定位 真核生物中,长线性、带负电DNA必须被高度压缩成致密形态才能被包含在狭小的细胞核中,这一过程主要依靠DNA与组蛋白相互作用实现,可以产生高达10 000倍的压缩。DNA缠绕在组蛋白八聚体周围形成核小体,核小体是构成真核生物染色质的基本结构单位。核小体由相对伸展的连接DNA相连,形成串珠状(称为一级结构),基本的核小体进一步折叠成约30nm的纤维状结构(也称二级结构),30nm的纤维状结构进而包装成高级染色质结构(Kornberg 1974;Luger et al,2005)。(图21) 图21染色质结构 除了作为包装单位,核小体在诸如基因表达、DNA复制、修复等过程发挥重要作用。染色质结构实际上是基因表达的重要调控层。比如,组蛋白变体取代核心组蛋白改变八聚体结构可以调节基因表达(Kamakaka et al,2005;Sarma et al,2005),组蛋白尾巴受到多种翻译后的化学修饰改变核小体的物理性质也可影响基因表达等(Kouzarides 2007;Millar et al,2006)。由于核小体对诸如转录调控、DNA复制和修复等过程的重要作用,核小体在基因组上的精确位置就至关重要了。念珠状的核小体在基因组DNA分子上的精确位置称为核小体定位。进一步可分为描述DNA特定位点与核小体核心相对线性位置的平移定位和描述DNA双螺旋与组蛋白八聚体相对方向的旋转定位。核小体在基因组上的组装方式及控制其定位机制的研究对于理解转录因子结合和转录调控机制等多种生物学过程具有十分重要的作用(McGhee et al,1980;Kornberg et al,1999;Schalch et al,2005)。包括基因组上核小体定位、组蛋白修饰、染色质重塑等问题已成为目前遗传学研究热点——表观遗传学的重要研究内容。 21基因组上核小体定位的实验图谱 211基因组尺度核小体定位作图的基本策略 第2章核小体定位 核小体作图技术分为体内和体外技术。体内技术显示活细胞中的染色质组织的详细图谱,而体外技术则有排除蛋白反式因子作用研究核小体组装与DNA序列关系的优点。核小体体外组装采用盐透析的方法及依赖ATP把组蛋白八聚体和DNA结合在一起(Thastrom et al,2004)。体内试验一般使用甲醛实现组蛋白与DNA的交联,从而完成核小体的体内定位测定(Rando 2010)。 真核生物的基因组DNA是由高度密集的核小体缠绕而成,连接两个核小体的连接DNA(linker DNA)最容易受到微球菌核酸酶的作用而发生断裂,而核小体覆盖的序列则受到保护。20世纪70年代,Kornberg(Kornberg et al,1977)用微球菌核酸酶消化染色质,得到了核小体的单体和多聚体;这是早期理解核小体在染色质上分布的最重要的实验工作。消化后的染色质使用一般的细胞裂解结合DNA提取技术分离,有时也会使用染色质免疫共沉淀技术,获得的核小体DNA片段去除蛋白并纯化。已经发展了包括Southern杂交、引物和单体延伸、覆瓦PCR等技术确定核小体位置(Clark 2010;Sekinger 2005)。近几年又发展出一批基于芯片和高通量的技术。这里用Yuan等(Yuan et al,2005)的工作对其原理作一解释:①微阵列设计。把酵母Ⅲ号染色体序列分成互相有20bp重叠的长度为50bp的片段作为探针并与全基因组DNA进行杂交,经过Blast比对后,去除在其他染色体上分布的连续覆盖5个(长度为170bp)及以上探针的片段,保留下来的覆盖酵母Ⅲ号染色体278 960bp的探针作为微阵列的探针。②分离核小体DNA。用微球菌核酸酶消化甲醛交联的染色质,得到核小体单体。经胶纯化回收后的单体核小体DNA用于标记和杂交。 图22获得高分辨率核小体定位图 实验方案(引自Yuan et al,2005)③微阵列杂交。使用BioPrime Klenow labeling kit(invitrogen)用Cy3标记单体核小体DNA,用Cy5标记全基因组DNA,然后混合在一起。将混合液加入微阵列,与探针65℃杂交4小时后,利用Axon 4000B基因芯片扫描仪测定其杂交值,高Cy3/Cy5比值意味着有核小体占据。④最后实验数据经过正则化,并用隐马尔科夫模型(HMM)处理得到酵母高分辨率核小体定位图。(图22) 依据同样的实验原理,Lee(Lee et al,2004)对酵母全基因组约70 000个核小体进行了定位,采用长度为25bp的两套探针;第一套探针长度25bp,每两个探针间平移8bp,覆盖酵母染色体的一条链;另一套探针长度也是25bp,每两个探针间平移也是8bp,但与第一套探针的互补序列平移4bp,覆盖酵母染色体的另一条链。这样精度为4bp的探针覆盖整个酵母基因组。随着测序技术的发展,Field(Field et al,2008)采用高通量测序确定了酵母基因组380 000个核小体的位置,首先用微球菌核酸酶消化甲醛交联的染色质,然后分离纯化长度为127~177bp的所有片段,进行高通量测序后Blast比对确定其在基因组上的位置,获得了高精度的酵母核小体定位图谱。 212基因组尺度核小体定位图谱 最早出现的核小体定位图谱(Bernstein et al,2004;Lee et al,2004)由于受技术条件所限分辨率较低,不过仍然是基因组尺度核小体图谱的代表性工作。随着高通量实验技术的发展,近些年关于核小体定位的实验工作取得突破性进展,有多个小组相继在基因组范围识别了酵母的高分辨率核小体定位图(Lee et al,2007;Field et al,2008;Yuan et al,2005;Albert et al,2007;Segal et al,2006;Pokholok et al,2005;Raisner et al,2005)。其中Yuan等的工作堪称基因组尺度高分辨率核小体定位检测的先驱之作(Yuan et al,2005),而Lee的工作则是第一个酵母全基因组高分辨率图谱(Lee et al,2007)。Albert等人工作则通过研究组蛋白变体H2AZ与酵母DNA组装表明了核小体的旋转定位机制(Albert et al,2007)。 上述核小体定位实验主要基于体内技术,而体外技术则可以排除蛋白反式因子作用,直接研究核小体组装与DNA序列关系。使用盐透析法将纯化的组蛋白八聚体与基因组DNA组装成核小体技术,Kaplan等(Kaplan et al,2009)构通过芯片技术测量荧光强度或用高通量技术获得核小体序列覆盖次数,从而给出核小体的占据率,建了体外酵母基因组核小体占据图谱。体内和体外实验图谱显示了高度相似性,二者相关系数达074表明DNA序列是决定核小体位置的重要因素,并且在功能位点附近两个图谱均显示核小体缺乏。但仔细分析发现全基因组范围两图谱并不精确一致,表明除了DNA序列因素外,其他包括染色质重塑复合物、转录因子等也会影响体内核小体的排布。Zhang等(Zhang et al,2009)使用盐透析和ATP依赖因子(如ACF因子)体外组装酵母和大肠杆菌染色质,发现转录起始和终止区核小体缺乏,但核小体平移定位规律较弱,其体内和体外实验图谱相关系数仅为054,基于这一事实,作者推断DNA序列不是体内核小体定位的主要因素。这样,两类研究得出相反的结论,而且持续的争论还在进行(Kaplan et al,2009;Pugh 2010;Stein et al,2009;Zhang et al,2009)。在达成共识之前,各自还会有不同解释。核小体占据率不一定能精确反映核小体在基因组上的位置。为了确定核小体的精确线性定位,可以计算核小体中心的位置及标准偏差。由Zhang等(Zhang et al,2009)的工作我们只能推断单纯由DNA序列难以确定核小体精确位置,但DNA序列会影响核小体占据的结论仍然有效。 几个小组对人类(Ozsolak et al,2007;Heintzman et al,2007;Barski et al,2007;Schones et al,2008)、线虫(Johnson et al,2006)、果蝇(Mavrich et al,2008a)核小体定位做了初步研究,绘制了不同物种的核小体定位图谱,为核小体的生物信息学分析奠定了基础。 22基因组上核小体分布的一般模式 221DNA转录相关位点邻近核小体分布 基因组尺度核小体定位图谱及理论模型促进我们对核小体体内组织的理解。实验表明不同细胞中核小体位置几乎相同,换句话说核小体是高度定位的(Lee et al,2007;Yuan et al,2005)。研究发现,核小体沿基因组分布具有规律性。基因组上某些区域核小体占据率高,某些区域核小体缺乏。比如基因间区与ORFs相比,核小体更加稀疏;像启动子这样的调控区核小体分布甚至比基因间区还少,Field等详细研究了酵母的大约380 000个核小体序列,发现转录起始位点上游区域和翻译终止位点下游区域核小体缺乏(Satchwell et al,1986;Richmond et al,2003;Bernstein et al,2004;Sekinger et al,2005;Guillemette et al,2005;Lee et al,2007;Vaillant et al,2007;Albert et al,2007;Durant et al,2007;Mavrich et al,2008a;Field et al,2008;Field et al,2009;Kaplan et al,2009;Jiang et al,2009)。这些区域一般称为核小体自由区(nueleosomefree regions,NFR)或核小体缺乏区(nueleosomedepleted regions,NDR)。Bernstein等(Bernstein et al,2004)用ChIPChip技术分析了酵母全部启动子区核小体占据水平,发现启动子区域核小体占据数与启动子下游基因转录速率负相关,核小体缺乏区含有更多的转录因子结合模体。图23显示了人及线虫基因组上核小体分布。 图23基因组上核小体分布 A转录起始位点前(启动子区域)核小体缺乏;B内部内含子/外显子交界处外显子一侧核小体占据率高; C最后内含子/外显子交界处外显子一侧核小体占据率高;D翻译终止位点后终止子区核小体占据率低 图中黑色和绿色线分别表示人及线虫基因组上核小体分布(引自Andersson et al,2009) 222DNA复制起始位点邻近区核小体分布 染色质的局部环境会调节DNA复制过程,其中核小体定位起到了非常重要的调控作用(Lipford et al,2001;Wyrick et al,2001;Thoma et al,1984;Ahel et al,2009;Bao et al,2007;Yin et al,2007)。Simpson等将ARS1克隆到穿梭质粒中,在质粒上重新组装了核小体的结构,通过微球菌核酸酶消化,利用探针杂交研究发现,ACS处没有核小体占据,推测这可能有利于ORC结合(Simpson,1990)。Lipford 和Bell在酵母基因组中研究核小体定位对ARS1活性影响时发现,ACS位于核小体缺乏区,且ACS邻近区的核小体占据对于起始活性非常重要,如果将这些核小体移到远离ACS区后并不会干扰ORC的结合,但会抑制复制起始复合物的形成(Lipford et al,2001)。最近,Eaton等利用高通量的序列分析测定了酵母体内及质粒上ARS两侧的核小体定位图谱,发现酵母复制起始位点ARS两侧核小体分布具有一定的规律,并且呈现不均匀的模式(图24),ACS区更倾向于核小体缺乏,而且复制启动时ORC蛋白结合需要ACS两侧精确的核小体定位(Eaton et al,2010)。 图24基因组上核小体分布情况(引自Eaton et al,2010) A转录起始位点上下游核小体的分布;B复制起始位点ARS上下游核小体的分布 223核小体定位的“统计定位”模型 一般来说,富含AT区核小体占据率低。典型的poly(dA∶dT)序列易出现在5′核小体缺乏区(5′NFR),5′NFR长度约为150bp。大部分功能位点如转录因子结合位点、TATA盒出现在5′核小体缺乏区。5′NFR两边是良好定位的-1和+1核小体,-1核小体通常位于NFR上游,而NFR一般位于转录起始位点(transcription start site,TSS)上游-300~-150bp区域。NFR下游出现+1核小体,通常+1核小体具有强烈的定位信号,这一核小体中心位于TSS下游50~60bp(Yual et al,2005;Albert et al,2007;Lee et al,2007;Mavrich et al,2008b)。-1和+1核小体富含组蛋白变体H2AZ,通过组蛋白结构丧失使转录更加容易进行(Santisteban et al,2000;Guillemette et al,2005;Li et al,2005;Raisner et al,2005;Zhang et al,2005;Millar et al,2006;Albert et al,2007)。3′端同样出现NFR区,可能与转录终止因子的结合有关(Shivaswamy et al,2008;Mavrich et al,2008b)。这样,核小体排斥序列可能是帮助核小体形成良好定位的边界。由于核小体不能重叠,+1核小体位置会限制或引导邻近核小体的位置,形成类似串珠结构。+1核小体下游逐渐丧失精确定位,称为统计定位的区域,大约在TSS后1kb这种统计定位的规律消失。这一模型称为“统计定位”或“障碍模型”(Kornberg et al,1988)。(图25) 图25酵母基因核小体结构(引自Jansen et al,2011) 调控区核小体缺乏可能是真核生物基因组组织的基本性质。由于核心DNA被包装进核小体中,阻断了包括那些负责最基本生命过程的蛋白(如起始DNA复制、转录和DNA修复的蛋白因子等)与DNA的接触机会;而核小体之间的自由区域更有利于这些蛋白因子的进入并与其识别位点相结合,从而保证了转录因子易于接近染色质模板;由DNA编码的核小体组装方式(指核小体在基因组上的稀少区或占据区)明显地影响基因的表达水平。 23核小体定位的理论研究 如前所述,核小体定位是一个涉及DNA、转录因子、组蛋白修饰酶和染色质重塑复合体等分子间相互作用的复杂过程。多年以来,研究者一直在探讨核小体在基因组上的位置是随机分布的还是由DNA序列编码。已有许多工作试图解释确定DNA特定区域与组蛋白结合并形成核小体的核小体定位机制。多项研究工作显示基因组DNA序列与组蛋白的亲和力明显地依赖于序列顺序,表明DNA序列顺序的确会影响核小体形成的位置;还有一些工作表明核小体在DNA相对组蛋白的方位及其在基因组上的位置依赖于基因组序列顺序(Trifonov,1980;Trifonov et al,1980;Drew et al,1985;Satchwell et al,1986;Baldi et al,1996;Ioshikhes et al,1996;Trifonov et al,1997;Lowary et al,1998;Levitsky et al,1999;Stein et a1,1999;Widom,2001;Kiyama et al,2002;Albert et al,2007)。 231从DNA序列到核小体定位 基因组核小体图谱提供了理解影响核小体定位因素的宝贵资源,特别是核小体位置信息可以帮助我们理解核小体定位的序列依赖机制。基于序列中核小体定位有关的模体信息发展预测算法是一有效途径,预测模型的能力提供理解核小体定位序列依赖程度的基础。 1核小体形成序列研究发现有些序列模体易于核小体形成,其中AT/TT/TA二联体10bp周期性是重要信号之一。Satchwell等早在1986年(Satchwell et al,1986)通过统计发现核小体的核心区147bp中每隔约10bp重复出现AA/TT/TA二联体,DNA双螺旋的大沟朝内(也就是组蛋白八聚体的方向);每隔约10bp重复出现CC/CG/GC/GG二联体,DNA双螺旋的大沟朝外(也就是背向组蛋白八聚体的方向),两种二联体交替出现,相隔5bp。Field等(Field et al,2008)最新数据统计也显示了同样的结论,Segal(Segal et al,2006)进一步发现对其他真核生物也有类似规律(图26)。 序列上每10个碱基出现的周期性信号有利于DNA片段剧烈弯曲,从而紧密缠绕在组蛋白周围形成高度致密的核小体(Bao et al,2006)。Segal和他的同事们把这种周期性信号定义为核小体定位密码(nucleosome positioning code)(Segal et al,2006)。2000年Worning等人发现这种周期性信号在真核生物基因组中是每隔10bp重复出现,而在原核生物基因组中也存在,重复出现的周期是11bp(Worning et al,2000)。2008年陈开富等在对阴道滴虫基因组的研究中,检测到一个长约121bp的DNA序列周期(Chen et al,2008)。刘弘德等人发现周期性信号在核小体的核心区的两侧每隔103bp出现,而中心区每隔113bp出现(Liu et al,2008)。 2排斥核小体组装的重要信号—Poly(dA∶dT)tractsPoly(dA∶dT)tracts(长度可以在10~20bp之间)是一类原核生物中缺乏、真核生物中普遍存在的多聚脱氧腺甘酸链,可能在真核生物基因组中有基本的功能(Raisner et al,2005;Iyer et al,1995;Kaplan et al,2008;Segal et