分子生物学
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节 DNA的结构和功能

DNA的结构单位是脱氧核苷一磷酸(dNMP),包括一磷酸脱氧腺苷(dAMP)、一磷酸脱氧鸟苷(dGMP)、一磷酸脱氧胞苷(dCMP)和一磷酸胸苷(TMP),分别由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)等碱基与磷酸、脱氧核糖构成。脱氧核苷一磷酸通过3′,5′-磷酸二酯键连接构成线性DNA单链,这是DNA的一级结构。两股DNA链互补结合并形成右手双螺旋结构,这是DNA的二级结构。原核生物及病毒的共价闭合环状DNA进一步盘曲形成超螺旋结构;真核生物线性DNA与蛋白质及少量RNA结合,经过层层压缩,最终形成染色体结构,这些是DNA的三级结构

一、DNA的一级结构

四种脱氧核苷一磷酸通过3′,5′-磷酸二酯键连接,构成DNA单链。

在DNA单链中,每个核苷酸的3′-羟基与相邻核苷酸的5′-磷酸基缩合,形成3′,5′-磷酸二酯键(受2′-羟基影响,RNA的3′,5′-磷酸二酯键不如DNA的稳定)。核酸主链又称骨架,由磷酸基与戊糖交替连接构成,碱基相当于侧链。

核酸链有方向性,即有两个不同的末端,分别称为5′端和3′端,5有游离磷酸基,是头;3有游离羟基,是尾。DNA链有几种书写方式,都是从头到尾,即5′→3′端书写,与核酸的合成方向一致。

不同DNA分子的长度及脱氧核苷一磷酸的排列顺序不同。核苷酸广义上包括脱氧核苷一磷酸,所以DNA的一级结构通常被定义为DNA的核苷酸序列(图1-1)。不同核苷酸只是碱基不同,所以核苷酸序列也称为碱基序列。

img

图1-1 核酸一级结构和书写方式

二、DNA的二级结构

DNA典型的二级结构为右手双螺旋结构。此外,DNA分子还存在局部左手双螺旋结构、十字形结构和三股螺旋结构等。

(一)右手双螺旋结构

1953年,Watson和Crick结合Chargaff规则及Franklin和Wilkins对DNA纤维X射线衍射图的研究,提出了经典的DNA二级结构模型——双螺旋结构模型(double helix model,图1-2)。

img

图1-2 B-DNA双螺旋结构模型

1.两股DNA链反向互补形成双链结构 在该结构中,DNA主链位于外面,碱基侧链位于内部(但是暴露于大沟和小沟内)。双链碱基形成Watson-Crick碱基配对(图1-3),即腺嘌呤(A)以两个氢键与胸腺嘧啶(T)结合,鸟嘌呤(G)以三个氢键与胞嘧啶(C)结合,这种配对称为碱基配对原则。由此,一股DNA链的核苷酸序列决定着另一股DNA链的核苷酸序列,两股DNA链称为互补链

img

图1-3 Watson-Crick碱基配对

2.DNA双链进一步形成右手双螺旋结构 在双螺旋结构中,碱基平面与螺旋轴垂直,糖基平面与碱基平面接近垂直,与螺旋轴平行;双螺旋直径为2nm,每一螺旋含10bp(bp为双链核酸长度单位,1bp为1个碱基对),螺距为3.4nm,相邻碱基对之间的轴向距离为0.34nm;双螺旋表面有两道沟槽,相对较深、较宽的为大沟(轴向沟宽2.2nm),相对较浅、较窄的为小沟(轴向沟宽1.2nm)。

3.氢键和碱基堆积力维持DNA双螺旋结构的稳定性 碱基对氢键维持双链结构的横向稳定性,即双链结构。碱基对平面之间的碱基堆积力(base-stacking force,包括范德华力和疏水作用)维持双螺旋结构的纵向稳定性,即螺旋结构。

上述右手双螺旋结构模型是92%相对湿度下制备的DNA钠盐纤维的二级结构,称为B-DNA。在溶液状态下,B-DNA每一螺旋含10.4~10.5bp,螺距为3.6nm,且形成碱基对的两个碱基并非共面,而是形成螺旋桨结构。细胞内DNA几乎都以B-DNA结构存在。

(二)其他二级结构

DNA局部存在其他二级结构,例如A-DNA、Z-DNA(图1-4)、十字形结构、三股螺旋结构。

img

图1-4 几种DNA双螺旋结构

1.A-DNA 也是右手螺旋DNA,但与B-DNA相比大沟变窄变深,小沟变宽变浅。A-DNA双螺旋直径为2.6nm,每一螺旋含11bp,螺距为2.9nm。A-DNA是75%相对湿度下制备的DNA钠盐纤维的二级结构。在细胞内,某些DNA-蛋白质复合物中含A-DNA,RNA双链区及某些DNA-RNA杂交双链的二级结构与A-DNA一致。

2.Z-DNA 是左手螺旋DNA,是1979年Rich等用X射线衍射技术分析人工合成的DNA片段CGCGCG晶体时发现的。Z-DNA双螺旋主链呈锯齿状,其表面只有一道沟槽,相当于BDNA的小沟,窄而深。Z-DNA双螺旋直径为1.8nm,每一螺旋含12bp,螺距为4.5nm。研究表明,生物体内DNA中富含CpG的序列容易形成Z-DNA结构,其功能可能是参与基因表达调控或DNA重组。

3.十字形结构 双链DNA中存在许多反向重复序列(IR),这种序列可以形成十字形结构。这种结构可能有助于DNA与DNA结合蛋白(DBP)结合,影响基因表达。此外,大肠杆菌DNA复制起点也存在十字形结构(图1-5)。人类基因组约含5%的反向重复序列。

img

图1-5 DNA反向重复序列与十字形结构

三、DNA的超螺旋结构

细菌、线粒体及某些病毒等的DNA具有闭环结构,即其两股链均呈环状,这种DNA称为共价闭合环状DNA(cccDNA,简称闭环DNA)。共价闭合环状DNA的三级结构是在双螺旋结构(松弛结构,relaxed molecule)基础上进一步盘绕形成的超螺旋(superhelix)结构。超螺旋有正超螺旋和负超螺旋两种,DNA依双螺旋方向进一步缠绕形成正超螺旋(positive supercoil);DNA依双螺旋相反方向旋转形成负超螺旋(negative supercoil)。两股DNA形成的正超螺旋为右手超螺旋、负超螺旋为左手超螺旋。四股DNA形成的正超螺旋为左手超螺旋、负超螺旋为右手超螺旋(图1-6)。DNA在细胞内通常处于负超螺旋状态,这有利于其复制和转录。

img

图1-6 DNA形成四股超螺旋

四、染色体的结构

真核生物染色体DNA与组蛋白、非组蛋白及少量RNA在细胞分裂间期形成染色质结构,在细胞分裂期形成染色体结构,两者的主要区别是压缩程度(称为压缩比、包装比)不同。

作为遗传物质,染色体有以下特征:①分子结构相对稳定;②能够自主复制;③能够指导RNA和蛋白质合成,从而控制生命过程;④会发生可遗传的变异。

(一)染色体组成

染色体的主要成分是DNA、RNA、组蛋白和非组蛋白,其中DNA和组蛋白含量稳定,含量比接近1∶1;RNA和非组蛋白含量则随着生理状态的变化而变化。

1.组蛋白histone) 是真核生物染色体的基本结构蛋白。C端2/3序列富含疏水性氨基酸,N端1/3序列富含碱性氨基酸精氨酸(Arg)和赖氨酸(Lys)(表1-1)。组蛋白属于碱性蛋白质,等电点在10以上。

表1-1 人组蛋白种类与性质

img

组蛋白有H1、H2A、H2B、H3和H4共五类,其中H2A、H2B、H3和H4称为核心组蛋白(core histone),H1称为连接DNA组蛋白(linker histone)。从一级结构上看,核心组蛋白高度保守,特别是H3和H4,没有明显的种属特异性和组织特异性,含量也很稳定,例如豆类(Ile60、Arg77)与牛(Val60、Lys77)的H4仅有两个氨基酸残基不同,人与酵母的组蛋白H4仅有9个氨基酸残基不同。连接DNA组蛋白H1在不同生物体、不同组织细胞中的差异较大,在个体发育过程中也有变化。组蛋白在维持染色体的结构和功能方面起关键作用。

2.非组蛋白nonhistone) 大多数非组蛋白比组蛋白大,且富含酸性氨基酸,属于酸性蛋白质。非组蛋白种类繁多,具有种属特异性和组织特异性,并且在整个细胞周期中都有合成,而不像组蛋白仅在S期与DNA同步合成。非组蛋白既有支架蛋白(scaffold protein),又有酶和转录因子等,其主要功能是参与DNA折叠、复制、修复、重组,RNA合成与加工,调控基因表达。非组蛋白特性:

(1)种类多样性 有20~100种,占染色质蛋白的60%~70%,各组织差异极大,更新快,包括DNA聚合酶、RNA聚合酶、高速泳动族蛋白(HMG蛋白)、染色体支架蛋白、肌动蛋白、转录因子等。

(2)结合特异性 以离子键、氢键结合于特定DNA序列的大沟。这些序列进化上具有保守性。相应的非组蛋白多可二聚化。

非组蛋白的结合特异性源于其含各种DNA结合域,如螺旋-转角-螺旋、锌指、亮氨酸拉链、螺旋-环-螺旋(第六章,150页)。

(3)功能多样性 虽然一个真核细胞中非组蛋白只有10000个分子,仅占细胞总蛋白的1/50000,但有多方面的功能,包括染色质组装、基因表达调控。

3.RNA 占染色体质量的1%~3%,含量最低,变化较大,可能通过与组蛋白、非组蛋白相互作用而调控基因表达。

(二)染色体结构

真核生物DNA在双螺旋的基础上经过多级压缩形成染色体结构(图1-7)。

img

图1-7 染色体形成模式

1.核小体 是染色体的基本结构单位,由组蛋白八聚体和180~200bp核小体DNA构成(表1-2)。

表1-2 不同生物核小体DNA长度

img

(1)两个H2A-H2B二聚体与一个(H3-H4)2四聚体构成组蛋白八聚体(histone octamer),又称核小体核心(nucleosome core)。

img

图1-8 串珠结构

(2)组蛋白八聚体被核心DNA(core DNA,145~147bp)以左手螺线管(solenoid)方式缠绕不到两圈,形成核小体核心颗粒(nucleosome core particle),直径约为10nm。

(3)核小体核心颗粒与连接DNA(15~60bp)构成核小体(nucleosome,人单倍体DNA与核心组蛋白形成1.7×107个核小体)。

(4)若干核小体形成直径约为10nm的串珠结构(又称10nm纤维,图1-8)。从DNA双螺旋到串珠结构,压缩比(packing ratio,又称包装比)是7。

2.30nm纤维 串珠结构经过螺旋化形成直径约为30nm、螺距约为12nm的螺线管,称为30nm纤维,其每一螺旋含6个核小体,且每个核小体需结合一分子H1(覆盖约20bp DNA。结合较弱,可在盐溶液中分离)构成染色质小体(chromatosome)。核心组蛋白N端、H1、高离子强度对螺线管的形成和稳定起重要作用。从串珠纤维到30nm纤维,压缩比是6。

30nm纤维进一步结合非组蛋白、少量RNA及与复制转录有关的酶类,形成染色质纤维(chromatin fiber)。

3.300nm纤维 在细胞分裂前期,染色质纤维进一步螺旋化形成直径约为300nm的超螺线管(supersolenoid)结构,称为300nm纤维染色线(chromonema)。从30nm纤维到300nm纤维,压缩比是40。

4.染色单体 300nm纤维凝缩成直径约为700nm的染色单体,压缩比是5。因此,细胞分裂中期染色单体的压缩比高达8000~10000;相比之下,在细胞分裂间期,染色质结构的压缩比仅为100~1000。

需要说明的是,①真核生物染色体结构尚未完全阐明,有多种模型,这里介绍的只是其中一种模型。②由于细胞内不断进行代谢,特别是基因表达及DNA复制,DNA的扭曲盘绕是一个动态过程,所以在不同时期及DNA的不同区段,其盘绕方式和盘绕程度都不相同。

(三)DNA三级结构的生理意义

DNA形成染色体结构有着重要的生理意义。

1.染色体是DNA适应细胞空间的压缩状态 DNA分子在长度上高度压缩,有利于组装。例如人体细胞核内有46条染色体,其DNA总长度1.7~2m,被压缩到约200μm(细胞核直径10~15μm),压缩了8000~10000倍。

成年人体约有1014个细胞,所含DNA总长度为2×1011 km。对比一下地球和太阳之间的距离(1.5×108 km)或可理解其压缩的意义。

2.DNA包装成染色体后不易受到损伤 相比之下裸DNA(naked DNA)容易受到损伤。

3.细胞分裂时染色体可有效地分配到子细胞中 避免形成非整倍体、异倍体。

4.染色体赋予DNA特定的空间结构 从而使其功能表达受到调控。

5.超螺旋结构影响DNA复制和转录 细胞核内DNA结构处于动态变化之中。超螺旋的改变可以协调DNA局部解链,影响复制和转录等的启动及进程。

五、染色体外DNA

真核细胞核之外还存在线粒体DNA、叶绿体DNA(植物),许多原核细胞及个别真核细胞还存在质粒,它们统称染色体外DNA。染色体外DNA与原核生物染色体DNA均为裸露结构,故统称基因带(genonema)。

(一)线粒体DNA

1894年,Altmann发现线粒体。1963年,Nass&Nass在鸡胚肝细胞中发现线粒体内含线粒体DNA(mtDNA),它所携带的遗传信息可以指导合成部分线粒体蛋白,因而属于细胞核外遗传系统。

一个细胞可以含成百上千个线粒体,一个线粒体含多个mtDNA拷贝,因此一个细胞含许多mtDNA拷贝,可达细胞总DNA的1%。mtDNA属于重复序列(25页)。

绝大多数mtDNA为闭环结构,一股链含较多的嘌呤碱基,浮力密度较高,称为H链(heavy chain,重链);另一股链含较多的嘧啶碱基,浮力密度较低,称为L链(light chain,轻链)。草履虫mtDNA虽为线性结构,但末端是发夹结构,因此没有游离单链末端。

人线粒体多数含2~10个mtDNA拷贝,位于线粒体基质的不同区域。每个拷贝含16569bp,几乎均为编码序列(基因间区累计仅87bp),编码2种rRNA(12S rRNA和16S rRNA)、22种tRNA(转运20种氨基酸,其中转运Leu和Ser的tRNA各有2种)和13种蛋白质(约占心肌615种线粒体蛋白的2%,分别是呼吸链复合物Ⅰ、Ⅲ、Ⅳ和ATP合成酶的7、1、3和2种肽链,每种约50AA)。人mtDNA于1981年完成序列分析。

(二)叶绿体DNA

1962年,Ris和Plant在衣藻叶绿体中发现DNA(292kb,是已知最大的叶绿体DNA。已知最小的是刺松藻叶绿体DNA,85kb)。叶绿体DNA(cpDNA)为共价闭合环状DNA,每个叶绿体约含12个cpDNA。1986年,Ohyama及Shinozaki领导的研究小组分别完成了地钱(Marchantia polymorpha)cpDNA(121024bp)和烟草(Nicotiana tabacum)cpDNA(155844bp)的序列分析。虽然两种cpDNA的长度不同,但其所含基因的种类甚至在cpDNA中的排列几乎一致,提示它们有共同的起源。地钱cpDNA含128个基因,编码4种rRNA(23S、16S、4.5S、5S)、31种tRNA及100多种叶绿体蛋白质(主要是光合系统成分)。叶绿体DNA在G1期复制,所需DNA聚合酶由染色体DNA编码,游离核糖体合成。

(三)附加体

附加体(episome)又称额外染色体(accessory chromosomes)、游离基因,是存在于细菌和某些真核细胞中的一类染色体外遗传物质,既能独立存在并自主复制,又能整合到染色体中,随染色体复制而复制,例如质粒和噬菌体。

质粒(plasmid)是游离于细菌(及个别低等真核细胞)染色体DNA之外、能自主复制的遗传物质,大多数是一种共价闭合环状DNA,大小为2~400kb。质粒含复制起点,能够转化细菌,利用其DNA复制系统,随着染色体DNA的复制而复制,或自主复制,并在细胞分裂时分配给子细胞。质粒在两方面不同于染色体DNA:①它们不是细菌生长所必需的,很多细菌没有质粒。②一个细胞通常含多个质粒拷贝。

一个细胞内所含某种质粒的数目,称为质粒拷贝数。质粒拷贝数由其复制类型决定,并据此分为两类:①严紧型质粒(stringent plasmid):其复制与宿主染色体同步,拷贝数较低,一个细胞内仅有1~3个,例如pSC101。②松弛型质粒(relaxed plasmid):其复制与宿主染色体不同步,可以自主复制,拷贝数较高,一个细胞内可有10~500个,例如ColE1。一种质粒是属于严紧型还是松弛型,常和宿主细胞(host cell,是指病毒、质粒或其他外源DNA转化并赖以复制或扩增的细胞)的代谢状况有关。例如,R质粒在大肠杆菌中属于严紧型,而在奇异变形杆菌(P.mirabilis)中属于松弛型。因此,质粒复制不仅由自身控制,还受宿主制约。

根据所携带基因功能的不同可将质粒分为R质粒(又称抗性质粒)、F质粒(又称性因子F因子、致育因子)、Col质粒(又称Col因子、大肠杆菌素生成因子)等。

质粒在重组DNA技术中用于构建载体。