一、基因的基本结构
真核生物的结构基因基本上由编码区和非编码区两部分组成,非编码区位于编码区的上游和下游,故又称侧翼序列。
(一)编码区
自起始密码至终止密码的一般DNA序列称为编码区。编码区含有若干段编码/顷序,是该基因表达为多肽链的部分,称为外显子。外显子是不连续的,其间有不编码的间隔顺序隔开,间隔顺序称为内含子。转录后的内含子顺序,在初级转录物加工时被切掉;因此,结构基因又称为不连续基因或断裂基因。如果一个结构基因含有n个内含子,那么,将含有n+1个外显子,但内含子的核苷酸的数量可比外耻·广名计:多倍,也有少数真核生物的结构基因没有内含子,如组蛋白基因、干扰素基因等。
每个外显子和内含子的接头区有一段高度保守的序列,即内含子5’端以GT开始,3’端以AG结束,这种结构称为GT—AG法则。转录后,GT、AG在hnRNA上的相应序列是RNA画按的识别信号,
(二)侧翼序列
侧翼序列包括前导区、尾部区、调控区,调控区又包括启动子、增强子、终止子等:
1、前导区和尾部区此二区被转录并参与成熟mRNA的组成,但不被翻译,前者位于转录起始点和第一外显子之间,相当于mRNA5’端的非翻译区(5’UT);后者位于最末外显子和终止子之间,相当于mRNA3’端非翻译区(3'UT)。前导区和尾部区转录后的相应序列在mRNA中起维持mRNA稳定性的作用。
2、启动子启动子是指能与RNA聚合酶结合的DNA序列,此序列能启动基因的转录,是RNA聚合酶识别转录起始部位的信号,目前已发现3种启动子序列,均位于转录起始点的上游,包括:TATA框(P1),位于转录起始点上游19-27bp处;CAAT框(P2)。位于转录起始点上游70—80bp处;GC框(P3),有2个拷贝,位于CAAT框的两侧。
3、增强子增强子指虽不能启动基因的转录,但有增强转录作用的DNA序列.增强子的位置不固定,可以是在转录起始点的上游,也可以是下游,甚至可以插在内含子中;增强子通常有组织特异性,可与不同组织的特异性因子结合,从而对基因表达因组织器官的不同而起不同的调节作用。
4、终止子终止子是尾部区和转录终止点间的一段特定序列,具有终止转录的功能。其共同结构特征是:
(1)AATAAA序列:是终止子的起始序列,称为mRNA裂解信号,其作用是指导核酸内切酶在信号下游10—15bp的特定位点上裂解mRNA。
(2)回文序列:是一段长约7-20个核苷酸对的反向重复顺序,也称为终止信号,是RNA聚合酶转录终止的信号,位于AATAAA的下游,其对称轴距转录终止点约16-24bp。
(3)A—T对序列:是自回文序列末端起至转录终止点的一段序列,有6-8个A—T对。回文序列和A—T对经转录后可形成发夹结构及与A互补的一串U,发夹结构的存在阻碍RNA聚合酶的移动,而A—U之间氢键结合较弱,故RNA/DNA杂交部分易于拆开,有利于转录物从DNA模板上释放出来。
二、简述基因的结构
基因结构结构基因的结构
人类结构基因4个区域:①编码区,包括外显子与内含子;②前导区,位于编码区上游,相当于RNA5’末端非编码区(非翻译区);③尾部区,位于RNA3’编码区下游,相当于末端非编码区(非翻译区);④调控区,包括启动子和增强子等。基因编码区的两侧也称为侧翼顺序(图1-1)。
1.外显子和内含子大多数真核生物的基因为不连续基因(interruptesd或discontinuous gene)。所谓不连续基因就是基因的编码顺序在DNA分子上是不连续的,被非编码顺序所隔开。编码的顺序称为外显子(exon),是一个基因表达为多肽链的部分;非编码顺序所称为内含子(intron),又称插入顺序(intervening sequence,IVS)。内含子只转录,在前mRNA(pre-mNRA)时被剪切掉。如果一个基因有几个内含子,一般总是把基因的外显子分隔成n+1部分。内含子的核苷酸数量可比外显子多许多倍。
2.外显子-内含子接头每个外显子和内含子接头区都有一段高度保守的一致顺序(consensus seqence),即内含了5’末端大多数是GT开始,3’末端大多是AG结束,称为GT-AG法则,是普遍存在于真核基因中RNA剪接的识别信号。
3.侧翼顺序在第一个外显子和最末一个外显子的外侧是一段不被翻译的非编码区,称为侧翼顺序(flanking sequence)。侧翼顺序含有基因调控顺序,对该基因的活性有重要影响。
4.启动子启动子(promoter)包括下列几种不同顺序,能促进转录过程:
(1)TATA框(TATA box):其一致顺序为TATAATAAT。它约在基因转录起始点上游约-30-50bp处,基本上由A-T碱基对组成,是决定基因转录始的选择,为RNA聚合酶的结合处之一,RNA聚合酶与TATA框牢固结合之后才能开始转录。]
(2)CAAT框(CAAT box):其一致顺序为GGGTCAATCT,是真核生物基因常有的调节区,位于转录起始点上游约-80-100bp处,可能也是RNA聚合酶的一个结合处,控制着转录起始的频率。
(3)GC框(GC box):有两个拷贝,位于CAAT框的两侧,由GGCGGG组成,是一个转录调节区,有激活转录的功能。
此外,RNA聚合酶Ⅲ负责转录tRNA的DNA和5SrDNA,其启动子位于转录的DNA顺序中,称为下游启动子。
5.增强子在真核基因转录起始点的上游或下游,一般都有增强子(enhancer),它不能启动一个基因的转录,但有增强转录的作用。此外,增强子顺序可与特异性细胞因子结合而促进转录的进行。研究表明,增强子通常有组织特异性,这是因为不同细胞核有不同的特异因子与增强子结合,从而对基因表达有组织、器官、时间不同的调节作用。
例如人类单拷贝胰岛素基因5’末端上游约250 bp处有一组织特异性增强子,在胰岛β细胞中有一特异因子可
图3-1真核生物的结构基因的结构示意图
En:增强子:P1、P2、P3:启动子(TATA框,CAAT框,GC框);E:外显子:I:内含子;
UT:非翻译区;GT-AG:外显子-内含子接头
作用于该区以增强胰岛素基因的转录和翻译,其它组织中无此因子,这是何以胰岛素基因只有在胰岛β细胞中才得以很好表达的原因。
6.终止子在一个基因的末端往往有一段特定顺序,它具有转录终止的功能,这段终止信号的顺序称为终止子(termianator)。终止子的共同顺序特征是在转录终止点之前有一段回文顺序,约7-20核苷酸对。回文顺序的两个重复部分分由几个不重复碱基对的不重复节段隔开,回文顺序的对称轴一般距转录终止点16-24bp(图3-2)。
三、基因的结构是什么
基因是具有遗传效应的DNA片段。因此,其结构的基本组成单位与DNA一致,均为4种脱氧核糖核苷酸。当然,其遗传信息就是指4种脱氧核糖核苷酸的排列顺序了(或者说是碱基的排列顺序)
四、结构基因由什么组成
结构基因基本上由编码区和非编码区(侧翼序列)两部分组成。具体如下:
1、编码区
编码区是指起始密码到终止密码的一般DNA序列。里面含有若干段编码/顷序,是该基因表达为多肽链的部分,为外显子。外显子是不连续的,其间有不编码的间隔顺序隔开,间隔顺序为内含子。
2、非编码区(侧翼序列)
包括前导区、尾部区、调控区部分。其中,前导区和尾部区都被转录并参与成熟mRNA的组成,但不被翻译,转录后的相应序列在mRNA中起维持mRNA稳定性的作用。
调控区又包括启动子、增强子、终止子等。启动子是能与RNA聚合酶结合的DNA序列,此序列能启动基因的转录;增强子是虽不能启动基因的转录,有增强转录作用的DNA序列;终止子是尾部区和转录终止点间的一段特定序列,具有终止转录的功能。
扩展资料:
大肠杆菌乳糖代谢的基因调节系统中,有3个连锁在一起的结构基因:
1、LacY基因:决定β-半乳糖苷透性酶的合成。该酶的作用为使乳糖易于进入E.coli的细胞中。
2、LacZ基因:决定β-半乳糖苷酶的形成。而β-半乳糖苷酶将乳糖水解成葡萄糖和半乳糖,作为细菌代谢活动的碳源。
3、LacA基因:编码β-半乳糖苷乙酰基转移酶。
参考资料来源:百度百科-结构基因