本文将介绍
遗传密码
我们的基因是一本加密的书,载着生命的秘密。为了理解这些秘密信息,我们需要知道代码,并应用同样的规则,反过来,解码它。在这篇文章中,我们将进一步研究遗传密码,它允许DNA和RNA序列被“解码”为蛋白质的氨基酸。
我们的细胞如何制造蛋白质-转录和翻译
我们的基因在DNA中被写成核苷酸碱基对(A, T, G, C)。基因要发挥其功能,就必须读出基因信息来生成蛋白质。这个过程叫做基因表达.
从基因中合成蛋白质有两个步骤:
首先,在细胞核内,一种以按摩器rna(mrna),被称为转录.
第二,这些信使rna从细胞核外输出到细胞质核糖体制造多肽/蛋白质。这一步叫做翻译.
[在这幅图中]生物学的中心信条。
基因包含构建维持细胞活力的蛋白质的信息。这个构建过程分为两个步骤:转录和翻译。
从DNA到RNA的复制很简单:遵循互补碱基配对规则。在DNA中,有四种含氮碱基选项:腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C)和鸟嘌呤(G).每个碱基只能相互结合,A与T结合,C与g结合。这被称为DNA互补碱基配对规则。
将DNA转录成mRNA的规则是一样的。唯一的区别是尿嘧啶(U)G→C, A→U, T→A,在我们的细胞中,转录是由一种叫做RNA聚合酶它可以从DNA模板合成信使rna。
DNA到mRNA:利用互补碱基配对规则
知道了这条规则,你就可以只根据碱基对序列找出互补链与单个DNA链的关系。例如,假设你知道一条DNA链的序列如下:
DNA(编码链):5 ' -TTG ACG ACA AGC TGT TTC-3 '
利用互补碱基配对规则,可以得出互补链为:
DNA(模板链):3 ' -AAC TGC TGT TCG ACA AAG-5 '
RNA链也是互补的,除了RNA使用U而不是t。因此,你也可以推断出从第一个DNA链产生的mRNA链。它将是:
mRNA: 5 ' -UUG ACG ACA AGC UGU UUC-3 '
RNA到蛋白质:使用遗传密码子
虽然DNA(基因)和RNA(信使)使用类似的编码,由4个单元组成,但蛋白质的构造非常不同。蛋白质由20个单位组成氨基酸.将信使rna转化为蛋白质变得更加复杂。为了引导这种转化,细胞遵循遗传密码。根据遗传密码,遗传信息被组织在核苷酸的三联中,每三联被翻译成一个氨基酸。
例如,上面的mRNA会翻译成
蛋白质:Leu - Thr - Thr - Ser - Cys - Phe
基因表达的过程.从基因到蛋白质有两个步骤,转录和翻译。DNA需要通过互补碱基配对(即A对U;T与A配对;C与G配对;G与C配对)。接下来,mrna通过核孔输出到细胞质,被核糖体翻译成蛋白质。
注意:氨基酸的短链通常被称为“多肽”。当氨基酸的数量加起来(通常是> 30个单位),多肽链折叠成一个3D结构时,我们称之为“蛋白质”。
密码子有三个特征:
- 每个密码子指定一个氨基酸。密码子和氨基酸之间的全部关系被总结为一个密码子图或表。
- 一个“开始密码子(AUG)标志着蛋白质的开始。AUG编码一种叫做蛋氨酸的氨基酸。
- 三个“停止密码子标志着蛋白质的结束和翻译的结束。
谁能读懂这些代码?核糖体是解码机器
信使rna中的密码子被a核糖体在翻译。核糖体是由核糖体RNA (rRNA)和核糖体蛋白质组成的颗粒状细胞器。核糖体由两个主要成分组成:小核糖体亚基和大核糖体亚基。两个亚基之间tRNA的三个结合位点(A, P和E位点)。阅读更多关于核糖体.
(图中)核糖体。
核糖体就像解码机器一样将mRNA的编码序列翻译成蛋白质。科学家们喜欢称核糖体为分子微型机器,来欣赏核糖体的精巧设计!
转移RNA (tRNA)
的转移RNA (tRNA)是一种RNA分子。它的作用是携带与mRNA密码子匹配的氨基酸到核糖体。
tRNA的一边包含三个字母的密码,另一边携带特定的氨基酸。tRNA上的代码(称为反密码子)必须与核糖体中已经存在的mRNA上的三字母代码(密码子)匹配。tRNA所携带的特定氨基酸是由它所携带的三字母反密码子决定的。例如,如果mRNA上的三字母编码是AUG,那么携带Methionine (Met)的tRNA就会被选中并招募到核糖体中。这是翻译过程中必不可少的一部分,令人惊讶的是,“翻译错误”很少发生。
[在这张图中]tRNA上的反密码子UAG与mRNA上的AUG匹配(互补),并将正确的氨基酸(蛋氨酸)带到核糖体。
蛋白质的翻译从起始密码子开始(总是AUG→蛋氨酸),直到到达一个终止密码子(三个密码子中的任意一个:UAA、UAG或UGA)。mRNA密码子从5 '端读取到3 '端,其顺序指定了蛋白质中氨基酸从n端到c端的顺序。
[在这张图中]方向性:DNA和RNA从5 '端读取到3 '端。相反,蛋白质或多肽从n端(氨基)读取到c端(羧基)。翻译的开始和结束分别用Start和Stop密码子标记。
图片来源:可汗学院
氨基酸密码子图
密码子和氨基酸(或停止信号)之间的一整套关系被称为遗传密码.遗传密码通常被总结为密码子图(或密码子表),其中密码子被翻译成氨基酸。
[在这幅图中]密码子集也可以表示为密码子轮。
图片来源:维基
你怎么看密码子图?
密码子图一开始看起来很吓人。事实上,一旦你理解了它的规律,这一点也不难。
让我们以密码子ACU为例。如果你想知道ACU编码的是哪一种氨基酸,首先看一下表的左边。找到左边轴上的“A”,它指的是密码子三元组的第一个字母。所有以A开头的密码子都在这一行。
接下来,我们看一下表的顶部。这个上轴表示密码子三元组的第二个字母。一旦我们沿着上轴找到“C”,它告诉我们密码子将在哪个列中被找到。找到表中“A”行与“C”列的相交框。您将看到这个包含四个密码子的盒子,并很容易地找到您要找的那个。
在我们的例子中,ACU编码苏氨酸(或苏氨酸)。你可能还注意到,所有ACU, ACC, ACA和ACG编码相同的氨基酸。请注意,表中许多氨基酸由多个密码子表示。例如,在mRNA的语言中,有六种不同的“书写”Leucine的方式(看看你是否能找到全部六种)。
[在这幅图中]如何阅读氨基酸密码子图?
按照步骤1-3在表中查找密码子三元组。
在这个表中,您还可以看到UAA、UAG和UGA不编码任何氨基酸,这意味着它们是停止密码子。
[在这幅图中]对于密码子轮,规则是一样的:从中心开始找到三元组的第一个字母,然后向外围移动到2nd和3理查德·道金斯信件。
你和你的家人或教室可以玩“密码子宾果”来熟悉遗传密码。这是一个可下载的版本.
参考表:所有氨基酸密码子的摘要
氨基酸 | 密码子 |
苯丙氨酸(法) | 下面部分,UUC |
亮氨酸(亮氨酸) | Uua, uug, cuu, cuc, cua, cug |
蛋氨酸(Met) /开始密码子 | 8月 |
缬氨酸(Val) | 呱,呱,呱,呱 |
丝氨酸(Ser) | Ucu ucc uca ucg agu agc |
脯氨酸(Pro) | Ccu ccc cca CCG |
苏氨酸(刺) | Acu, acc, aca, acg |
丙氨酸(Ala) | Gcu, gcc, gca, GCG |
酪氨酸(酪氨酸) | UAU, UAC |
组氨酸(他的) | , CAC |
谷氨酰胺(Gln) | 创新艺人经纪公司,CAG |
天冬酰胺(Asn) | AAU, AAC格式 |
赖氨酸(赖氨酸) | AAA,亚美大陆煤层气有限公司 |
天冬氨酸(Asp) | 高斯,广汽 |
谷氨酸(Glu) | 棉酚,呕吐 |
半胱氨酸(半胱氨酸) | UGU, UGC |
色氨酸(Trp) | UGG |
精氨酸(Arg) | Cgu, cgc, cga, cgg, aga, agg |
甘氨酸(g) | Ggu, ggc, gga, GGG |
异亮氨酸(Ile) | Auu, auc, aua |
终止密码子 | Uaa, uag, uga |
氨基酸的分子结构
图片来源:维基
标准遗传密码
我们在这里提到的遗传密码是普遍的;除了少数例外,几乎所有物种(从细菌到人类)都使用同一套标准代码。一些纤毛虫,如草履虫bursaria,使用不同寻常的遗传密码。
另一个例外是线粒体DNA。线粒体有自己的DNA副本,以及一个独立的核糖体和trna系统。如果你不熟悉线粒体,点击这里了解更多关于线粒体的知识.
线粒体密码与标准遗传密码略有不同。此外,不同的物种有自己版本的线粒体编码。例如,我们(脊椎动物)的线粒体密码与酵母使用的不同。AGA和AGG编码标准遗传密码中的精氨酸(Arg)。然而,AGA和AGG在脊椎动物线粒体密码子中起终止密码子的作用。此外,UGA和AUA在线粒体中分别由停止密码子和异亮氨酸(Ile)转变为蛋氨酸(Met)和色氨酸(Trp)。
同样的情况也发生在植物的叶绿体和质体编码中。
密码子使用偏差
尽管大多数生物使用标准密码,但是,在选择使用哪种密码子方面,它们可能有自己的偏见。例如,烘焙酵母更喜欢使用UGU作为半胱氨酸。相反,在人类细胞中,我们更喜欢UGC。
密码子使用偏差可能是自然选择(tRNA丰度)的结果。为了在实验室中大量生产某些蛋白质,研究人员可能会进行“密码子优化”,以使他们的密码子更适合所需的表达宿主的方式重新合成基因(即在大肠杆菌。细菌)。
什么是阅读框架?
由于DNA序列是由三胞胎读取的,从哪个字母(或阅读框)成为一个关键问题。
让我们看一个例子。下面的信使rna可以被翻译成三种完全不同顺序的氨基酸,这取决于它被解读的框架。我们的细胞如何知道要合成哪一种蛋白质呢?
[在这幅图中]三种可能的阅读框架会导致完全不同的结果。
图片来源:可汗学院
我们的细胞使用一种非常聪明的策略来解决这个问题——“起始密码子”。因为翻译只从起始密码子(AUG)开始,并以三个连续的组继续,所以起始密码子的位置确保mRNA在正确的帧中被读取(在上面的例子中,第3帧)。
如果DNA序列被打乱了会发生什么-突变
突变(DNA序列的变化)可能会使遗传信息脱轨,导致细胞产生错误的蛋白质。基因突变是癌症和许多遗传疾病的主要原因。
即使是单个碱基对的改变(称为点突变)也会导致严重的后果。点突变有三种影响。
沉默突变
首先,碱替换可以是a沉默突变改变的密码子对应相同的氨基酸。例如,从UCU改为UCC没有任何影响,因为两个密码子都同样编码Serine (Ser)。
错义突变
第二,碱基替换可以是a错义突变改变的密码子对应不同的氨基酸。例如,从UCU变为UGU会使丝氨酸(Ser)变为半胱氨酸(Cys)。如果这种突变发生在蛋白质的关键区域(即酶的位点),点突变会打乱整个蛋白质的功能。
无义突变
第三,碱替换可以是a无义突变改变的密码子变成了停止信号。这是最糟糕的原因,因为转译会过早终止,导致蛋白质被截断。
[在这幅图中]说明错义突变和无意义突变后果的例子。
图片来源:国家卫生研究院
当核苷酸从原始DNA序列中插入或删除时,也可能发生突变。插入或删除“一或两个”核苷酸可改变阅读框(移码突变).移码可以完全打乱突变位点下游的氨基酸顺序。
[在这幅图中]展示移码突变结果的例子。
图片来源:openstax
基因密码是如何被发现的?
对遗传密码的认识是现代生物技术的基础。如果没有读取DNA信息的能力,许多令人兴奋的技术和疗法,包括个性化医疗、基因治疗、CRISPR基因编辑和重组蛋白药物,都将不复存在。
为了破解遗传密码,研究人员需要弄清楚DNA或RNA分子中的核苷酸序列是如何编码氨基酸序列的。在20世纪50年代中期,物理学家George Gamow预测,遗传密码很可能是由三联体核苷酸组成的——因为可能的二联体核苷酸组合不够(4×4 = 16),而四联体核苷酸组合太多(4x4x4x4 = 256),无法覆盖20种氨基酸。
美国生物化学家马歇尔·尼伦伯格(Marshall Nirenberg)于1961年开始进行精确定位基因密码的实际实验。尼伦伯格通过两项实验创新,将核苷酸三联体与特定氨基酸之间的关系联系起来:
- 他可以合成具有特定已知序列的人工信使rna分子。
- 他有一个将信使rna转化为细胞外多肽的系统(“无细胞”系统)。尼伦伯格是在一个试管的细胞质爆裂中做的实验大肠杆菌细菌,它包含了转化所需的所有成分。
尼伦伯格从一个只由核苷酸尿嘧啶(称为poly-U)组成的mRNA分子开始。当他将poly-U mRNA添加到无细胞系统中时,他发现合成的多肽只由氨基酸-苯丙氨酸(Phe)组成。尼伦伯格的结论是,UUU可能是苯丙氨酸的编码。用同样的方法,他发现了脯氨酸(Pro)的三重CCC编码。
图片来源:可汗学院
根据这个概念,生物化学家哈尔·戈宾德·霍拉纳(Har Gobind Khorana)扩展了尼伦伯格的实验,合成了具有更复杂序列的人造信使rna。到1965年,尼伦伯格、霍拉纳和他们的同事已经破译了整个遗传密码。
由于他们的贡献,尼伦伯格和霍拉纳(以及另一位基因密码研究员罗伯特·霍利)在1968年获得了诺贝尔生理学或医学奖。
[在这幅图中]1968年的诺贝尔生理学或医学奖被共同授予罗伯特·w·霍利、哈尔·戈宾德·霍拉纳和马歇尔·w·尼伦伯格,“以表彰他们对基因密码及其在蛋白质合成中的功能的解释。”
图片来源:诺贝尔奖
将DNA转化为蛋白质的网站工具
在我的研究中,我需要克隆一个特定的DNA用于蛋白质表达,我通常使用EMBL-EBI的EMBOSS Transeq.
第一步:粘贴一段DNA序列,你可以用他们的例子序列。
第二步:选择你想要使用的阅读框
步骤3:选择密码子。我通常使用标准代码。
第四步:点击提交
第五步:等待蛋白质序列结果!