Información

¿Por qué hay codones de inicio y de parada?

¿Por qué hay codones de inicio y de parada?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Según mi comprensión de wikipedia, existe el codón de inicio (ARN) AUG y los codones de parada UAA, UGA, UAG. AUG también puede codificar metionina, supongo que si aparece en medio de una secuencia de ARNm.

Pero, ¿existe una razón química por la que existen codones de inicio y de terminación? Por ejemplo, si solo tuviera un codón de terminación, ¿eso también implicaría que se inició el siguiente codón? ¿Hay casos en los que hay un codón de parada y el siguiente codón no comienza?


Los codones de inicio y parada son instrucciones para que el ribosoma inicie y detenga la síntesis de proteínas, respectivamente.

La región entre el codón de inicio y finalización (incluidos ellos) se denomina ORF (marco de lectura abierto) o, a veces, CDS (secuencia de codificación).

¿Por qué el ribosoma necesita instrucciones explícitas para iniciar y detener?

El ribosoma reconoce un ARN como un ARNm si tiene ciertas características. En las bacterias y otros procariotas hay una región en el ARNm llamada sitio de unión al ribosoma (RBS) que ayuda en el reclutamiento inicial del ribosoma. En eucariotas existen secuencias de consenso de Kozak que ayudan en la identificación de un sitio de inicio. Cuando el ribosoma encuentra unAGOcodón, entonces tienen lugar las reacciones de iniciación (hay algunas proteínas llamadas factores de iniciación que ayudan en este proceso). El ribosoma simplemente sigue moviéndose a lo largo del ARNm y produciendo un polipéptido a menos que encuentre un codón de terminación. Cuando lo hace, entran en juego otras proteínas llamadas factores de liberación y desalojan el ribosoma del ARNm.

Que tal un segundoAGOcodón?

Si el ribosoma encuentra otroAGOcodón después del inicio, entonces lo consideraría como un codón de metionina. Sin embargo, hay situaciones en las que el segundoAGOpuede actuar como un sitio de inicio alternativo. Puede ver este documento para obtener más detalles.

¿Por qué es esencial el codón de parada?

Puede imaginar una situación en la que el ribosoma simplemente llega hasta el final del ARNm, ¿por qué detenerlo? La razón de esto es que el extremo 3 'del ARNm suele tener regiones reguladoras y, lo que es más importante, colas poli-A (en eucariotas) que no deben traducirse. Además, el codón de parada también indica al ribosoma que se desprenda del ARNm. Si tales procesos no existieran, el ribosoma permanecerá unido al ARN.

Si solo tuviera un codón de terminación, ¿eso también implicaría que se inició el siguiente codón?

No. Porque el codón de parada funciona solo cuando la traducción ya ha comenzado. Sin embargo, no es esencial que el codón de terminación deba ir seguido del 3'UTR. Por lo general, en las bacterias, un solo ARNm codifica múltiples proteínas. Hay muchos ORF alineados uno tras otro; tales ARNm se denominan ARNm policistrónicos. En estos casos, hay otro codón de inicio a poca distancia de un codón de terminación anterior.


No todo el ARN debe traducirse en proteínas. En realidad, la mayor parte está destinada a la regulación y, a veces, a un uso desconocido. Hay regiones no codificantes antes del codón de inicio y después del codón de terminación. De ahí la necesidad de ambos.


Es importante tener codones de inicio y finalización para que la maquinaria molecular de la célula (ribosoma, etc.) "sepa" dónde comienza y termina la transcripción real. Esto es especialmente importante, ya que el ARNm maduro contiene regiones no traducidas que son de importancia reguladora. Estas regiones ocurren en ambos lados de la secuencia de codificación llamada 5 'y 3' UTR (región no traducida), luego también tiene la región CAP y la cola poli-A, vea la ilustración a continuación (desde aquí):

Solo desea que la secuencia de codificación entre el inicio y el final se traduzca en una proteína y para reconocer estos bordes necesita un marcador específico. Detrás del codón de terminación hay una secuencia no traducida, no directamente el siguiente gen.

Además, existe una gran cantidad de especies de ARN no codificantes, como miARN, ARNip, ARNl, etc., que cumplen propósitos regulatorios, juegan un papel en el empalme, la replicación, etc. ribosomas y también costaría inmensas cantidades de energía) ya que no darían proteínas útiles.


Además de ayudar a definir la región para la traducción en el ARNm, el codón de parada también evita que las transcripciones que han sido modificadas por una mutación se traduzcan en proteínas grandes, y también ayuda a marcar el ARNm para su destrucción (desintegración del ARN mediada sin sentido). Esto se debe a que, en una secuencia aleatoria, un codón tiene 3/64 de posibilidades de ser un codón de terminación, por lo que en una secuencia de gen con desplazamiento de marco de repente hay muchos. El codón de terminación prematuro terminará prematuramente la primera ronda de traducción, pero si todavía está presente alguna maquinaria para el empalme del ARNm (no está en el codón de terminación normal), el ARNm se destruirá para que no pueda generar proteínas mutadas adicionales. .


¿Cuáles son los dos aminoácidos raros?

La mayoría de las personas saben muy bien que hay 20 aminoácidos que forman nuestras proteínas, pero ¿y si les dijera que en realidad es falso y, de hecho, hay algunos aminoácidos adicionales de los que rara vez hablamos?

Los aminoácidos comunes (Crédito de la foto: Cristian Victor Rete / Shutterstock)

Un total de 22 aminoácidos han sido definidos en nuestro ADN. La selenocisteína (Sec) y la pirrolisina (Pyl) son los aminoácidos 21 y 22, respectivamente. Se les conoce como aminoácidos raros, ya que no son tan frecuentes en la naturaleza como el resto de los aminoácidos.


¿Por qué hay solo 1 codón de inicio pero 3 codones de terminación?

No puedo hablar de la evolución o utilidad de por qué este o aquel codón es lo que es, pero solo quería señalar que, si bien AUG es el codón de inicio canónico, no es el único. Hay un par de codones de inicio alternativos que son básicamente sustitutos de una base del triplete de metionina habitual. Consulte wikipedia o este ejemplo aleatorio de la literatura.

Además de esto, existe un fenómeno recientemente descubierto llamado traducción repetida asociada no iniciada por ATG o traducción RAN que se produce sin la presencia de un codón de inicio en absoluto. El mecanismo se desconoce actualmente, pero sabemos que parece ser un fenómeno común en varios trastornos de expansión repetida, como las ataxias espinocerebelosas y las distrofias miotónicas. En la ELA / FTD relacionada con C9orf72, la expansión de hexanucleótidos sufre una traducción de RAN que conduce a una acumulación de agregados de dipéptidos que se supone que desempeñan un papel en la patogénesis de la enfermedad.

Estoy en mi último año como estudiante de bio, así que no estoy tan bien calificado (ni siquiera calificado en absoluto) para hablar de esto tanto como las personas con títulos avanzados. Por lo que puedo decir, la razón por la que tenemos codones adicionales es porque la ventaja de evitar la lectura durante la traducción es mayor que la desventaja de causar una terminación anticipada. Ambas proteínas son (probablemente) no funcionales en ambos casos. La energía se ahorra al no seguir añadiendo cada vez más aminoácidos. Lo que supongo que podría ser un desperdicio. Especialmente si el proceso se llevó a cabo a través de la región no codificada 3 & # x27 y dentro de la cola poli-a. Lisina por díasss. Estoy seguro de que me equivoqué aquí en alguna parte, pero pensé que solo le daría una oportunidad a la pregunta.


Codón de inicio

Iniciar Codon Definición
los codón de inicio es la señal de inicio para la traducción que se encuentra en una cadena de ARN mensajero (ARNm).

codón de inicio: el AUG (o, raramente, GUG) en un ARNm a partir del cual comienza la traducción siempre especifica metionina
ARNt: transfiere ARN una molécula de ARN que contiene una secuencia de anticodón de tres nucleótidos específica para emparejarse con el codón de ARNm y también se une a un aminoácido específico
Capítulo previo) .

codón de inicio El codón (AUG) de una molécula de ARN mensajero donde comienza la síntesis de proteínas.
steinkerns Moldes internos de un fósil. Steinkerns puede revelar la anatomía interna de un organismo, como la unión de los músculos y otros detalles de la estructura de los tejidos blandos. .

. Un codón de ARNm, generalmente AUG, en el que comienza la síntesis de polipéptidos.
Estereotipia. Actos de comportamiento repetitivos y sin propósito.
Existencias. Línea de ratones consanguíneos o aleatorios. Genéticamente heterogéneo.

Los s en diferentes marcos de lectura generan diferentes polipéptidos a partir de la misma secuencia de ADN.

s
Veamos qué más podemos encontrar en esta tabla de codones. Es posible que haya notado que hay 3 codones que no especifican un aminoácido. Estos codones son UAA, UAG y UGA. En lugar de codificar aminoácidos, estos codones son en realidad señales de terminación que se encuentran al final de un gen.

", y tres" codones de parada "indican el comienzo y el final de la región codificante de la proteína.

en ADN complementario a AUG?
Una secuencia de ADN es leída por una máquina de secuenciación.
Imagen cortesía de CDC / James Gathany.

Comienza con el ARNt que contiene el anticodón correspondiente para el

Unión de AUG a la subunidad pequeña del ribosoma. Este ARNt transporta el aminoácido metionina y es siempre el primer ARNt que se une al sitio P. La pequeña subunidad del ribosoma luego se une al extremo 5 'del ARNm.

La traducción comienza con un codón de iniciación de cadena (

). A diferencia de los codones de terminación, el codón solo no es suficiente para comenzar el proceso. También se requieren secuencias cercanas (como la secuencia de Shine-Dalgarno en E. coli) y factores de iniciación para iniciar la traducción.

La traducción comienza con un codón de iniciación de cadena o

. A diferencia de los codones de terminación, el codón solo no es suficiente para comenzar el proceso. También se requieren secuencias cercanas como la secuencia de Shine-Dalgarno en E. coli y factores de iniciación para iniciar la traducción.

Aquí hay una secuencia de codones caa, guc, cga, aau ahora estos corchetes indican el comienzo y el final de a de cada codón que fue configurado para el ribosoma por el

Los elementos importantes son promotor, parada y

, sitios de unión para ribosoma, región ORI y marcadores de selección apropiados. Algunos ejemplos de vectores como adenovirales, PSV y pCMV se utilizan generalmente para la expresión en células de mamíferos.

ATG con bastante frecuencia. [Hay] tres marcos de lectura diferentes en los que podría comenzar, voy a encontrar [un ATG] en promedio una vez cada 21 bases más o menos.

En la Figura 3, ambas subunidades ribosómicas (pequeñas y grandes) se ensamblan en el

El comienzo de una secuencia de aminoácidos se especifica mediante un

ubicado en algún lugar de la secuencia de ARNm, generalmente es un AUG, pero también puede ser un GUG. El final de una secuencia se especifica mediante uno de los tres codones de terminación: UAA, UAG o UGA.

y un codón de terminación que
se transcribe en una transcripción primaria de un gen.
Transformación: un cambio hereditario permanente en una célula que resulta de la captación y
incorporación de ADN "extraño" en el genoma de la célula huésped.

Primero, una pequeña subunidad ribosómica se une con el ARNm y un ARNt iniciador especial, que transporta metionina y se adhiere al

, AUG, que indica el inicio de la traducción.

En las células procariotas, existe una secuencia llamada secuencia Shine-Dalgarno (en general AGGAGG) en la posición antes de la

AUG y los otros codones AUG del ARN.

cds El cds es la parte traducida del gen de

para detener el codón y excluir los intrones.
químicos Términos que describen sustancias obtenidas mediante un proceso químico o utilizadas para producir un efecto químico.

La secuencia de tripletes de nucleótidos (codones) que se ejecuta a partir de una traducción específica.

en un ARNm a un codón de terminación. Algunos ARNm se pueden traducir en diferentes polipéptidos leyendo en dos marcos de lectura diferentes. (Figura 4-21)
Glosario completo.

Codón de inicio (iniciación)
El codón del ARNm donde se inicia la síntesis de polipéptidos. Los más comunes

Términos relacionados: codón ambiguo,

, codón de parada.
Sinónimo: triplete de codificación.
Compárese: anticodón.
Ver también: pirimidina, purina.

secuencia líder Un segmento en el extremo 5 'de un ARNm. Precede al

y contiene el sitio de unión al ribosoma y, normalmente, secuencias reguladoras tales como una región atenuadora.

Y hay un codón especial llamado

, que es un ATG, que comienza cada proteína. Y luego, al final de las proteínas, tenemos un codón especial llamado codones de terminación.

Regiones de secuencias de ADN / ARN que codifican proteínas. Por lo general, comienza con un

(ATG) y termina con un codón de terminación.
Relacionado
ORF.

El vector lleva un promotor (normalmente inducible) en un lado del sitio de clonación y un terminador de la transcripción en el otro lado. Estos deben ser reconocibles por la célula huésped deseada. El vector también puede llevar una secuencia de unión al ribosoma (para la expresión bacteriana) y un

"Durante el transcurso de la ejecución, el GA puede aumentar la longitud efectiva de su genoma mediante la introducción de nuevos

s en diferentes marcos de lectura. Al final de la serie, "la cantidad de superposición es bastante alta. Muchos bits participan en varios (y a menudo en los cinco) genes".

Hay tres formas diferentes de hacer esto (comenzando, por ejemplo, con cualquiera de las tres bases sucesivas), solo una de las cuales es la que conduce a la producción correcta de una proteína. La forma correcta de mirar es el marco de lectura. Un marco de lectura abierto es un marco de lectura completo que especifica proteínas, con un


Todos menos dos de los aminoácidos (Met y Trp) pueden estar codificados por 2 a 6 codones diferentes. Sin embargo, el genoma de la mayoría de los organismos revela que se prefieren ciertos codones sobre otros. En los seres humanos, por ejemplo, la alanina es codificada por GCC cuatro veces más a menudo que por GCG. Esto probablemente refleja una mayor eficiencia de traducción por parte del aparato de traducción (por ejemplo, ribosomas) para ciertos codones sobre sus sinónimos. [Más]

Genes mitocondriales

La razón: estas mitocondrias usan UGA para codificar triptófano (Trp) en lugar de como terminador de cadena. Cuando se traduce mediante maquinaria citosólica, la síntesis se detiene donde debería haberse insertado Trp.

  • las mitocondrias animales usan AUA para metionina, no isoleucina y
  • todas las mitocondrias de vertebrados utilizan AGA y AGG como terminadores de cadena.
  • Las mitocondrias de levadura asignan todos los codones que comienzan con CU a treonina en lugar de leucina (que todavía está codificada por UUA y UUG como lo está en el ARNm citosólico).

Genes nucleares

Se han encontrado algunos eucariotas unicelulares, especialmente entre los ciliados, que usan uno o dos o incluso los tres de sus codones STOP para aminoácidos. Solo aquellos codones de STOP que se encuentran cerca de la terminación de la cadena de activación de la cola poli (A).


Mutación por deleción

Cuando se eliminan una o más bases en el ADN, se produce una mutación por deleción. Por ejemplo, AUGGRAMOGACGA se convierte en AUGGACGA. La base G se elimina del medio.

Mutación de inserción

Esto es lo opuesto a la eliminación. En este tipo de mutación, se agrega una base a la secuencia. Al igual que. AUGACGAGA se convierte en AUGAACGAGA. La A se agrega en el medio de la secuencia.

Mutación por duplicación

Esto es algo similar a la mutación por inserción. Una parte de la secuencia del gen se duplica y se copia varias veces en la secuencia.

AGCGGACGA se convierte en AGCGGAGGAGGAGGACGA.

La longitud de la secuencia duplicada puede variar de un solo codón a múltiples codones.

Mutación de sustitución

En este tipo, un solo par de bases se sustituye por otro. Por ejemplo, ACAGCCAGC se convierte en ACAGGRAMOCAGC & ndash, la C se sustituye por una G.

El código genético (Crédito de la foto: Wikimedia Commons)

Mutación de inversión

A veces, una parte de la hebra de ADN puede desprenderse del medio. Este segmento, antes de volver a unirse a la hebra principal, a veces gira 180 & grados antes de volver a colocarlo. Esto se conoce como mutación de inversión. Si bien no hay pérdida ni adición de bases, el orden cambia, lo que puede provocar un cambio significativo en la proteína que codifica.

Mutación con desplazamiento de la pauta de lectura

Dejemos que & rsquos tome un ejemplo sencillo para entender esto. Considere la mutación de deleción de la que hablamos anteriormente en la que AUGGRAMOGACGA se convierte en AUGGACGA. Ahora veamos & rsquos cómo se leerán estos de acuerdo con el código genético.

AGO GRAMOGA CGA en lugar de AUG GAC GA

Como es visible, la eliminación de una base diminuta ha llevado a que toda la hebra de ADN se lea incorrectamente debido al marco de lectura. Esto significa que, aunque el resto del capítulo sea correcto, se leerá incorrectamente. A esto se le llama mutación de cambio de marco. Un pequeño cambio en la cadena de ADN conduce a una mala lectura de una porción más grande, debido al marco de lectura.

La eliminación, inserción y duplicación conducen a este tipo de mutaciones de desplazamiento de marco.


El mecanismo de síntesis de proteínas

Al igual que con la síntesis de ARNm, la síntesis de proteínas se puede dividir en tres fases: iniciación, alargamiento y terminación. El proceso de traducción es similar en bacterias, arqueas y eucariotas.

Iniciación a la traducción

En general, la síntesis de proteínas comienza con la formación de un complejo de iniciación. La pequeña subunidad ribosómica se unirá al ARNm en el sitio de unión ribosomal. Poco después, la metionina-tRNA se unirá al codón de inicio AUG (a través de la unión complementaria con su anticodón). Luego, este complejo se une a una gran subunidad ribosómica. Este complejo de iniciación luego recluta el segundo ARNt y así comienza la traducción.

La traducción comienza cuando un anticodón de ARNt reconoce un codón en el ARNm. La subunidad ribosómica grande se une a la subunidad pequeña y se recluta un segundo ARNt. A medida que el ARNm se mueve en relación con el ribosoma, se forma la cadena polipeptídica. La entrada de un factor de liberación en el sitio A finaliza la traducción y los componentes se disocian.

Iniciación bacteriana vs eucariota

La síntesis de proteínas comienza en un codón AUG (met), pero las proteínas pueden tener muchas metioninas y los ARNm pueden tener muchos AUG. ¿Cómo sabe el ribosoma por dónde empezar?

En el ARNm prokayrótico, una secuencia cadena arriba del primer codón AUG, llamada Secuencia Shine-Dalgarno (AGGAGG), pares de bases con una molécula de ARNr dentro de la subunidad pequeña de los ribosomas bacterianos y arqueales. Esta interacción ancla la subunidad ribosómica 30S en una ubicación precisa en la plantilla de ARNm. Deténgase un momento para apreciar la repetición de un mecanismo con el que se ha encontrado antes. En este caso, lograr que un complejo de proteínas se asocie, en el registro adecuado, con un polímero de ácido nucleico se logra alineando dos hebras antiparalelas de nucleótidos complementarios entre sí. Esto es bastante diferente del reconocimiento de un promotor por el complejo de ARN polimerasa, que requiere que un proteína, no un ácido nucleico, se unen a un particular secuencia de ADN de doble hebra. Sin embargo, hemos visto la alineación a través del emparejamiento de bases de un complejo proteína / ARN con una secuencia de ADN monocatenario antes, cuando hablamos de la telomerasa.

En lugar de unirse a la secuencia de Shine-Dalgarno, el complejo de iniciación eucariota (varias proteínas además de la subunidad pequeña) reconoce la tapa de 7-metilguanosina en el extremo 5 'del ARNm. Una vez en el casquete, el complejo de iniciación sigue el ARNm en la dirección 5 'a 3', buscando el codón de inicio AUG. Muchos ARNm eucariotas se traducen del primer AUG, pero no siempre es así. Los nucleótidos alrededor del AUG afectan la probabilidad de que se elija como codón de inicio, y la secuencia de consenso varía entre especies. Las proteínas auxiliares del complejo de iniciación se caen una vez que se carga la subunidad grande.

Tenga en cuenta que en ambos casos la selección de un AUG establece el marco de lectura (uno de los 3 posibles) para la proteína completa. Una diferencia muy importante entre estos modos de selección del sitio de inicio es que una sola transcripción procariota puede codificar potencialmente varias proteínas secuenciales, ya que el ribosoma puede escanear toda la longitud del mensaje en busca de secuencias de Shine-Dagarno. A menudo, las diversas proteínas involucradas en un solo proceso (subunidades de una holoenzima o pasos secuenciales en una vía metabólica) se codifican en un solo mensaje. Por el contrario, en los genes nucleares eucariotas, cada transcripción solo codifica una única proteína (como siempre, hay excepciones).

Alargamiento de traslación

Durante el alargamiento de la traducción, la plantilla de ARNm proporciona especificidad. A medida que el ribosoma se mueve a lo largo del ARNm, cada codón de ARNm aparece "a la vista" y se asegura la unión específica con el correspondiente anticodón de ARNt cargado. Si el ARNm no estuviera presente en el complejo de elongación, el ribosoma se uniría inespecíficamente a los ARNt. Nótese nuevamente el uso del emparejamiento de bases entre dos hebras antiparalelas de nucleótidos complementarios para traer y mantener nuestra máquina molecular en registro y, en este caso, también para realizar el trabajo de "traducir" entre el lenguaje de nucleótidos y aminoácidos.

La subunidad ribosómica grande consta de tres compartimentos: el sitio A se une a los ARNt cargados entrantes (ARNt con sus aminoácidos específicos adjuntos), el sitio P se une a los ARNt cargados que llevan aminoácidos que han formado enlaces con la cadena polipeptídica en crecimiento pero que aún no se han disociado de ella. su correspondiente ARNt, y el sitio E que libera ARNt disociados para que puedan recargarse con otro aminoácido libre.

La elongación procede con los ARNt cargados que entran en el sitio A y luego se desplazan al sitio P seguido del sitio E con cada codón único & ldquostep & rdquo del ribosoma. Describiremos este proceso aquí, pero le recomendamos encarecidamente que vea cualquiera de las muchas versiones animadas de este proceso, en particular las que son irrealmente lentas, como esta. Los pasos ribosomales son inducidos por cambios conformacionales que hacen avanzar el ribosoma por tres bases en la dirección 3 '. La energía para cada paso del ribosoma es donada por un factor de elongación que hidroliza el GTP. Los enlaces peptídicos se forman entre el grupo amino del aminoácido unido al ARNt del sitio A y el grupo carboxilo del aminoácido unido al ARNt del sitio P. La formación de cada enlace peptídico es catalizada por peptidil transferasa, un ARN catalítico (¡sorpresa! No es una proteína) que está integrado en la subunidad ribosómica 50S. La energía para la formación de cada enlace peptídico se deriva de la hidrólisis de GTP, que es catalizada por un factor de elongación separado. El aminoácido unido al ARNt del sitio P está unido a la cadena polipeptídica en crecimiento. A medida que el ribosoma atraviesa el ARNm, el ARNt del sitio P anterior ingresa al sitio E, se desprende del aminoácido y es expulsado (será recargado por ARNt sintetasa más adelante). El ribosoma se mueve a lo largo del ARNm, un codón a la vez, catalizando cada proceso que ocurre en los tres sitios. Con cada paso, un tRNA cargado entra en el complejo, el polipéptido se vuelve un aminoácido más largo y un tRNA no cargado sale. Este proceso ocurre sorprendentemente rápido en la célula, el E. coli El aparato de traducción toma solo 0.05 segundos para agregar cada aminoácido, lo que significa que un polipéptido de 200 aminoácidos podría traducirse en solo 10 segundos. Esto es particularmente sorprendente en el sentido de que los ARNt cargados deben difundirse al sitio A de forma aleatoria, ¡y el ribosoma tiene que esperar a que llegue el ARNt correcto!

Esta velocidad también plantea la pregunta (quizás infantil) de: en una carrera, ¿quién ganaría: la ARN polimerasa o el ribosoma? La respuesta es que ambas máquinas se mueven aproximadamente a la misma velocidad: alrededor de 60 nt / seg.

Muchos antibióticos inhiben la síntesis de proteínas bacterianas. Por ejemplo, la tetraciclina bloquea el sitio A en el ribosoma bacteriano y el cloranfenicol bloquea la transferencia de peptidilo. ¿Qué efecto específico esperaría que tenga cada uno de estos antibióticos en la síntesis de proteínas?

El código genético

Para resumir lo que sabemos hasta este punto, el proceso celular de transcripción genera ARN mensajero (ARNm), una copia molecular móvil de uno o más genes con un alfabeto de A, C, G y uracilo (U). La traducción de la plantilla de ARNm convierte la información genética basada en nucleótidos en un producto proteico. Las secuencias de proteínas constan de 20 aminoácidos que ocurren comúnmente, por lo tanto, se puede decir que el alfabeto de proteínas consta de 20 letras. Cada aminoácido está definido por una secuencia de tres nucleótidos llamada triplete. codón. La relación entre un codón de nucleótido y su correspondiente aminoácido se llama codigo genetico. Dados los diferentes números de "letras" en los alfabetos de ARNm y proteínas, "y" significa que hay un total de 64 (4 y 4 y 4) codones posibles, por lo tanto, un aminoácido dado (20 en total) debe estar codificado por más de un codón .

Tres de los 64 codones terminan la síntesis de proteínas y liberan el polipéptido de la maquinaria de traducción. Estos trillizos se llaman codones de parada. Otro codón, AUG, también tiene una función especial. Además de especificar el aminoácido metionina, también sirve como codón de inicio para iniciar la traducción. El marco de lectura para la traducción lo establece el codón de inicio AUG cerca del extremo 5 'del ARNm. El código genético es universal. Con unas pocas excepciones, prácticamente todas las especies utilizan el mismo código genético para la síntesis de proteínas, lo que es una prueba poderosa de que toda la vida en la Tierra comparte un origen común.

Esta figura muestra el código genético para traducir cada triplete de nucleótidos, o codón, en el ARNm en un aminoácido o una señal de terminación en una proteína naciente. (crédito: modificación del trabajo por NIH)

Redundante, no ambiguo

La información del código genético es redundante. Múltiples codones codifican el mismo aminoácido. Por ejemplo, usando el cuadro anterior, puede encontrar 4 codones diferentes que codifican para Valina, de la misma manera, hay dos codones que codifican para Leucina, etc. Pero el código no es ambiguo, lo que significa que si le dieran un codón, lo haría Si sabe definitivamente qué aminoácido está codificando, un codón solo codificará un aminoácido específico. Por ejemplo, GUU siempre codificará para valina y AUG siempre codificará para metionina.

Terminación de la traducción

La terminación de la traducción ocurre cuando se encuentra un codón de terminación (UAA, UAG o UGA). Cuando el ribosoma encuentra el codón de terminación, ningún ARNt entra en el sitio A. En cambio, una proteína conocida como factor de liberación se une al complejo. Esta interacción desestabiliza la maquinaria de traducción, provocando la liberación del polipéptido y la disociación de las subunidades ribosómicas del ARNm. Una vez que muchos ribosomas han completado la traducción, el ARNm se degrada para que los nucleótidos puedan reutilizarse en otra reacción de transcripción.

¿Cuáles son los beneficios y las desventajas de traducir un solo ARNm varias veces?

Acoplamiento entre transcripción y traducción

Como se discutió anteriormente, las bacterias y las arqueas no necesitan transportar sus transcripciones de ARN entre un núcleo encerrado en una membrana y el citoplasma. Por lo tanto, su ARN polimerasa transcribe ARN directamente al citoplasma. Aquí, los ribosomas pueden unirse al ARN y comenzar el proceso de traducción, en algunos casos mientras la transcipción aún se está produciendo. El acoplamiento de estos dos procesos, e incluso la degradación del ARNm, se facilita no solo porque la transcripción y la traducción ocurren en el mismo compartimento, sino también porque ambos procesos suceder en la misma dirección - la transcripción de ARN se sintetiza de 5 'a 3' y la transcripción se traduce de 5 'a 3'. Este "acoplamiento" de la transcripción con la traducción se produce tanto en bacterias como en arqueas y, en algunos casos, es esencial para la expresión génica adecuada.

Varias polimerasas pueden transcribir un solo gen bacteriano, mientras que numerosos ribosomas traducen simultáneamente las transcripciones de ARNm en polipéptidos. De esta manera, una proteína específica puede rápidamente, en minutos, alcanzar una alta concentración en la célula bacteriana.

Localización de proteínas (una introducción rápida)

En el contexto de un desafío de diseño de síntesis de proteínas, también podemos plantear la pregunta / problema de cómo las proteínas llegan a donde se supone que deben ir. Sabemos que algunas proteínas están destinadas a la membrana plasmática, otras en las células eucariotas deben dirigirse a varios orgánulos, algunas proteínas, como las hormonas o las proteínas captadoras de nutrientes, están destinadas a ser secretadas por las células, mientras que otras pueden necesitar ser dirigidas a partes. del citosol para cumplir funciones estructurales. ¿Como sucedió esto?

Dado que se han descubierto varios mecanismos, los detalles de este proceso no se resumen fácilmente en uno o dos breves párrafos. Sin embargo, se pueden mencionar algunos elementos comunes clave de todos los mecanismos. En primer lugar, está la necesidad de una etiqueta específica que pueda proporcionar alguna información molecular sobre el destino de la proteína de interés. Esta etiqueta generalmente toma la forma de una cadena corta de aminoácidos, un llamado péptido señal, que puede codificar información sobre dónde se pretende que termine la proteína. El segundo componente requerido de la maquinaria de clasificación de proteínas debe ser un sistema para leer y clasificar las proteínas. En los sistemas bacterianos y arqueales, esto generalmente consiste en proteínas que pueden identificar el péptido señal durante la traducción, unirse a él y dirigir la síntesis de la proteína naciente a la membrana plasmática. En los sistemas eucariotas, la localización es necesariamente más compleja. Podría clasificarse ampliamente en procesos que requieren el sistema de endomembranas y el transporte mediado por vesículas, y sistemas de localización que simplemente dependen de la difusión. Ambos sistemas se basan en el reconocimiento de varios péptidos señal codificados en la proteína. En la localización basada en endomembranas, estas señales ocurren muy cerca del extremo N-terminal (el comienzo) de la proteína, ya que actúan para bloquear la síntesis adicional bajo la proteína naciente y el ribosoma encuentra proteínas de acoplamiento en el retículo endoplásmico rugoso. En algunos casos, el péptido señal se escinde una vez que la proteína llega a su compartimento de destino.

Algunos de estos mecanismos específicos pueden ser discutidos por su instructor en clase, y hay más detalles disponibles en la lectura & quot Translocación de proteínas & quot. El tema se menciona aquí porque a veces se combina con la traducción (como se describió anteriormente).

Modificación de proteínas postraduccionales

Después de la traducción, los aminoácidos individuales pueden modificarse químicamente. Estas modificaciones agregan variación química que no está presente en los aminoácidos codificados genéticamente y nuevas propiedades que tienen sus raíces en la química de los grupos funcionales que se están agregando. Las modificaciones comunes incluyen grupos fosfato, grupos metilo, acetato y amida. Algunas proteínas, generalmente dirigidas a las membranas, se lipidarán; se agregará un lípido. Otras proteínas se glicosilarán, se agregará un azúcar. Otra modificación postraduccional común es la escisión o unión de partes de la propia proteína. Los péptidos señal se pueden escindir, se pueden escindir partes de la mitad de la proteína o se pueden formar nuevos enlaces covalentes entre la cisteína u otras cadenas laterales de aminoácidos. Casi todas las modificaciones serán catalizadas por enzimas y todas cambiarán el comportamiento funcional de la proteína.

Resumen de la sección

El ARNm se utiliza para sintetizar proteínas mediante el proceso de traducción. El código genético es la correspondencia entre el codón de ARNm de tres nucleótidos y un aminoácido. El código genético es "traducido" por las moléculas de ARNt, que asocian un codón específico con un aminoácido específico. El código genético está degenerado porque 64 codones tripletes en el ARNm especifican solo 20 aminoácidos y tres codones de terminación. Esto significa que más de un codón corresponde a un aminoácido. Casi todas las especies del planeta usan el mismo código genético; los "códigos desviados" no son radicalmente diferentes, pero cambian el significado de uno o dos codones. Las excepciones más impresionantes son las especies que codifican 21 o 22 aminoácidos, en lugar de los 20 habituales.

Los jugadores en la traducción incluyen la plantilla de ARNm, ribosomas, ARNt y varios factores enzimáticos. La pequeña subunidad ribosómica se une a la plantilla de ARNm. La traducción comienza en el AUG de inicio en el ARNm (esto también establece el marco de lectura). La formación de enlaces se produce entre los aminoácidos secuenciales especificados por la plantilla de ARNm de acuerdo con el código genético. The ribosome accepts charged tRNAs, and as it steps along the mRNA, it catalyzes bonding between the new amino acid and the end of the growing polypeptide. The entire mRNA is translated in three-nucleotide &ldquosteps&rdquo of the ribosome. When a stop codon is encountered, a release factor binds and dissociates the components and frees the new protein.


Reviewers’ comments

Reviewer 1: Dr Mikhail Gelfand, Institute for Information Transmission Problems, RAS, Bolshoi Karetny per. 19, Moscow 127994, Russia and Faculty of Bioengineering and Bioinformatics, Moscow State University, Vorobievy Gory 1-73, Moscow 119992, [email protected]

The authors present a model explaining the following observation: while the use of the UGA stop codon depends on G-content, the UAG frequency is almost constant in genomes with highly diverse G-content. While I see no problems with the observations and the model, I have some editorial comments and questions.

The authors state several times – starting with the very first sentence of the abstract – that the usage of stop codons has not been rigorously studied. This is not correct. In the 90’s, several papers considered the usage of stop codons and its dependence on the local context, including tandem stops and tetranucleotides involving stop-codons. I think these papers should be mentioned.

Author response: Indeed, the term “usage” in this context is not very precise. We acknowledge that there have been studies of stop codon usage in the local context, that is to say that some stop codons have a preferred local context, however, in this manuscript we discuss only the evolution and genomic frequencies of the three different stop codons, which to our knowledge has not been rigorously considered previously. We cite some of the relevant literature and use the word “frequency” which we believe is not as ambiguous as “usage” in this context.

How the 11 studied genome pairs were selected?

Author response: We selected all genome triplets with 0.03 < KS < 0.22 that were available in the ATGC database. We now report this in the Methods section.

Is the G/A content the same in the 3rd codon position in all codon pairs? If not, why this is a good parameter?

Author response: There are three pairs of two-fold degenerated codon families: AAG/A, GAG/A, CAG/A. G-content at the third position of every pair is indeed highly correlated with overall G-content (see the figure below).

Dependency between G content in the third position of two-fold degenerated codon families and overall G content for AAG/A (blue), GAG/A (red), CAG/A (green).

And in any case, what are the reasons to suspect that the selection regime in the amino-acid-encoding codons is the same as in the stops (the former may depend on concentrations of tRNAs and the codon-anticodon interactions the latter, on interactions with the release factors). What about the A/G choice in the four-fold codon families?

Author response: Indeed, we have created the model based on this assumption because it allowed us to reduce the number of parameters and make the system of equations solvable. However, we can also show that this assumption does not affect our main result that the TAG codon is selectively disadvantageous. Specifically, from system of equations (4) it follows that exp(S 2) = F TGA/F TAG. Thus, we can solve for the selective impact of TAG (S 2) solely based on the frequencies of TAG and TGA without making the assumption that the selective regime is the same in stop and amino acid codons. Since S2 is positive for almost the entire range of G content it follows that the TAG codon provides a selective disadvantage relative to the TGA codon. Unfortunately, we cannot estimate S 2 by comparing the frequencies of TAG and TAA codons because we cannot independently estimate the μ 2 μ 1 exp ( S 1 ) component of fTAA from (4). We now present the new estimate of S 2 in Figure 5 and the main text.

The reasoning in page 6 is not clearly presented, and misprints add to the confusion. How is formula S2 = ln ((fG(1-fTAG))/fTAG) used? Do I understand it correctly that the next formula S2 = ln (3.6fG + 0.4) results from a fit to observations (comparison of genome pairs)? – I think, this should be explained more explicitly.

Author response: Yes, this is what we mean, and we rewrote this section to hopefully make this clearer.

By the way, the two formulas for S2, theoretical and observed ones, yield a dependence between fG and fTAG – does it hold?

Author response: Yes, there is a slight dependence as can be seen from Figure 1.

Finally, reference to equation ( 5 ) in the preceding paragraph should be about equation ( 4 ), and the sentence “S2 has a clear G-content dependence is well approximated…” probably should be “S2 has a clear G-content dependence that is well approximated…” .

Author response: If the referee means this sentence “Thus, selection on G-content,, affects only G-content itself and does not change the form of the relationship between G frequency and stop codon usage as is evident from expressions (4).” then we mean that in the system of equations (4) G-content (f(taa,tga,tag) does not depend on S1. The other typo is corrected.

Polarization of substitutions using parsimony may be dangerous if there is selection towards a specific, preferred nucleotide: in some cases two parallel nonpreferred-to-preferred substitutions may occur, and they will be interpreted as a single preferred-to-nonpreferred substitution, hence skewing the substitution statistics.

Author response: This is true, however, these data has been obtained for a number of species with different GC-content and low sequence divergence. Therefore, we believe that it is unlikely that the use of parsimony have produced a systematic error of substantial effect that jeopardizes our conclusions.

Reviewer 2: Dr. Arcady Mushegian, Stowers Institute for Medical Research, Kansas City, Missouri, United States of America and Department of Microbiology, Kansas University Medical Center, Kansas City, Kansas, United States of [email protected]

The manuscript by Povolotskaya et al. puts forward a simple model of nucleotide substitutions in the stop codons in bacteria, and tests it against the genome-wide data. One of the main conclusions is that TAG may be globally suboptimal, with each of the remaining two codons turning out more fit under different values of GC content.

One biological explanation of these data may be in the phenomenon of overlapping ORFs in bacterial operons. TAG is the only codon that does not accommodate a minimal overlap, whereas TAA can give one kind of stop-start codon overlap (TAATG) and TGA even two kinds (ATGA and TGATG). Perhaps if the authors restricted their sample to the termination codons in the last (or only) genes in operons, they would see much less difference between fitness of those two and TAG?

Author response: The idea that the observed pattern of stop codon frequency in bacterial genomes is explained by gene overlap has occurred to us as well. However, we observe the same relationship between G-content and stop codon frequency in overlapping and non-overlapping genes. We now report these data in a new figure that is Additional file 2 Figure S2 in the new version of the manuscript. We have considered only tail-to-tail overlaps due to a much higher certainty of stop codon annotation compared to the uncertainty in the annotation of many start codons.

Reviewer 3: Dr. Shamil Sunyaev, Dr. Shamil Sunyaev, Division of Genetics, Brigham and Women's Hospital, Harvard Medical School, 77 Ave. Louis Pasteur, Boston MA 02115, USA. [email protected]

This manuscript presents an analysis of stop codon usage in bacterial species.

The authors report that TAG codon is un-preferred in most bacterial species and that its frequency does not depend on GC content. They suggest presence of weak selection against TAG codon due to unknown mechanism. One potential mechanism may involve dependency of efficiency of one of the release factors on GC content. I find the results of great interest. I only have two minor technical comments.

1) The analysis is based on Bulmer equations, which hold only if evolution is mutation limited. It would be great to briefly discuss applicability of this model to a wide variety of bacterial species.

Author response: Bulmer’s model assumes that the fate of a new mutation is decided independently of other mutations, that is to say that generally only one mutation is segregating in the population at the same time. This is certainly true if we consider only mutations in stop codons. In most bacterial genomes there are 2–5 thousand protein coding genes making it rather unlikely that more than one stop codon polymorphism is segregating at the same time.

2) Approximation of selection coefficient against TAG codon as a sum of contributions due to selection against GC content (S1) and selection against this specific codon (S2) ignores the S1*S2 term. It is OK if both selective forces are assumed to be small. It would be great if this assumption would be spelled out.

Author response: The referee is absolutely correct, we assume that both of the selective forces are small. We have added an explicit statement to this effect in the text.


Properties of Genetic code

The genetic code is degenerate

Most amino acids have more than one codon, for example in the case of arginine, leucine, and serine amino acids each one of them has 6 different codons. In the case of leucine amino acid, these codons are CUA, CUC, CUG, CUU, UUA, and UUG. This helps in codes against the harmful effect of the mutation.

2. The genetic code is unambiguous

Each code has only one meaning i.e it codes only one amino acid. For example, AUG codes only one amino acid which is methionine. It can never code any other amino acid.

3. The genetic code has “start” and “stop” signals

There is only one start codon (AUG, initiation codon) which starts the translation process, but to stop this process three stop codons are present i.e.UAA, UGA and UAG.

4. A codon aways has an anticodon

A specific tRNA molecule contains a set of three consecutive nucleotides that can base pair with the codon of mRNA. This set of nucleotide that can base pair with codon is called Anticodon. For example for codon of UGC on mRNA, tRNA will have anticodon ACG.

  • Type of codon which starts protein synthesis is called Initiation codon i.e. AUG.
  • Type of codon which terminates protein synthesis is called stop codon i.e. UAA, UGA, and UAG.

5. Genetic codes are universal except in rare cases

These will code same amino acids in all organisms, even it may be plant-animal of fungi, etc.


What is the triplet code in protein synthesis?

los genetic code. Each individual three-nucleotide coding unit, as we have seen, is called a codon. Síntesis de proteínas is accomplished by orderly interactions between mRNA and the other ribonucleic acids (transfer RNA [tRNA] and ribosomal RNA [rRNA]), the ribosome, and more than 100 enzymes.

Additionally, what is the genetic code and why is the triplet important? los genetic code for life is a triplet base code. It is known that adjacent codons can influence translation of a given codon and that codon pair biases occur throughout nature. We show that mRNA translation at a given codon can be affected by the two previous codons.

Then, how does the triplet code work?

Specifically, the code defines a mapping between tri-nucleotide sequences called codons and amino acids every triplet of nucleotides in a nucleic acid sequence specifies a single amino acid. Each nucleotide sub-unit consists of a phosphate, deoxyribose sugar and one of the 4 nitrogenous nucleotide bases.

Definicion de codon. : a specific sequence of three consecutive nucleotides that is part of the genetic code and that specifies a particular amino acid in a protein or starts or stops protein synthesis. &mdash called also triplet.


How Cells Work

You may remember from a previous section that enzymes are formed from 20 different amino acids strung together in a specific order. Therefore the question is this: How do you get from DNA, made up of only four nucleotides, to an enzyme containing 20 different amino acids? There are two answers to this question:

  1. An extremely complex and amazing enzyme called a ribosoma reads messenger RNA, produced from the DNA, and converts it into amino-acid chains.
  2. To pick the right amino acids, a ribosome takes the nucleotides in sets of three to encode for the 20 amino acids.

What this means is that every three base pairs in the DNA chain encodes for one amino acid in an enzyme. Three nucleotides in a row on a DNA strand is therefore referred to as a codon. Because DNA consists of four different bases, and because there are three bases in a codon, and because 4 * 4 * 4 = 64, there are 64 possible patterns for a codon. Since there are only 20 possible amino acids, this means that there is some redundancy -- several different codons can encode for the same amino acid. In addition, there is a stop codon that marks the end of a gene. So in a DNA strand, there is a set of 100 to 1,000 codons (300 to 3,000 bases) that specify the amino acids to form a specific enzyme, and then a stop codon to mark the end of the chain. At the beginning of the chain is a section of bases that is called a promoter. A gene, therefore, consists of a promoter, a set of codons for the amino acids in a specific enzyme, and a stop codon. That is all that a gene is.

To create an enzyme, the cell must first transcribe the gene in the DNA into messenger RNA. The transcription is performed by an enzyme called RNA polymerase. RNA polymerase binds to the DNA strand at the promoter, unlinks the two strands of DNA and then makes a complementary copy of one of the DNA strands into an RNA strand. RNA, or ribonucleic acid, is very similar to DNA except that it is happy to live in a single-stranded state (as opposed to DNA's desire to form complementary double-stranded helixes). So the job of RNA polymerase is to make a copy of the gene in DNA into a single strand of messenger RNA (mRNA).

The strand of messenger RNA then floats over to a ribosoma, possibly the most amazing enzyme in nature. A ribosome looks at the first codon in a messenger RNA strand, finds the right amino acid for that codon, holds it, then looks at the next codon, finds its correct amino acid, stitches it to the first amino acid, then finds the third codon, and so on. The ribosome, in other words, reads the codons, converts them to amino acids and stitches the amino acids together to form a long chain. When it gets to the last codon -- the stop codon -- the ribosome releases the chain. The long chain of amino acids is, of course, an enzyme. It folds into its characteristic shape, floats free and begins performing whatever reaction that enzyme performs.


Ver el vídeo: Βιολογία #1: Τι είναι το DNA και πως λειτουργεί; (Agosto 2022).