Información

¿Encontrar la longitud de la secuencia de ADN?

¿Encontrar la longitud de la secuencia de ADN?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Dado $ N = 5 times10 ^ 3 $ y la tasa de mutación es $ mu = 10 ^ {- 5} $ por sitio, encuentre la longitud de una secuencia de ADN de modo que la probabilidad de que ocurra una mutación M, sea mayor o igual que 0,95 .

¿Existe algún método o fórmula para este tipo de cálculo?


La tasa de mutación por haplotipo por sitio es $ mu = 10 ^ {- 5} $. Suponiendo diploidía y un tamaño de población de $ N = 5000 $, la tasa de mutación de toda la población por sitio es $ 10 ^ {- 5} * 5000 * 2 = 0,1 $.

$ 0.1 $ es, por lo tanto, la probabilidad de que ocurra una mutación en un sitio dado (en toda la población). Para 10 sitios, la probabilidad de que ocurra una mutación en al menos un sitio es $ 1 - (1-0.1) ^ {10} = 0.65 $.

La probabilidad a la que aspiramos es de 0,95. Entonces escribamos la ecuación

$$ 1 - (1-0.1) ^ {x} = 0.95 $$

, donde $ x $ es el número de sitios que estamos buscando. Solo tiene que resolver $ x $ ahora y redondear al número entero más grande.


  • La secuenciación del genoma avanzará enormemente en nuestra comprensión de la biología genética y tiene un gran potencial para el diagnóstico y el tratamiento médicos.
  • Las tecnologías de secuenciación de ADN han pasado por al menos tres "generaciones": la secuenciación de Sanger y la secuenciación de Gilbert fueron de primera generación, la pirosecuenciación fue de segunda generación y la secuenciación de Illumina es de próxima generación.
  • La secuenciación de Sanger se basa en el uso de terminadores de cadena, ddNTP, que se agregan a las cadenas de ADN en crecimiento y terminan la síntesis en diferentes puntos.
  • La secuenciación de Illumina implica ejecutar hasta 500.000.000 de reacciones de secuenciación diferentes simultáneamente en un único portaobjetos pequeño. Utiliza una reacción de replicación modificada y utiliza nucleótidos marcados con fluorescencia.
  • La secuenciación de escopeta es una técnica para determinar la secuencia de cromosomas completos y genomas completos basada en la producción de fragmentos aleatorios de ADN que luego son ensamblados por computadoras que ordenan los fragmentos encontrando extremos superpuestos.
  • secuencia ADN: técnica utilizada en biología molecular que determina la secuencia de nucleótidos (A, C, G y T) en una región particular del ADN.
  • didesoxinucleótido: cualquier nucleótido formado a partir de un desoxinucleótido por pérdida de un segundo grupo hidroxilo del grupo desoxirribosa
  • in vitro: cualquier proceso bioquímico realizado fuera de su entorno biológico natural, como en un tubo de ensayo, placa de Petri, etc. (del latín para & ldquoin glass & rdquo)

Secuenciación didesoxi

Recuerde que las ADN polimerasas incorporan nucleótidos (dNTP) en una hebra de ADN en crecimiento, según la secuencia de una hebra molde. Las ADN polimerasas agregan una nueva base solo al grupo 3 & rsquo-OH de una cadena de ADN existente, por eso se requieren cebadores en la síntesis natural de ADN y en técnicas como la PCR. La mayoría de las técnicas de secuenciación de ADN que se utilizan actualmente se basan en la incorporación aleatoria de nucleótidos modificados denominados terminadores. Ejemplos de terminadores son los nucleótidos didesoxi (ddNTPs), que carecen de un grupo 3 & rsquo-OH y, por lo tanto, no pueden servir como un sitio de unión para la adición de nuevas bases a una cadena de ADN en crecimiento (Figura ( PageIndex <1> )). Después de que un ddNTP se incorpora a una hebra de ADN, no puede ocurrir más elongación. Los terminadores están etiquetados con uno de los cuatro tintes fluorescentes, cada uno específico para una de las cuatro bases de nucleótidos.

Figura ( PageIndex <1> ): ddNTPs (Original-Deyholos-CC: AN)

Para secuenciar un fragmento de ADN, necesita muchas copias de ese fragmento (Figura ( PageIndex <2> )). A diferencia de la PCR, la secuenciación de ADN no amplifica la secuencia diana y solo se usa un cebador. Este cebador se hibrida con el ADN molde desnaturalizado y determina en qué parte de la hebra molde comenzará la reacción de secuenciación. Se agrega una mezcla de dNTP, terminadores marcados con fluorescencia y ADN polimerasa a un tubo que contiene el híbrido cebador-molde. La ADN polimerasa sintetizará una nueva hebra de ADN hasta que se incorpore un nucleótido marcado con fluorescencia, en cuyo punto finaliza la extensión. Debido a que la reacción contiene millones de moléculas molde, se sintetiza un número correspondiente de moléculas más cortas, cada una terminando en una etiqueta fluorescente que corresponde a la última base incorporada.

Figura ( PageIndex <2> ): Una reacción de secuenciación comienza con muchas copias idénticas de un fragmento de ADN molde. La plantilla se desnaturaliza, luego los cebadores se reasocian a la plantilla. Después de la adición de polimerasa, dNTPS regular y terminadores marcados con fluorescencia, la extensión comienza en el sitio del cebador. El alargamiento procede hasta que se incorpora un terminador marcado con fluorescencia (mostrado aquí en color). (Original-Deyholos-CC: AN)

Las hebras recién sintetizadas pueden desnaturalizarse de la plantilla y luego separarse electroforéticamente en función de su longitud (Figura ( PageIndex <3> )). Dado que cada banda difiere en longitud en un nucleótido, y la identidad de ese nucleótido se conoce por su fluorescencia, la secuencia de ADN puede leerse simplemente a partir del orden de los colores en bandas sucesivas. En la práctica, la longitud máxima de secuencia que se puede leer en una única reacción de secuenciación es de aproximadamente 700 pb.

Figura ( PageIndex <3> ): Los productos etiquetados con fluorescencia se pueden separar electroforéticamente en función de su longitud. (Original-Deyholos-CC: AN)

Un método de electroforesis particularmente sensible que se utiliza en el análisis de reacciones de secuenciación de ADN se llama electroforesis capilar (Figura ( PageIndex <6> )). En este método, una corriente tira de los productos de secuenciación a través de una matriz similar a un gel que está encerrada en un tubo fino de plástico transparente. Como en la electroforesis convencional, los fragmentos más pequeños se mueven a través del capilar con mayor rapidez. A medida que pasan por un punto cerca del final del capilar, se lee la intensidad fluorescente de cada tinte. Esto produce un gráfico llamado cromatograma. La secuencia se determina identificando el pico más alto (es decir, el tinte con la señal fluorescente más intensa) en cada posición.

Figura ( PageIndex <4> ): Los productos marcados con fluorescencia se pueden separar mediante electroforesis capilar, generando un cromatograma a partir del cual se puede leer la secuencia (Wikipedia-Abizar Lakdawalla-PD).


Estructura del ADN de Watson y Crick

Watson y Crick mostraron la estructura del ADN después de estudiar el manuscrito de los dos científicos Linus Pauling y Corey. En 1953, Linus Pauling y Corey dieron la estructura 3D del ácido nucleico, que no tuvo éxito. Luego, (a principios de 1953) Watson y Crick combinaron juntos los datos de físico y propiedades químicas y propuso una estructura de ADN de doble hélice. Las principales características del modelo de ADN de Watson y Crick incluyen:


Propiedades físicas del ADN

  • Según el modelo de Watson y Crick, el ADN es una hélice de doble hebra, que consta de dos cadenas de polinucleótidos. Las dos cadenas de polinucleótidos están retorcidas en espiral o helicoidalmente, lo que le da una como una escalera retorcida Mira.
  • Ambas cadenas de polinucleótidos de ADN tienen polaridades opuestas, lo que significa que las dos cadenas se ejecutarán en el dirección antiparalela, es decir, uno en la dirección 5'-3 'y otro en la dirección 3'-5'.
  • El diámetro de la hélice de ADN ds-stranded es 20Å.
  • La distancia entre los dos nucleótidoso la distancia internuclear es 3.4Å. La longitud de la hélice de ADN es 34Å después de una vuelta completa y posee 10 pares de bases por turno.
  • El ADN está torcido en "dirección de la mano derecha" o podemos decir en un "Sentido de las agujas del reloj”.
  • El torneado del ADN provoca la formación de hendiduras anchas, es decir, "Surco mayor”. La distancia entre los dos hilos forma una hendidura estrecha, es decir, "Surco menor”. La formación de surcos mayores y menores se produce después del enrollamiento del ADN y los surcos también actúan como un sitio para las proteínas de unión al ADN.

Propiedades químicas del ADN

  • Hay cuatro bases de nucleótidos presentes en la cadena de polinucleótidos como adenina, guanina, citosina y timina. La adenina y la guanina son las dos bases de purina, que tienen una estructura de anillo único. La citosina y la timina son las dos bases de pirimidina, que tienen la estructura de doble anillo.
  • Los dos hilos están unidos por el "Maridaje de bases complementarias”De las bases nitrogenadas. Por lo tanto, una base de purina se emparejará de forma complementaria con la base de pirimidina, en la que "adenina" se empareja con "timina" y "guanina" se empareja con "citosina".
  • Las bases de nucleótidos en las cadenas de polinucleótidos de ADN se unirán entre sí a través de un fuerte enlace de hidrógeno.
  • La adenina se empareja de forma complementaria con la timina a través de dos enlaces de hidrógeno, mientras que la guanina se empareja de forma complementaria con la citosina por medio de tres enlaces de hidrógeno.
  • La composición de bases de nucleótidos del ADN sigue la regla de Chargaff donde la suma de purinas es igual al número de pirimidinas. La composición base de A + G = T + C obedece la regla de Chargaff, pero la composición base de A + T no es igual a la G + C.
  • Las cadenas de polinucleótidos de ADN constan de tres componentes principales, a saber bases nitrogenadas, desoxirribosa azúcar y un fosfato grupo.
  • La columna vertebral del ADN consiste en la columna vertebral de azúcar-fosfato. El esqueleto de azúcar-fosfato contiene ambas cadenas de polinucleótidos de ADN por medio de "Enlace fosfodiéster”. Por lo tanto, el enlace entre el azúcar y los fosfatos, es decir, el enlace fosfodiéster y el enlace entre las bases nitrogenadas, es decir, el enlace de hidrógeno, contribuye a la "ADNEstabilidad”.

Conclusión

El ADN es un supermodelo propuesto por Watson y Crick en el año 1953. El descubrimiento del ADN de doble hélice no fue posible sin la colaboración de Maurice Wilkins y Rosalind Franklin. Maurice Wilkins y Rosalind Franklin descubrieron la imagen del ADN a través de Cristalografía de rayos X. La imagen de difracción de rayos X del ADN ayudó a Watson y Crick a estudiar más a fondo la estructura y los componentes del ADN. Con esto, Watson y Crick propusieron un modelo de ADN conocido como Watson y Crick & # 8217s modelo de ADN de doble hélice.

El ADN es la biomolécula más grande que contiene toda la información genética de la persona a construir un organismo o una forma de vida. El estudio de la estructura de doble hélice del ADN nos ayuda a conocer las propiedades químicas y físicas del ADN, además de la propiedad de que el ADN es un “Material genético”.


Recursos adicionales en línea

Proyecto Genoma Humano
Este sitio, titulado "ADN forense", es presentado por el Proyecto Genoma Humano. Proporciona una descripción general completa del tema cubierto en esta lección de BLOSSOMS.

Learn.Genetics: Electroforesis en gel
Esta presentación sobre análisis forense del ADN es proporcionada por “Learn.Genetics” del Centro de Aprendizaje de Ciencias Genéticas de la Universidad de Utah.

Learn.Genetics
Este es el sitio principal de Learn.Genetics, que proporciona enlaces a una amplia gama de recursos para aprender sobre genética.

Video de MIT BLOSSOMS: Visita al laboratorio de identificación de la policía
Mire el video opcional: Visite el Laboratorio de identificación de la policía en Cambridge, MA para ver cómo se extrae el ADN de las pruebas en las escenas del crimen.


Cómo contar bases que no son de ADN en una secuencia usando Python

Recientemente me di cuenta de que dos preguntas en particular surgen con bastante regularidad en mis registros de búsqueda: "cómo contar las bases que no son de ADN en una secuencia" y "cómo saber si una secuencia contiene ADN" (presumiblemente en contraposición a proteínas). Me llamó la atención que la segunda pregunta es realmente un caso especial de la primera: una vez que tenemos una forma de contar el número de bases de ADN en una secuencia, podemos simplemente aplicar una regla que si más del 80% (o cualquier otro número que tengamos) elegir) de las bases en una secuencia son A, T, G o C, entonces probablemente sea ADN.

Comencemos con lo más simple que creemos que funcionará: simplemente contaremos el número de caracteres A, T, G y C en una secuencia, luego dividiremos por la longitud y multiplicaremos por 100 para obtener un porcentaje. Para este ejemplo, estoy usando una secuencia de ADN que tiene tres caracteres que no son ATGC: uno de cada uno de N, Y y R. He incluido la corrección de división al comienzo del código en caso de que desee ejecutar esto en Python 2 :

El resultado de este bit de código muestra que está funcionando como se esperaba:

Sin embargo, en algunas circunstancias, es posible que queramos permitir caracteres distintos de A, T, G y C en nuestras secuencias de ADN. Eche un vistazo a esta tabla que muestra el conjunto de códigos de ambigüedad estándar de la IUPAC:

Dependiendo de qué subconjunto de estos queramos permitir, es posible que deseemos contar hasta dieciséis caracteres diferentes. En lugar de meter dieciséis llamadas diferentes a count () en una línea, probablemente sea mejor recorrer los caracteres permitidos y acumular el conteo uno por uno. Aquí hay un poco de código para hacer eso, usando una lista para definir el conjunto de caracteres permitidos. Para este ejemplo, estoy permitiendo las cuatro bases estándar más purinas (R) y pirimidinas (Y):

Como era de esperar, la respuesta es más alta que en nuestro primer ejemplo porque ahora contamos R e Y como bases de ADN:

Esto parece un fragmento de código perfecto para convertirlo en una función. Convertiremos la secuencia de ADN y la lista de bases permitidas en argumentos de función, y usaremos un valor predeterminado sensato de contar solo caracteres ATGC.

Observe cómo hemos cambiado tanto la secuencia de entrada como las bases permitidas a mayúsculas, para asegurarnos de que la función funcionará independientemente del caso de las entradas. Aquí hay algunas pruebas rápidas:

Habiendo escrito esta función, es bastante sencillo definir una función para probar si una secuencia es ADN. Para que la función sea lo más flexible posible, asignaremos valores predeterminados razonables tanto a las bases permitidas como al porcentaje mínimo de bases que deben coincidir. Pasaremos la secuencia de entrada y la lista de bases permitidas a la función count_dna () y luego compararemos el resultado de esa llamada con el mínimo. Aquí está la función junto con un par de líneas para probarla:

Como puede ver, la función es muy concisa: simplemente preguntamos si el porcentaje de bases de ADN devueltas por nuestra función anterior es mayor que el mínimo y devolvemos el resultado. Como muestra el resultado, podemos hacer que la prueba sea más estricta aumentando el mínimo, o más indulgente al permitir algunas bases ambiguas:

Otra forma mucho más concisa de escribir la función de conteo sería usar una lista de comprensión para seleccionar solo los caracteres que están en algún grupo:


Problema de ensamblaje de secuencia

El problema del ensamblaje de la secuencia se puede describir como sigue.

Dado un conjunto de secuencias, encuentre la cadena de longitud mínima que contenga todos los miembros del conjunto como subcadenas.

Este problema se complica aún más debido a la existencia de secuencias repetitivas en el genoma, así como a las sustituciones o mutaciones dentro de ellas.

El problema del ensamblaje de la secuencia se puede comparar con un escenario de la vida real de la siguiente manera.

Suponga que toma muchas copias de un libro, pasa cada una de ellas a través de una trituradora con un cortador diferente, y luego intenta volver a juntar el texto del libro simplemente pegando las piezas trituradas. Es obvio que esta tarea es bastante difícil. Además, también hay algunos problemas prácticos adicionales. La copia original puede tener muchos párrafos repetidos, y algunos fragmentos pueden modificarse durante la eliminación para tener errores tipográficos. Es posible que también se hayan agregado partes de otro libro, y algunos fragmentos pueden ser completamente irreconocibles.

Suena muy confuso y bastante imposible de realizar. Se sabe que este problema es NP-Completo. Los problemas NP-completos son problemas cuyo estado se desconoce. Todavía no se ha descubierto ningún algoritmo de tiempo polinomial para ningún problema NP-completo, ni nadie ha podido demostrar que no exista un algoritmo de tiempo polinomial para ninguno de ellos. Sin embargo, hay algoritmos codiciosos para resolver el problema del ensamblaje de secuencias, donde los experimentos han demostrado funcionar bastante bien en la práctica.

Un método común utilizado para resolver el problema de ensamblaje de secuencias y realizar análisis de datos de secuencia es alineación de secuencia.


¿Encontrar la longitud de la secuencia de ADN? - biología

En el ejercicio siguiente, se le dará una secuencia de ADN desconocida y se le pedirá que utilice una herramienta web para traducir la secuencia en una secuencia de aminoácidos y, con suerte, identificar el marco de lectura adecuado. Luego, guardará esta secuencia de aminoácidos en un programa de procesamiento de texto (o se la enviará por correo electrónico) si desea utilizarla en el próximo ejercicio.

Obteniendo tu secuencia
En el laboratorio, esto podría obtenerse secuenciando un clon de una biblioteca de ADNc o aislando un fragmento de ADN amplificado de una amplificación por PCR. A menudo, cuando secuenciamos un producto de este tipo, encontramos que tenemos un fragmento inesperado de ADN que debemos analizar. Aquí proporcionaremos una secuencia parcial al azar de nuestra base de datos de secuencias. Aparecerá una secuencia de nucleótidos parcial en la ventana siguiente después de hacer clic en el botón Obtener secuencia de genes.

Traduciendo la secuencia
Varios sitios en la web realizan una traducción de una secuencia de entrada. Al hacer clic en el enlace de Expasy a continuación, se abrirá una nueva ventana que le dará acceso a una herramienta de traducción. La traducción de la secuencia de ADN se realiza leyendo la secuencia de nucleótidos tres bases a la vez y luego mirando una tabla del código genético para llegar a una secuencia de aminoácidos. Este programa examina la secuencia de entrada en los seis cuadros posibles (es decir, leyendo la secuencia de 5 'a 3' y de 3 'a 5' comenzando con nt 1, nt 2 y nt 3). Lo que normalmente buscamos al identificar la traducción adecuada es el marco que da la secuencia de aminoácidos más larga antes de que se encuentre un codón de terminación. (Dado que hay 64 codones y tres códigos para tonterías, esperamos que aparezca un codón de terminación en promedio una vez cada 20 aminoácidos si simplemente leemos una secuencia "fuera de marco". Sin embargo, "en promedio" es solo eso, y Es posible que un marco de lectura incorrecto dé una secuencia extendida sin codones de parada. El próximo ejercicio abordará ese problema.

Usaremos las herramientas de Expasy para la traducción. Al hacer clic en él, se abrirá una nueva ventana para que pueda volver a esta ventana para obtener instrucciones y copiar su secuencia.


Genómica

Secuenciación de ADN y genómica

La secuenciación del ADN determina el orden de los nucleótidos o bases del ADN en un genoma: el orden de las adeninas (A), citosinas (C), guaninas (G) y timinas (T) que componen el ADN de un organismo. La secuenciación de ADN se puede realizar utilizando diferentes métodos. El método de secuenciación de Sanger (terminación de cadena) fue el más utilizado para la secuenciación de ADN hasta que la pirosecuenciación entró en escena. El método de Sanger se basa en el uso de didesoxinucleótidos. Estructuralmente, los didesoxinucleótidos son esencialmente los mismos que los nucleótidos excepto que contienen un grupo hidrógeno (–H) en el carbono 3 'en lugar de un grupo hidroxilo (–OH). Estos didesoxinucleótidos evitan la adición de más nucleótidos debido a su incapacidad para formar un enlace fosfodiéster con el próximo nucleótido y dan como resultado la terminación de la formación de la cadena de ADN. Por otro lado, la pirosecuenciación se basa en el principio de "secuenciación por síntesis". Se basa en la detección de la liberación de pirofosfato en la incorporación de nucleótidos, más que en la terminación de la cadena con didesoxinucleótidos. La pirosecuenciación forma la base de la secuenciación de alto rendimiento que paraleliza el proceso de secuenciación, produciendo millones de secuencias a la vez. Varios secuenciadores de segunda generación se ejecutan actualmente con la misma química, como 454 pirosecuenciación, Illumina (secuenciación de Solexa) y secuenciación SOLiD. Con el advenimiento de las tecnologías de secuenciación de nueva generación, el costo de la secuenciación y el tiempo necesario para realizar la secuenciación se han reducido significativamente. Esto ha abierto muchas oportunidades en el campo de la genómica. Se han realizado muchos proyectos para comprender la genómica de muchas especies, incluidos virus, bacterias, hongos, plantas y animales.


Desarrollo de sondas RFLP

  • El ADN total se digiere con una enzima sensible a la metilación (por ejemplo, PstI), enriqueciendo así la biblioteca para secuencias expresadas de copia única o baja (los clones de PstI se basan en la sugerencia de que los genes expresados ​​no están metilados).
  • El ADN digerido se fracciona por tamaño en un gel de agarosa preparativo, y los fragmentos que varían de 500 a 2000 pb se escinden, eluyen y clonan en un vector plasmídico (por ejemplo, pUC18).
  • Se examinan los digeridos de los plásmidos para comprobar si hay inserciones.
  • Las transferencias Southern de los insertos se pueden probar con ADN cortado total para seleccionar clones que se hibridan con secuencias de copia única y baja.
  • Las sondas se seleccionan para detectar RFLP utilizando ADN genómico de diferentes genotipos digeridos con endonucleasas de restricción. Normalmente, en especies con tasas de polimorfismo de moderadas a altas, se utilizan de dos a cuatro endonucleasas de restricción, como EcoRI.


Ver el vídeo: Ejercicios de transcripción y traducción. (Julio 2022).


Comentarios:

  1. Vusida

    ¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡

  2. Sarn

    Por qué tema tan notable

  3. Guzil

    Me gustaría hablar mucho contigo.

  4. Sall

    Donde realmente aquí contra el talento

  5. Nehn

    Soy finito, pido disculpas, pero no se acerca mucho a mí. ¿Pueden existir todavía las variantes?

  6. Taktilar

    Voluntariamente acepto. En mi opinión, es una pregunta interesante, participaré en la discusión.Juntos podemos llegar a una respuesta correcta. Estoy seguro.



Escribe un mensaje