Información

GWAS: mapa de marcadores basado en el ensamblaje del genoma antiguo: ¿puedo usar el nuevo ensamblaje para buscar posiciones de SNP?

GWAS: mapa de marcadores basado en el ensamblaje del genoma antiguo: ¿puedo usar el nuevo ensamblaje para buscar posiciones de SNP?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Tengo un conjunto antiguo de datos SNP de cerdo y las posiciones se mapearon usando v10.2 del ensamblaje.

Envié un artículo de GWAS para su revisión, y el revisor quiere saber si alguno de los SNP importantes que se encontraban en genes previamente desconocidos se encuentra ahora en genes conocidos, con el lanzamiento del último ensamblaje el año pasado.

Tenía la impresión de que tenía que usar el ensamblaje en el que se basaba el mapa de marcadores para ver dónde se encuentran los SNP. ¿Es esto correcto o puedo usar el nuevo ensamblaje?

¡Muchas gracias de antemano!


¿Por qué no ha intentado utilizar LiftOver para convertir las coordenadas?

https://genome.ucsc.edu/cgi-bin/hgLiftOver


GWAS: identificación y caracterización de genes de avance rápido en cereales templados: lecciones de la cebada - una revisión

Comprender la complejidad genética de los rasgos es un objetivo importante de las mejoras en el rendimiento y la adaptación de los cereales de grano pequeño en zonas templadas. El mapeo de ligamiento de loci de rasgos cuantitativos bi-parentales (QTL) es un método poderoso para identificar regiones genéticas que co-segregan en el rasgo de interés dentro de la población de investigación. Sin embargo, recientemente, el mapeo de desequilibrio de asociación o ligamiento (LD) utilizando un estudio de asociación de todo el genoma (GWAS) se convirtió en un enfoque para desentrañar la base genética molecular subyacente a la variación fenotípica natural. Se han identificado muchos alelos / loci causales utilizando el poder de este enfoque que no se había detectado en poblaciones de mapeo de QTL. En cebadaHordeum vulgare L.), GWAS se ha aplicado con éxito para definir los alelos / loci causantes que se pueden utilizar en el cultivo de mejoramiento para la adaptación y la mejora del rendimiento. Este enfoque prometedor representa un gran paso adelante en el análisis genético y sin duda ha demostrado que es una herramienta valiosa en la identificación de genes candidatos. En esta revisión, describimos el enfoque utilizado recientemente para los análisis genéticos (mapeo de ligamiento o mapeo de asociación), y luego proporcionamos los conceptos genéticos y estadísticos básicos de GWAS y, posteriormente, destacamos los descubrimientos genéticos utilizando GWAS. La revisión explicó cómo se pueden detectar los genes candidatos utilizando herramientas bioinformáticas de última generación.


Contenido

Las posiciones del genoma se representan mejor en formato BED. UCSC proporciona herramientas para convertir archivos BED de un ensamblaje de genoma a otro.

Herramienta binaria liftOver

Proporcionar un archivo en formato BED (por ejemplo, input.bed)

NOTA: Use la 'chr' antes de cada nombre de cromosoma

El archivo unlifted.bed contendrá todas las posiciones del genoma que no se pueden levantar. La razón de eso varía. Consulte Varias razones por las que el levantamiento podría fallar

Interfaz web

Alternativamente, puede levantar el archivo BED en la interfaz web en: Enlace La interfaz web puede decirle por qué no se puede levantar la posición del genoma si hace clic en "Explicar los mensajes de falla"


Resultados

Estadística descriptiva general

Las estadísticas descriptivas generales de las características analizadas se detallan en la Tabla 1. Se estudiaron cinco características en la cebada de primavera y cinco en el trigo de invierno. El número de parcelas en mildiú polvoriento y ramularia fue menor que para otros rasgos porque solo se registró una parcela por año y por ubicación en este estudio. En general, la distribución de todos los rasgos mostró distribuciones cercanas a las normales, pero el mildiú polvoroso estaba sesgado ya que el 90% de todos los registros se calificaron como sin infección. El PCA señaló que los dos primeros componentes principales explicaban el 33% y el 12% de la varianza total entre los marcadores para la cebada de primavera y el 54% y el 11% para el trigo de invierno (Fig. 1). Con base en la información genómica, los resultados mostraron que las líneas, en general, se agruparon en familias tanto en cebada de primavera como en trigo de invierno. El mapa de calor de la relación genómica (datos no mostrados, ya que se informaron resultados similares 26,27) utilizando un conjunto de datos similar también condujo al mismo resultado para ambos cultivos 26,27. La raíz cuadrada de las heredabilidades genómicas de la parcela de sentido estrecho para todos los rasgos se da en la Fig. 2 para la cebada y en la Fig. 3 para el trigo de invierno. Para la cebada de primavera, la heredabilidad genómica de la parcela de sentido estrecho fue del 24% en rendimiento, 11% en mildiú polvoriento y 13% en ramularia. Para el trigo de invierno, la heredabilidad genómica de la parcela de sentido estrecho fue del 33% en rendimiento, 39% en contenido de proteína y 12% en valor Zeleny. La correlación fenotípica de rasgos fue generalmente más baja que la correlación genética entre diferentes rasgos en ambas especies (Tablas 2 y 3).


Resultados

Evaluación fenotípica de la arquitectura de rasgos de las plántulas en condiciones de crecimiento contrastantes

En total, se registraron diez rasgos bajo dos tratamientos de humedad diferentes. Además, se calculó el DSI y se utilizó como un rasgo derivado de GWAS. Se detectó una amplia gama de variación fenotípica para todos los rasgos (Tabla 1, Archivo adicional 1: Tabla S3). Los AZULES fenotípicos de todos los rasgos junto con su varianza disminuyeron drásticamente bajo el tratamiento de estrés (Fig. 1). Las reducciones más bajas se observaron para Sl y Sdw (7 y 9%, respectivamente), mientras que las reducciones más fuertes se obtuvieron para Trv y Rdw (50 y 36%, respectivamente). Se observaron reducciones considerables en el coeficiente de variación (CV) en el tratamiento de estrés osmótico para los cuatro rasgos de la raíz basados ​​en imágenes, que van desde el 4% (Rth) al 51% (Trv) (Archivo adicional 1: Tabla S3). Además, los valores de heredabilidad fueron más bajos bajo estrés (rango 0,20-0,68) en comparación con las condiciones sin estrés (rango 0,37-0,78 Archivo adicional 1: Tabla S4), que es comparable a los rasgos registrados manualmente [69]. En ambos tratamientos, Trl y Nmr tuvieron la heredabilidad más baja. En condiciones sin estrés, todos los rasgos adicionales exhibieron heredabilidades & gt 0.5, el más alto mostrado por Rsr (0.78) y Rth (0.75), mientras que en condiciones de estrés, siete rasgos mostraron heredabilidades & lt 0.5. Los tres rasgos con mayor heredabilidad en estrés fueron R1, Sdw y Sl (0,68, 0,54 y 0,53, respectivamente). Los valores de heredabilidad y coeficientes de variación más bajos bajo condiciones de estrés impuestas indican la complejidad de la respuesta genotípica al estrés y la variación ambiental. Además, la respuesta de reducción fue más pronunciada para Trv (50,5%), seguida de Rdw y Rl (35,9 y 28,6%, respectivamente), lo que sugiere que los componentes de la biomasa de la raíz se vieron más afectados cuando se impuso el estrés, mientras que Rth y Nmr fueron menos fuertes. reducido (17,4 y 11,9%, respectivamente). Las menos afectadas fueron Sl y Sdw (7.1 y 9.1%, respectivamente), lo que demuestra que la mayoría de las accesiones estaban invirtiendo más en biomasa de brotes bajo estrés osmótico.

Parcelas de caja para rasgos de raíces y plántulas. Las líneas centrales muestran que los límites del cuadro de las medianas indican los percentiles 25 y 75 según lo determinado por el software R.Los bigotes se extienden 1,5 veces el rango intercuartílico desde los percentiles 25 y 75, los valores atípicos están representados por puntos, los puntos de datos se trazan como círculos abiertos. Los valores de los rasgos para Rsc, Rss, Rthc y Rths se transforman multiplicando por 100 para las visualizaciones

Se observaron correlaciones positivas significativas entre los rasgos de las plántulas dentro de ambos tratamientos, excepto para Rs (Fig. 2). Entre los rasgos basados ​​en imágenes, Trv mostró la correlación positiva más fuerte con Rdw en todos los tratamientos, mientras que Nmr y Rth mostraron valores de correlación moderada a baja. En general, el estrés redujo la mayoría de las correlaciones entre varios rasgos, pero mostraron relaciones similares en ambos tratamientos de acuerdo con [21].

Correlaciones entre rasgos de raíces y plántulas en condiciones de estrés osmótico o sin estrés. Las correlaciones se muestran como mapa de calor y como valor numérico. Rojo = correlación negativa, azul = correlación positiva. La parte por encima de la diagonal presenta correlaciones de rasgos solo dentro del tratamiento sin estrés y por debajo de la diagonal solo dentro del tratamiento de estrés. A lo largo de las diagonales se muestran las correlaciones entre el mismo rasgo en ambos tratamientos. Los valores de correlación por encima de 0,2 y por debajo de −0,2 son significativos (PAG & lt 0.01)

Influencia de la estructura de la población

El presente panel comprendió 223 genotipos de una población bien estudiada y diez genotipos adicionales. La estructura de la población en esta población fue investigada extensamente por [46] y reveló seis subgrupos según el tipo de fila y el origen geográfico. En GWAS, el parentesco era completamente suficiente para controlar los efectos de confusión de la estructura de la población. Sin embargo, hemos investigado la estructura de la población en el panel extendido utilizando la Estructura 2.0. De acuerdo con [46] la colección agrupada según el tipo de fila y el origen (Archivo adicional 1: Tabla S5, Archivo adicional 2: nota complementaria y Figura S2). Los nueve genotipos adicionales de dos filas se agruparon dentro del grupo 5 (genotipos europeos de dos filas), mientras que el único genotipo adicional de seis filas se agrupó entre el grupo europeo de seis filas 9. Probamos si el factor principal de la estructura de la población (tipo de fila) afectado nuestros rasgos fenotípicos. En el control, solo un rasgo fue significativamente diferente (Trlc), mientras que bajo estrés, seis rasgos mostraron diferencias, en todos los casos los genotipos de dos filas se desempeñaron mejor (Archivo adicional 1: Tabla S6).

Exploraciones de asociación de todo el genoma en busca de rasgos de raíces y brotes

Se utilizó un conjunto de 4966 marcadores SNP mapeados y filtrados por calidad para GWAS, que se distribuyeron uniformemente en los siete cromosomas con un espaciado medio de 4,97 cM. El número de marcadores varió entre los cromosomas con un mínimo de 483 SNP en el cromosoma 1H y un máximo de 967 SNP en el cromosoma 5H (archivo adicional 1: Tabla S7).

En total, se detectaron 519 asociaciones de marcador-rasgo (Archivo adicional 1: Tabla S8), en base a 323 SNP que estaban asociados con uno (234 SNP) yo dos y hasta cinco rasgos (89 SNP). Para todos los rasgos analizados, se detectaron asociaciones significativas para diecinueve rasgos en los siete cromosomas (Figs. 3 y 4), mientras que no se identificaron asociaciones significativas para Nmrs y Dsi.

Manhattan representa 12 de los 21 rasgos de raíces y brotes. El eje horizontal presenta siete cromosomas (1H-7H) del genoma de la cebada. El eje vertical muestra los valores -log10 (P) de las asociaciones marcador-rasgo. La línea verde horizontal muestra el valor de umbral basado en FDR (0.05). Además, la línea discontinua significa el umbral de -log (p) = 4.0

Manhattan representa 9 de 21 rasgos de raíces y brotes. El eje horizontal presenta siete cromosomas (1H-7H) del genoma de la cebada. El eje vertical muestra los valores -log10 (P) de las asociaciones marcador-rasgo. La línea verde horizontal muestra el valor de umbral basado en FDR (0.05). Además, la línea discontinua significa el umbral de -log (p) = 4.0

Los SNP asociados a corta distancia se agruparon en regiones QTL en función de la desintegración de LD promedio de

3,5 cM (datos no mostrados) debido a bloques LD diferenciales para cromosomas individuales y, por lo tanto, una desintegración variable a través de los cromosomas (archivo adicional 2: Figura S3). Esto nos permitió detectar 65 regiones QTL (Fig. 5, Archivo adicional 1: Tabla S8). El mayor número de QTL se identificó en los cromosomas 2H (13), 5H (11), 3H (10) y 7H (10), y el menor se encontró en 6H (3). En total, 26 de las 65 regiones QTL corresponden a rasgos de ambos tratamientos, mientras que 27 y 12 corresponden a rasgos del tratamiento sin estrés o de estrés, respectivamente. Esto puede reflejar las heredabilidades reducidas obtenidas en condiciones de estrés.

Posiciones genéticas (cM) de 65 regiones QTL para la arquitectura de plántulas de raíces y brotes colocadas en un mapa esquemático de los siete cromosomas de cebada junto con el nombre QTL correspondiente (consulte el archivo adicional 1: Tabla S5 para obtener todos los detalles). Los puntos calientes de QTL están resaltados en verde, el QTL específico de la raíz en naranja, el QTL específico del estrés en rosa y el QTL no específico restante en negro. Las regiones centroméricas están indicadas por segmentos rojos.

Además, definimos un QTL como un QTL de hotspot si al menos cinco de los diez rasgos estaban asociados a esta región. En total, identificamos once hotspots QTL y observamos una concentración de cinco hotspots solos en 2H (QTL-2H-3, QTL-2H-6, QTL-2H-7, QTL-2H-8, QTL-2H-11), mientras que los restantes se ubicaron en 1H (QTL-1H-3), 4H (QTL-4H-4), 5H (QTL-5H-1, QTL-5H-6) y 7H (QTL-7H-6, QTL-7H -10). Todos los puntos calientes se asociaron con rasgos de ambos tratamientos.

Exploración y prueba de genes candidatos

Mediante conjeturas fundamentadas, se estableció una lista de genes candidatos (CG) (Archivo adicional 1: Tabla S8). Identificamos CG del desarrollo, del tiempo de floración, relacionados con el estrés y que afectan a las raíces a partir del ensamblaje del genoma de la cebada anotado recientemente [70]. Además, se identificaron homólogos de genes relacionados con la morfología de las raíces de Arabidopsis, arroz y maíz. Por lo tanto, se identificaron los GC cercanos a nuestras regiones QTL que creemos que son candidatos adecuados para los rasgos asociados. Sin embargo, el enfoque no es exacto, en particular en las regiones centroméricas donde la recombinación es baja y el intervalo QTL es grande. Para probar aún más los polimorfismos dentro de los GC potenciales para asociaciones, reunimos los polimorfismos de estos GC utilizando dos enfoques: i) utilización de datos de GBS para la colección de cebada IPK [84] y ii) re-secuenciación de fragmentos de GC dentro del panel de asociación.

De 113 CG potenciales (Archivo adicional 1: Tabla S8), 128 SNP de 39 CG se recuperaron mediante el enfoque GBS. Sin embargo, después de filtrar los datos faltantes y MAF, 71 SNP de 29 CG se probaron para asociaciones con nuestros 21 rasgos con el mismo modelo que en GWAS. La asociación entre rasgos y CG-SNP con –log (p) -valor & gt 2 se obtuvo para 17 CG diferentes (Archivo adicional 1: Tabla S9), revelando un número de 12 CG que pueden excluirse como CG porque tenían asociaciones más débiles. Para nueve GC, el valor –log (p) en GWAS fue mayor en la región QTL correspondiente. Esto sugiere que pasamos por alto el SNP causal o no hemos alcanzado el GC correcto y, por lo tanto, estos nueve genes siguen siendo GC potenciales. Sin embargo, 15 asociaciones correspondientes a ocho GC tenían un valor -log (p) similar al de GWAS (diferencia máxima 0,3 menor) o incluso un valor -log (p) -log (p) más alto y, por lo tanto, apoyan al gen como GC. El resultado más sorprendente provino de un SNP de PIN7 asociado con Rthc, donde el –log (p) -valor fue 5.92 mientras que en GWAS el más alto fue solo 4.02 en la región QTL correspondiente.

En el segundo enfoque, los fragmentos de doce CG se volvieron a secuenciar para la mayoría de las accesiones del panel GWAS (archivo adicional 1: Tabla S2). Estos genes comprendían dos genes del tiempo de floración (HvPpd-H1 y HvCEN) y diez genes candidatos relacionados con el crecimiento de la raíz, dos de ellos elegidos fuera de las regiones QTL detectadas en este estudio. De los doce fragmentos de CG, ocho mostraron asociaciones de rasgos importantes (Archivo adicional 1: Tabla S10, Archivo adicional 2: Fig. S4), mientras que cuatro genes fueron rechazados como CG (HvCEN, ABP1, PRC2, PIN2). Seis GC tenían asociaciones similares o superiores en comparación con GWAS y se admiten como el GC correcto (HvPpD-H1, TRX-m3, HvEXPB1, WOX5, PIN5, HvARF04). Los otros dos genes siguen siendo CG potenciales (HvCKX5, GNOM).

Dos GC fueron cubiertos por ambos enfoques, GBS y re-secuenciación. Ambos revelaron un rechazo a PIN2 como CG detrás de QTL-7H-9 específico de la raíz y ambos sugieren un papel de TRX-m3 como CG para el hotspot QTL-2H-6. Sin embargo, algunas asociaciones de TRX-m3 basados ​​en la nueva secuenciación fueron similares o superiores en comparación con GWAS y, por lo tanto, admiten TRX-m3 como GC, mientras que según el enfoque GBS, el gen sigue siendo un GC potencial. Sin embargo, solo un SNP del gen estaba disponible en los datos de GBS en comparación con siete de la nueva secuenciación.

En resumen, se probaron 39 GC en busca de asociaciones con rasgos fenotípicos mediante uno o dos de los enfoques de asociación de GC. En total, catorce GC son admitidos como candidatos, mientras que diez siguen siendo GC potenciales (asociación no tan alta como en GWAS) y quince pueden ser rechazados como GC (Tabla 2).


Variación genómica estructural en rosa

Variación genómica interespecífica

En el género Rosa la cantidad de ADN 2C en especies diploides varía de 0,78 pg en Rosa xantina (sección Pimpinellifoliae) a 1,29 pg en ‘Félicité and Perpétue’ (híbrido Sempervirens) 67 y desde 0,73 pg en R. zhongdianensis (sección Pimpinellifoliae) a 1,77 pg en R. brunonii (sección Synstylae) 68. El recientemente secuenciado R. chinensis se encuentra entre los genomas más grandes conocidos entre las rosas diploides (estimado en 1,16 pg 67 a 1,67 pg 68). Rosas de la Pimpinellifoliae sección generalmente tienen el tamaño de genoma más pequeño, mientras que Synstylae las rosas tienen los genomas más grandes 68.

La variación del tamaño del genoma en las angiospermas se asocia típicamente con dos tipos de eventos: duplicación del genoma completo (WGD) o amplificación de elementos transponibles 69,70. Con respecto a este último, aproximadamente el 68% de los R. chinensis La secuencia del genoma de referencia consta de elementos transponibles, especialmente retrotransposones repetidos terminales largos como gitano y Copia elementos 5. Para la mayoría de las familias de elementos transponibles, se encontró una abundancia dos veces mayor en Rosa en comparación con Fragaria vesca 5, explicando una parte sustancial de la diferencia de tamaño del genoma entre R. chinensis y F. vesca. Secuencia de escopeta superficial de un conjunto completo de especies de todo el género Rosa y la posterior agrupación y cuantificación de secuencias repetitivas revelará si existen elementos repetitivos específicos de la especie. Se necesitará una (re) secuenciación más extensa para determinar si la amplificación diferencial de los elementos transponibles puede explicar la variación en el tamaño del genoma entre las especies de rosas.

Además del papel de los elementos transponibles en la evolución del tamaño del genoma, la inserción de copia elementos en genes específicos que codifican proteínas 5,71 dieron lugar a dos de los rasgos hortícolas más importantes: flor doble y floración recurrente (ver más abajo). La cría de rosas en general puede haber favorecido a las especies de secciones con genomas grandes, ya que se sabe que la actividad de los transposones crea diversidad alélica 72. Una cuestión relacionada es si la actividad de los retrotransposones es mayor en los taxones tetraploides en comparación con los diploides, y si esto también ha llevado a una variación funcional que sea útil para el valor ornamental de las rosas.

El ensamblaje del genoma completo y la predicción de genes no han revelado signos de eventos recientes de WGD en R. chinensis 4,5. Además, a pesar de la diferencia en el tamaño del genoma, el 240 Mb F. vesca El genoma contiene 34,809 genes predichos 73, mientras que el "Old Blush" de 560 Mb R. chinensis El genoma tiene solo una fracción más de genes predichos (39,669 genes 5 36,377 genes 4).

Genómica comparativa de rosas

Desde un punto de vista evolutivo, la rosa es una especie modelo muy interesante, ya que incluye especies en varios niveles de ploidía, así como muchos cultivares con un origen híbrido 74. La secuenciación de miles de individuos en Arabidospis thaliana 75, arroz 76 y maíz 77 han demostrado grandes diferencias en la constitución del genoma incluso entre accesiones dentro de una especie, lo que lleva a la definición de genes 'centrales' (que están presentes en todos los miembros de una especie) y 'distribuidos' o 'prescindibles' genes (presentes en un subconjunto de miembros). El "pangenoma" representa el complemento completo del genoma en todos los miembros de la muestra.

Las estrategias de ensamblaje de tipo metagenoma en el arroz 76 y un análisis de 3010 accesiones de arroz re-secuenciadas 78 revelaron que las familias de genes "distribuidos" mostraron un enriquecimiento en la regulación de las respuestas inmunes y de defensa. Otros estudios también revelaron su papel en la adaptación al estrés abiótico y biótico 79, la diversificación de especies y el desarrollo de funciones genéticas novedosas 80. Ensamblaje (meta) genoma y anotación genética de especies en todo el Rosa género y en especies estrechamente relacionadas, y se requerirá genómica comparativa posterior para definir si la rosa también tiene genes conservados y específicos de linaje, sección y / o especie. Una de las posibles hipótesis es que la resistencia (R) genes se comportan como una familia de genes de grupo prescindible, mientras que la susceptibilidad (S) los genes generalmente serían miembros de familias de genes centrales. Para que se responda a estas preguntas, será necesario recopilar y analizar las secuencias del genoma de las especies y accesiones del género que representan la diversidad taxonómica, pero también la diversidad en las diversas condiciones abióticas y bióticas en las que crecen las rosas.

Entre los casos más interesantes para estudiar en rosas está la cuestión de los genes de resistencia. La secuenciación de clones de cromosomas artificiales bacterianos (BAC) alrededor del Rdr1 locus, contribuyendo a la resistencia de la mancha negra rosa, en R. multiflora (9 TIR-NBS-LRR (TNL) genes) y R. rugosa (11 TNL genes) permitieron descubrir tanto reordenamientos como duplicaciones en este locus 81,82. Se necesita un análisis más amplio de los grupos de genes de resistencia en las rosas para comprender cómo su organización y evolución se pueden asociar con los niveles de resistencia.


Estudio de asociación del genoma completo (GWAS) para la tasa de crecimiento y la edad de maduración sexual en el salmón del Atlántico (Salmo salar)

El crecimiento y la edad de maduración sexual se encuentran entre los rasgos económicos más importantes del salmón del Atlántico (Salmo salar) acuicultura, con peces que han sido seleccionados continuamente por estos rasgos desde el comienzo de los programas de cría selectiva en Noruega en la década de 1970 [1 & ndash3]. La maduración sexual temprana se considera un serio inconveniente para la acuicultura, ya que retrasa el crecimiento durante varios meses al tiempo que afecta la calidad de la carne y los tiempos de producción en general [4,5]. La maduración tardía, por otro lado, es un rasgo deseable en muchos programas de cría de peces porque puede conducir a un tamaño corporal más grande y una mayor fecundidad [6 & ndash8] sin embargo, la maduración tardía también significa tiempos de generación más largos, lo que podría ser desventajoso para la producción acuícola donde la generación corta Los intervalos se consideran beneficiosos ya que una mayor tasa de crecimiento y una menor edad de madurez permiten a los productores de animales de granja acortar un ciclo de producción. Estos rasgos, crecimiento y edad de maduración sexual, son procesos fisiológicos complejos controlados por factores genéticos y ambientales, incluidos los aspectos cualitativos y cuantitativos de la disponibilidad nutricional, interacciones conductuales condicionadas por demografía intra e interespecífica y cambios estacionales [9,10]. El efecto de múltiples factores sobre estos rasgos y su variación hereditaria entre y dentro de las poblaciones de salmón del Atlántico ha sido descrito por García de Leaniz et al. [11]. A pesar del elevado número de factores ambientales que pueden influir directa o indirectamente en el crecimiento, se ha informado que las heredabilidades del crecimiento y la edad en la madurez muestran niveles moderados en la mayoría de los casos [2,3,11 & ndash15]. Este escenario hace plausible la selección artificial de estos rasgos, lo que permite su mejora mediante la cría selectiva.

Los avances en la investigación genómica han mejorado significativamente las herramientas disponibles para el estudio de rasgos comercialmente importantes utilizando análisis de loci de rasgos cuantitativos (QTL). El uso de marcadores moleculares diseminados por el genoma y los efectos de la segregación de alelos se emplean para determinar el número, las posiciones y la magnitud del QTL que afecta a un rasgo mediante asociaciones estadísticas entre el genotipo marcador y los fenotipos de rasgos particulares. La capacidad de determinar las regiones cromosómicas que afectan los rasgos económicamente importantes ha llevado a la implementación de la cría selectiva basada en prácticas de selección genética mediante la identificación de animales con genotipos favorables. En la acuicultura del salmón del Atlántico, la selección asistida por marcadores (MAS) podría ser una valiosa adición a los programas actuales de reproducción selectiva al mejorar la precisión de la selección y, por lo tanto, la ganancia genética [16]. Esto es particularmente cierto para aquellos rasgos como la resistencia a enfermedades, la calidad de la carne y la absorción de pigmento que son difíciles de medir en los reproductores reales [17]. En este sentido, un ejemplo práctico de MAS en el salmón del Atlántico es el uso de un QTL que explica una alta proporción de la varianza total para la resistencia contra el virus de la necrosis pancreática infecciosa [18 & ndash20], que se está implementando en programas comerciales de cría.

En las últimas décadas, el QTL en salmónidos se ha detectado principalmente mediante métodos de mapeo de ligamiento utilizando un número relativamente pequeño de marcadores de microsatélites distribuidos por el genoma. En consecuencia, la mayoría de los QTL identificados abarcan una gran región cromosómica, a partir de la cual la identificación de uno o más genes causantes es problemática. Varios estudios han descrito el QTL asociado con el crecimiento y / o la maduración sexual en especies de salmónidos, incluido el salmón del Atlántico [21 & ndash25], la trucha arco iris [26 & ndash29], el salmón coho [30,31] y la trucha ártica [24,32]. Sin embargo, la información sobre genes candidatos ubicados en estas regiones QTL es escasa para la mayoría de las especies. En la trucha arco iris, sin embargo, se localizó un gen Clock en un tiempo de desove fuerte QTL [33]. Estudios previos llevados a cabo en otras especies de salmónidos como la trucha arco iris y la trucha ártica han mostrado un vínculo aparente entre QTL para la maduración y el crecimiento sexual [24, 26, 28] sin embargo, evidencia reciente sugiere que en el salmón del Atlántico estos rasgos son independientes entre sí [ 34].

Con la aparición de nuevas tecnologías de secuenciación es posible obtener miles de marcadores de polimorfismo de un solo nucleótido (SNP) para el genotipado de poblaciones, lo que ha permitido la construcción de mapas genéticos de alta densidad [35]. Las tecnologías de matriz de SNP actuales proporcionan mejores herramientas para la identificación de QTL y marcadores específicos asociados con rasgos de interés que lo que era posible utilizando marcadores de microsatélites. Para el salmón del Atlántico en particular, se desarrolló un SNP de 6.5K [36,37] que resultó en un mapa de enlace SNP con marcadores & sim 5,500 [38]. Anteriormente hicimos uso de esta matriz de SNP para realizar análisis de QTL para el peso corporal en diferentes momentos durante un ciclo de producción de salmón del Atlántico [39] y, posteriormente, para la edad de maduración sexual [34]. Teníamos curiosidad por determinar si se obtendrían resultados similares (es decir, ubicaciones genómicas y marcadores genéticos específicos) utilizando un enfoque estadístico diferente, a saber, un estudio de asociación de todo el genoma (GWAS). GWAS evalúa la asociación de marcadores genéticos con un rasgo basándose en los niveles de desequilibrio de ligamiento (LD) entre los marcadores y la variación genética que afecta el rasgo, probando la asociación de cada SNP y, por lo tanto, haciendo posible la identificación de alelos específicos asociados con el rasgo.

A continuación, presentamos los resultados de nuestro GWAS en la población de reproductores de salmón del Atlántico de Cermaq (anteriormente Mainstream) Canadá que utiliza la matriz de SNP de 6.5K de salmón del Atlántico [36,37]. Analizamos el crecimiento de esta población comercial en términos de días para alcanzar los 5 kg y también la edad de maduración sexual. Como GWAS no se basa en asociaciones dentro de una familia como lo hace el análisis QTL, pudimos aumentar el poder para detectar la asociación entre marcadores y rasgos al incluir 192 salmones del Atlántico adicionales en todos los análisis y 160 muestras adicionales (80 grilse y 80 normalmente maduración del salmón del Atlántico) para el asado GWAS. Hasta donde sabemos, el presente estudio representa el primer GWAS para el crecimiento y la edad de maduración sexual en una especie de salmónidos.

Materiales y métodos

Muestras y datos fenotípicos

En este momento, el Canadian Council on Animal Care no tiene pautas formales para el uso de ADN obtenido de tejidos. Por lo tanto, para los propósitos de esta investigación, no se requirió un permiso de Cuidado Animal del Comité Universitario de Cuidado Animal de la Universidad Simon Fraser. Las muestras procedían de un programa de cría comercial desarrollado por Cermaq (antes Mainstream) Canadá y basado en la cepa Mowi de salmón del Atlántico, que se derivó de un programa de cría establecido utilizando poblaciones noruegas [40]. En noviembre / diciembre de 2005, se establecieron 130 familias de apareamiento de un solo par. En la etapa de alevines (febrero de 2006) se agruparon 120 crías de cada familia (15,600 peces en total) y se cultivaron en comunidad en el Oceans Farms Hatchery, en la isla de Vancouver. En septiembre / octubre de 2006, 5.000 de los peces fueron marcados con PIT (transpondedor integrado pasivo) y se tomaron medidas fenotípicas hasta principios de 2009. El ADN extraído de los clips de aleta permitió la posterior asignación parental mediante el uso de microsatélites [41]. Se seleccionaron para el análisis cinco familias de hermanos completos que comprenden 279 individuos (incluidos los padres). Las cinco familias denominadas F007, F023, F076, F088 y F107 contenían 51, 62, 45, 46 y 65 progenie, respectivamente [39]. Incluimos 192 padres de salmón del Atlántico adicionales del mismo año de reproductores (BY) 2005 en todos los los análisis. Para el análisis de parrilla, también incluimos 160 muestras adicionales (80 grilse / 80 de salmón del Atlántico de maduración normal).

Las medidas del peso corporal se tomaron como se describe en nuestro análisis anterior [39]. Con base en las mediciones de peso tomadas en momentos durante el ciclo de producción, se calculó el número de días necesarios para alcanzar un peso de mercado de 5 kg para todos los peces. Los tiempos de maduración se clasificaron en: precoz (& le 12 meses de edad), grilse (36 meses de edad, en el 1er invierno marino (SO)), maduración normal (48 a 60 meses de edad en el segundo SO o tercer SO), y peces de maduración tardía (& gt60 meses). Para nuestros análisis, la madurez se definió como un rasgo binario en el que grilse se registró como 1 y los peces con maduración normal se registraron como 0 para el análisis de maduración tardía, los peces que maduraron después de 60 meses se registraron como 1 y los que normalmente maduraban como 0. El sexo fue registrado durante la confirmación del estado de maduración de las gónadas de los peces que maduran hasta los 60 meses. El sexo de los peces de maduración tardía se determinó por la presencia del gen sdY según Eisbrenner et al. [42].

Mapeo de enlaces y matrices SNP

Los datos de SNP utilizados para este análisis se han descrito anteriormente [39]. Se seleccionaron cinco familias para el genotipado de SNP en CIGENE, Universidad Noruega de Ciencias de la Vida y Arings, Noruega, utilizando una matriz de SNP Illumina iSelect de salmón del Atlántico de 6,5 K [36,37]. Los análisis se basaron en un mapa de vinculación del salmón del Atlántico, que contiene & sim5,650 marcadores SNP y se construyó utilizando datos de genotipado de 143 familias que comprenden 3297 peces [38]. Este mapa contiene 29 grupos de ligamiento, que fueron asignados a su número de cromosoma específico de acuerdo con la nomenclatura establecida por Phillips. et al. [43]. Un total de 471 peces fueron genotipados para el GWAS. Se realizó un control de calidad (QC) y aquellos marcadores con una tasa de llamada inferior al 95% y una frecuencia alélica mínima inferior a 0,05 se filtraron y excluyeron del análisis.

Estudio de asociación de genoma completo

GWAS se llevó a cabo utilizando la biblioteca GenABEL implementada en el entorno estadístico R (http://www.r-project.org). Teniendo en cuenta la presencia de peces estrechamente relacionados en nuestra muestra, utilizamos el enfoque GRAMMAS (asociación de todo el genoma mediante el modelo mixto y la prueba de puntuación) [44,45]. Por lo tanto, usamos la función & ldquopolygenic & rdquo [46] para ajustar tres modelos poligénicos aditivos univariados diferentes que se definieron mediante la siguiente fórmula general: donde Y es el vector de registros fenotípicos (días hasta 5 kg, maduración tardía y grilsing) B es el vector de efectos fijos (sexo por días hasta 5 kg y maduración tardía) a es el efecto fijo del genotipo SNP tu es el efecto genético aditivo aleatorio X y Z son matrices de diseño para B y tu, respectivamente S es el vector de diseño para a y mi es el vector de residuos aleatorios. Para los tres modelos, a y mi se supuso que eran y, respectivamente, donde A es la matriz de parentesco genómico aditivo, es la varianza aditiva poligénica, I es una matriz de identidad y es la varianza residual.

Para tener en cuenta la relación entre individuos mediante una matriz de (co) varianza, la matriz de parentesco A se calculó utilizando datos genómicos. La matriz de parentesco genómico A se estimó utilizando datos de marcadores con el SII (identidad por estado) función y peso = frecuencia opción de GenABEL. Los residuos obtenidos del modelo se utilizaron para realizar una prueba de asociación mediante un método simple de mínimos cuadrados [45 & ndash47]. La significación de todo el genoma se evaluó mediante el uso de dos métodos diferentes: primero, utilizando empíricamente 200 permutaciones y los marcadores con valores p & le 0,05 se consideraron significativos para todo el genoma, y ​​segundo, mediante el método de Bonferroni, en el que la p convencional -valor se dividió por el número de pruebas realizadas. Se consideró que un SNP tenía una significación para todo el genoma en p & lt 0,05 / N y una significación para todo el cromosoma en p & lt 0,05 / Nc, donde N es el número total de SNP utilizados en nuestro estudio y Nc es el número de SNP en un cromosoma particular.

Desequilibrio de ligamiento

Los niveles de desequilibrio de ligamiento como r 2 se calcularon utilizando el paquete GenABEL, con el fin de evaluar la capacidad de los SNP disponibles para capturar la variación genética de los rasgos analizados. Se calculó la LD para todos los pares de marcadores adyacentes utilizando todos los padres de la población para evitar la inflación de LD por parte de individuos extremadamente relacionados presentes en los grupos de hermanos completos de la progenie. La extensión y el deterioro de LD con la distancia se analizó con base en la metodología descrita por Heifetz et al. [48]. Brevemente, la ecuación de Sved [49], que relaciona la LD causada por la deriva con la distancia entre marcadores y el tamaño efectivo de la población, se utilizó para resumir la extensión y la disminución de LD con la distancia: donde LDI es el LD observado para el par de marcadores I, DI es la distancia en cM para el par de marcadores I, B es el coeficiente que describe la caída de LD con la distancia, y miI es un residuo aleatorio. Parámetro B se calculó mediante análisis de regresión no lineal.

Las secuencias de nucleótidos correspondientes a los SNP que mostraron una asociación significativa con el crecimiento o la edad en la maduración sexual fueron comparadas por BLAST con el primer ensamblaje del proyecto de secuenciación del genoma del salmón del Atlántico [50], que está disponible públicamente en ASalBase (www.asalbase.org ) y NCBI (http://www.ncbi.nlm.nih.gov/Traces/wgs/?val=AGKD). A continuación, se asignaron marcadores SNP a un contig de escopeta de genoma completo (WGS) específico mediante búsquedas de similitud de secuencia. Los contigs de WGS se anotaron mediante una canalización de anotaciones interna (trutta.mbb.sfu.ca).

Un total de 466 muestras y 3.908 marcadores pasaron el QC y en consecuencia se realizó un GWAS para identificar marcadores significativamente asociados con el crecimiento (en términos de días a 5 kg) y maduración sexual tardía en el salmón del Atlántico. En el caso del análisis de grilsing, 3.873 marcadores y 626 muestras pasaron el control de calidad.

Análisis de asociación de crecimiento (días a 5 kg)

Se encontró que solo un marcador (GCR_cBin15343_Ctg1_36) ubicado en el cromosoma 13 (Ssa13) estaba asociado significativamente (según el método empírico) con el crecimiento (ver Fig.1), pero solo en el nivel de significancia de todo el cromosoma (p & lt 2.55e -4 para Ssa13) según el umbral de Bonferroni. El marcador GCR_cBin15343_Ctg1_36, localizado en Ssa13, se asignó al genoma del salmón del Atlántico contig AGKD01005773 y la anotación de este contig mostró que el marcador está ubicado en una proteína hipotética en la vecindad de una proteína guanilato quinasa asociada a la membrana como se muestra en la Tabla 1.

Fig 1. Resultados de GWAS durante días a 5 kg.

La línea de puntos horizontal representa el umbral significativo de todo el genoma.

Tabla 1. Asociación de días a 5 kg detectada en el análisis.

Análisis de asociación de maduración sexual

El análisis de grilsing identificó cinco marcadores con una asociación significativa en todo el genoma (p & lt 1.29e-5 según el umbral de Bonferroni y p & lt 0.05 para el método de permutación) con el rasgo que se muestra en la Tabla 2. Estos marcadores (ESTNV_20578_482, ESTNV_36582_634, ESTNV_34243_316, GCR_cBin47052_Ctg1_234, ESTNV_15175_311) se encuentran en Ssa10, Ssa02, Ssa13, Ssa25 y Ssa12, respectivamente (Fig.2). El marcador asociado más significativamente ESTNV_20578_482 se encuentra dentro de un factor de transcripción E2F (E2F) y cerca del gen del complejo de transcripción CCR4-NOT. El siguiente marcador más significativo ESTNV_36582_634 se encuentra dentro de un gen de malato deshidrogenasa (MDH) y cerca de un gen de pirofosforilasa de glucosa UDP (UGP). El siguiente marcador que mostró una asociación significativa fue ESTNV_34243_316, un SNP ubicado dentro de un gen PQ Loop Repeat Containing. Los otros dos marcadores que mostraron una asociación significativa en todo el genoma con grilsing se ubicaron en genes no caracterizados, como se muestra en la Tabla 2.

Fig 2. Resultados de GWAS para grilsing.

La línea de puntos horizontal representa el umbral significativo de todo el genoma.

Tabla 2. Asociación de Grilsing detectada en el análisis.

El análisis de maduración tardía detectó asociación con cinco marcadores (ESTNV_22894_922, ESTNV_35192_247, GCR_cBin47084_Ctg1_67, ESTNV_31055_861 y ESTNV_27268_490), que mostraron una asociación significativa en todo el genoma con el rasgo de acuerdo con el umbral de Bonferroni_922t y el umbral de p. ) usando el método de permutación), como se muestra en la Tabla 3. Los dos marcadores más significativos se identifican como ESTNV_22894_922 y ESTNV_35192_247, y están ubicados en los cromosomas Ssa28 y Ssa01, respectivamente (ver Fig. 3). ESTNV_22894_922 es un SNP que se asignó a la secuencia contig AGKD01068032 y por anotación se colocó en la región de codificación de FRA10AC1. ESTNV_35192_247 se asignó a la secuencia contig AGKD01242239 y por anotación se ubicó en la región codificante de una proteína putativa de enmascaramiento del factor asociado a CPEB y se asignó a la secuencia contig AGKD01242239.

Fig 3. Resultados de GWAS para maduración sexual tardía.

La línea de puntos horizontal representa el umbral significativo de todo el genoma.

Tabla 3. Asociación de maduración tardía detectada en el análisis.

Desequilibrio de ligamiento (LD)

Los niveles de LD detectados usando los marcadores disponibles fueron en promedio 0.22 con una mediana de 0.11. El coeficiente estimado de caída de LD al aumentar la distancia (Bj) resultante del modelo (1) fue 6.03, lo que indica que, por ejemplo, el r 2 esperado para los marcadores separados por 1 cM es igual a 0.04. Por lo tanto, nuestros resultados muestran que el alto nivel de LD a distancias más cortas disminuye rápidamente a medida que aumenta la distancia (Fig. S1). Estos niveles de LD pueden ser insuficientes para capturar el efecto de las regiones genómicas que afectan los rasgos cuantitativos usando LD entre dos marcadores. Estos resultados sugieren que la densidad de los SNP utilizados aquí debería mejorarse con el fin de aumentar el poder para detectar la asociación entre rasgos y marcadores.

GWAS pudo identificar al menos un marcador con una asociación significativa en todo el cromosoma para cada rasgo de interés. Especialmente sorprendente fue el bajo número de marcadores con una asociación significativa con el crecimiento del salmón del Atlántico. Solo detectamos un marcador (GCR_cBin15343_Ctg1_36, ubicado en Ssa13) que muestra un significado en todo el cromosoma. Por otro lado, los resultados de GWAS para grilsing encontraron cinco marcadores en asociación significativa de todo el genoma con el rasgo (ESTNV_20578_482, ESTNV_36582_634, ESTNV_34243_316, GCR_cBin47052_Ctg1_234, ESTNV_15175_311 ubicados en diferentes cromosomas), con todos los cromosomas. De manera similar, el análisis de maduración tardía encontró asociación con cinco marcadores (según el umbral de Bonferroni), como se muestra en la Tabla 3. Cuatro de estos SNP están ubicados en dos cromosomas ESTNV_22894_922 y ESTNV_31055_861 están ubicados en Ssa28, pero muy separados entre sí (36,5 cM ), y el otro par de marcadores, ubicado en Ssa01 (ESTNV_35192_247 y ESTNV_27268_490), están separados por 18,4 cM según el mapa de ligamiento de hembras del salmón del Atlántico [35].

Estudios previos que buscaban identificar regiones genómicas asociadas con rasgos fenotípicos han basado sus estudios en el uso de métodos de regresión de mapas de ligamiento y la mayoría de ellos utilizó un número relativamente bajo de marcadores. El QTL de crecimiento, por ejemplo, se ha localizado en la mayoría de los 29 cromosomas del salmón del Atlántico [21 & ndash23,39,51], y se ha observado una situación similar en otras especies de salmónidos como la trucha arco iris y la trucha ártica [24,26,27,52 ]. Como el crecimiento es un rasgo complejo, esperábamos encontrar numerosos marcadores asociados a él. Sorprendentemente, nuestro GWAS solo identificó un marcador en asociación con el crecimiento y este marcador ubicado en Ssa13 solo mostró una asociación significativa en todo el cromosoma con el rasgo (Tabla 1). Este hallazgo fue ciertamente inesperado y es contrario a análisis anteriores en términos del número de regiones vinculadas a este rasgo complejo. Sin embargo, concuerda en parte con los resultados de nuestro análisis anterior [39], en el que encontramos un QTL significativo en todo el genoma en Ssa13 asociado con el crecimiento del salmón del Atlántico. Como el crecimiento es un rasgo poligénico en el salmón del Atlántico, los diferentes resultados obtenidos para el análisis QTL previo [39] y este GWAS en esta población podrían explicarse por algunos loci específicos que tienen un efecto mucho mayor en algunas de las familias individuales, pero estos efectos sobre el rasgo se diluyen a nivel de población donde están involucrados múltiples loci con un efecto relativamente pequeño sobre el rasgo.

El análisis de grilsing reveló cinco asociaciones significativas en todo el cromosoma con el rasgo mediante marcadores ubicados en Ssa10, Ssa02, Ssa13, Ssa25 y Ssa12. De acuerdo con este hallazgo, nuestro trabajo previo de QTL basado en el mapeo de ligamiento describió un QTL sugerente ubicado en Ssa10 [34], pero ubicado en una región diferente del cromosoma. El cromosoma Ssa10 comparte homología con el grupo de ligamiento RT-8 (cromosoma 5 Omy05 [53]) en la trucha arco iris, donde se mapeó un QTL significativo en todo el genoma para la maduración sexual masculina temprana [26,52] y también con el grupo de ligamiento AC-16 en Charr ártico, que contiene un QTL asociado con la edad de maduración sexual [24]. Además, estos cromosomas (y también Ssa13) comparten la ubicación de los genes Clock implicados en la regulación circadiana de muchas funciones fisiológicas, incluida la maduración sexual en los salmónidos [54]. En el salmón del Atlántico, QTL ubicado en Ssa10 y Ssa12 se asociaron recientemente con una maduración precoz de parr [25]. Hasta donde sabemos, no se han identificado QTL asociados con la maduración sexual en Ssa02; sin embargo, se han descrito varios QTL relacionados con el crecimiento en este cromosoma [21 & ndash23,39,51].

GWAS de maduración tardía nos permitió identificar cinco marcadores (ubicados en Ssa28, Ssa01 y Ssa21) que muestran una asociación significativa de todo el genoma con el rasgo, junto con cinco marcadores asociados con el rasgo a nivel de todo el cromosoma, como se muestra en la Tabla 3 Estudios previos que analizaron rasgos relacionados con la maduración sexual en otras especies de salmónidos han identificado QTL en regiones similares. En la trucha arco iris, por ejemplo, se encontró un QTL significativo en todo el genoma asociado con la maduración temprana en el grupo de ligamiento RT-17 (Omy20 [53]), que comparte homología con Ssa28 [26], y también QTL significativo en todo el cromosoma relacionado con el desarrollo tipos [52]. Además del QTL encontrado en Ssa28, estudios previos han descrito QTL en Ssa01 y su equivalente en otras especies de salmónidos. Por ejemplo, un QTL para la edad de maduración sexual en el charr ártico se describió en el grupo de ligamiento AC-9, que comparte homología con Ssa01 [32] y también un QTL para el factor de condición [24]. En el caso de Ssa21, recientemente describimos QTL para grilsing ubicado en el mismo cromosoma, sin embargo, en este análisis se detectó QTL para maduración tardía, lo que sugiere que estas regiones que controlan el desarrollo sexual contienen genes que están involucrados en ambos procesos. Se han descrito QTL en este cromosoma para el salmón del Atlántico en relación con la maduración adulta [25] y en la trucha arco iris para la maduración temprana [26].

La evidencia basada en la literatura actual sugiere que las regiones que controlan la maduración sexual se conservan al menos parcialmente dentro de la trucha arco iris y la trucha ártica [24, 26, 29]. Sin embargo, la arquitectura genética de este rasgo en el salmón del Atlántico todavía parece no estar resuelta. Nuestro análisis anterior en el salmón del Atlántico detectó un QTL significativo ubicado en Ssa21 y Ssa18 para la maduración a la parrilla y tardía, respectivamente, pero no detectó QTL en otros cromosomas [34]. Pedersen y col. [25] recientemente identificó QTL asociado con la maduración adulta en Ssa21 y Ssa23, pero no en Ssa28. Sin embargo, identificaron QTL adicionales que comparten homología con hallazgos anteriores en trucha arco iris y trucha ártica. La diferencia en las poblaciones, el número de muestras, los marcadores y los métodos de detección podrían explicar las diferencias encontradas dentro de los análisis para la misma especie. Además, un estudio reciente de Johnston et al. [55] mostró que las regiones que controlan la maduración sexual en una población salvaje de salmón del Atlántico del norte de Europa son diferentes de las descritas anteriormente en peces de piscifactoría [25, 34]. Además, los autores especulan que las diferencias se deben a diferentes presiones de selección en el salmón del Atlántico salvaje y domesticado [55].

Dados los diferentes resultados obtenidos utilizando el análisis QTL regular y GWAS, creemos que tales discrepancias podrían explicarse por los diferentes enfoques utilizados en estos procedimientos analíticos. Los análisis de QTL estándar hacen uso de la cantidad de recombinación o enlace entre individuos para detectar la asociación entre marcadores y rasgos, lo que lo convierte en un método poderoso cuando se usa un número bajo de marcadores (por ejemplo, microsatélites). Por otro lado, el poder estadístico de GWAS es una función del tamaño de la muestra, el tamaño del efecto y la frecuencia del alelo del marcador [56], y depende del nivel de LD entre los marcadores genéticos para detectar la asociación. Dicho esto, el poder de detección relativamente bajo observado en nuestro análisis de crecimiento (días a 5 kg) podría atribuirse al número de marcadores y muestras analizadas [57]. Estudios recientes [55,57] que utilizaron el mismo chip SNP para analizar rasgos en el salmón del Atlántico mostraron que los niveles de LD no son lo suficientemente altos para capturar toda la variación genética dentro del conjunto de datos, incluso con un tamaño de muestra mayor. Se encontró un resultado similar con respecto a valores bajos de LD entre marcadores adyacentes en nuestros datos analizados (Fig. S1), lo que sugiere que se necesitará un panel de SNP de mayor densidad para explotar completamente LD en GWAS.

El único marcador que mostró una asociación significativa con el crecimiento en términos de días hasta 5 kg (en todo el cromosoma) fue GCR_cBin15343_Ctg1_36, que se encuentra en un gen no caracterizado en Ssa13. Dentro de los 10 kb aguas arriba de la ubicación del SNP encontramos MAGI-1 (guanilato quinasa asociada a la membrana, proteína 1 que contiene el dominio WW y PDZ), una proteína relacionada con el contacto célula-célula, como las uniones estrechas neuronales sinápticas y epiteliales [58 ]. Otro marcador, que no alcanzó el nivel de significación de todo el cromosoma (p & lt 2.23e-4 para Ssa04), fue ESTV_20925_1105, que se encuentra en NPM1 (Nucleophosmin 1) en Ssa04. NPM1 codifica una fosfoproteína nucleolar multifuncional que desempeña un papel crucial en el control de varios aspectos del crecimiento celular y la homeostasis y se ha demostrado que participa en el proceso de crecimiento del ganado [59].

Los genes candidatos vinculados a marcadores asociados con grilsing son numerosos debido al nivel de significación alcanzado por los marcadores en asociación con el rasgo, como se muestra en la Tabla 2. El marcador ESTNV_20578_482 se encuentra en un gen del factor de transcripción E2F. Los genes E2F son efectores descendentes de la vía de la proteína del retinoblastoma (pRB) y son necesarios para la regulación de numerosos genes esenciales para funciones como la replicación del ADN, la progresión del ciclo celular, la reparación del daño del ADN, la apoptosis, la diferenciación y el desarrollo [60 & ndash62]. Además, cerca de la ubicación de este marcador encontramos una subunidad del complejo de transcripción CCR4-NOT, que interactúa con Nanos y es esencial para el desarrollo de células germinales masculinas en el ratón [63]. El siguiente marcador es ESTNV_36582_634 y se encuentra en un gen de malato deshidrogenasa (MDH). Las diferencias en la actividad enzimática de la MDH se han asociado con las tasas de desarrollo en los salmónidos [64,65]. El marcador ESTNV_34243_316 se encuentra en una repetición de bucle PQ que contiene proteína, sin embargo, su función sigue siendo desconocida.

El análisis de la maduración tardía identificó varios marcadores asociados significativamente y, en consecuencia, se identificaron varios genes candidatos. El marcador más significativo ESTNV_22894_922, asignado a Ssa28, se encuentra en un gen novedoso llamado FRA10AC1. Este gen se encuentra dentro del raro sitio frágil sensible al folato FRA10A, y aunque su función sigue siendo desconocida, se sabe que en los humanos el 5 'UTR de este gen es parte de una isla CpG que contiene una región de repetición CGG en tándem (normalmente de 8 & ndash14 se repite pero más de 200 se repite cuando se expande) [66]. La expansión de repeticiones en los sitios frágiles da como resultado una hipermetilación, silenciando el gen subyacente que conduce a la expresión del sitio frágil. Los sitios frágiles se han relacionado con frecuencia con el retraso mental en humanos [67], pero también se asocian con un posible papel en la reorganización del genoma debido a su presencia en regiones cromosómicas implicadas en reordenamientos durante la evolución en vertebrados [68]. El segundo marcador más significativo ESTNV_35192_247 asignado a Ssa01 se localiza en la región codificante de maskin, una proteína que interactúa con CPEB involucrada en la represión de la traducción por su interacción con CPEB (la proteína encargada de la poliadenilación de los ARNm) y principalmente asociada con el control de maduración de ovocitos en Xenopus por represión y des-represión de ARNm [69]. Los ortólogos de FRA10AC1 y maskin están presentes en el genoma del salmón del Atlántico, sin embargo, su función sigue siendo desconocida. Por lo tanto, se requieren más análisis de estos genes para determinar sus posibles roles en la maduración sexual.

Los otros tres SNP que mostraron una asociación significativa en todo el genoma con la maduración tardía se localizaron en genes no caracterizados (Tabla 3). Sin embargo, la base de datos del genoma del salmón del Atlántico disponible públicamente (www.asalbase.org) nos permitió identificar genes cercanos como TTC31, DNAAF2 e INTS6 para los marcadores ESTNV_27268_490, ESTNV_31055_861 y GCR_cBin47084_Ctg1_67, respectivamente.

Posibles implicaciones para la cría selectiva

La mayoría de los rasgos económicamente importantes como el crecimiento y la maduración sexual son rasgos cuantitativos y complejos afectados por varios genes [35,70]. Nuestro GWAS no pudo descubrir una gran cantidad de regiones genómicas asociadas significativamente con el crecimiento. Se observó una situación diferente en el análisis de maduración tardía y grilsing, para lo cual pudimos detectar asociaciones significativas en todo el genoma. Un punto importante a considerar es el hecho de que los marcadores (y sus regiones genómicas) encontrados en asociación con el crecimiento eran diferentes de los relacionados con la edad de maduración sexual. Vale la pena señalar esto considerando que las correlaciones fenotípicas y genéticas significativas entre el crecimiento (estimado por el peso corporal) y la maduración sexual temprana en el salmón del Atlántico se han reportado previamente [13,15,71], y también teniendo en cuenta que una asociación entre crecimiento y La maduración sexual se ha descrito en otras especies de salmónidos [24, 26, 28]. En el salmón del Atlántico, sin embargo, el vínculo entre estos dos rasgos no es concluyente, y la evidencia creciente indica que el crecimiento y la maduración sexual están controlados por regiones separadas del genoma [34,39], lo que también concuerda con los resultados de este estudio en el que los SNP que controlan el crecimiento (días hasta 5 kg) y la maduración sexual eran independientes entre sí. Sin embargo, debido a la complejidad de estos rasgos, es posible que las regiones que controlan el crecimiento y la maduración sexual se superpongan en algún punto del genoma pero tengan un pequeño efecto sobre el rasgo. Pedersen y col. [25] recientemente encontró QTL para parr precoz y maduración adulta en varios cromosomas del salmón del Atlántico que previamente se ha demostrado que contienen QTL de crecimiento, lo que sugiere una interacción de ciertos genes en ambos procesos de desarrollo.

Los niveles estimados de heredabilidad calculados usando una matriz de relaciones basada en el pedigrí, para grilsing y maduración sexual tardía en esta población son bajos: grilse h 2 = 0.09, maduración tardía h 2 = 0.11 (resultados no mostrados), pero de acuerdo con la literatura actual niveles de heredabilidad para la edad en los rasgos de madurez sexual en el salmón del Atlántico (0.04 a 0.17 según lo revisado por García de Leaniz et al. [11]). Por otro lado, se encontró que la heredabilidad del crecimiento (días a 5 kg) era considerablemente más alta (h 2 = 0.2), también de acuerdo con hallazgos previos que estimaron heredabilidades para la tasa de crecimiento y el peso corporal en un rango de 0.04 & ndash0.26 y 0,05 y ndash0,44, respectivamente [11]. Por lo tanto, la selección de estos rasgos es posible y ha estado en curso desde principios de la década de 1970 [3]. Los programas de cría selectiva han sido eficaces para aumentar el tamaño corporal y, al mismo tiempo, controlar la madurez sexual temprana no deseada en peces de piscifactoría [2], lo que sugiere que las principales regiones genómicas que controlan estos rasgos son diferentes. El uso de información de marcadores moleculares podría ser una herramienta valiosa para mejorar los programas convencionales de selección de reproductores mediante la identificación de alelos específicos que luego podrían ser evaluados e introducidos en líneas seleccionadas.

Este GWAS tenía como objetivo identificar las regiones genómicas asociadas con el crecimiento y la maduración sexual. Nuestros resultados anteriores utilizando un método QTL estándar basado en el mapeo de ligamiento nos proporcionaron numerosos QTL, sin embargo, el GWAS detectó un número menor de marcadores con una asociación altamente significativa. Desde un punto de vista biológico, la mayoría de los genes candidatos vinculados a marcadores asociados con un rasgo particular desempeñan un papel en los procesos metabólicos o de desarrollo, sin embargo, sería prematuro asignar un papel importante en el control del rasgo que estaban asociados. Se requieren más estudios, utilizando una matriz de SNP con una densidad más alta, para determinar si estos SNP y sus alelos afectados podrían ser una valiosa adición a los programas de selección de reproductores.

información de soporte

S1 Fig. Extensión y desintegración del desequilibrio de ligamiento (LD) con la distancia.

Concibió y diseñó los experimentos: APG SF BS WSD. Realizados los experimentos: APG SF BS. Analizados los datos: APG JMY. Reactivos / materiales / herramientas de análisis aportados: SF BS. Escribió el artículo: AGP JMY WSD.

Cita: Gutierrez AP, Y & aacute & ntildeez JM, Fukui S, Swift B, Davidson WS (2015) Genome-Wide Association Study (GWAS) para la tasa de crecimiento y la edad de maduración sexual en el salmón del Atlántico (Salmo salar). PLoS ONE 10 (3): e0119730. https://doi.org/10.1371/journal.pone.0119730

1. Gj & oslashen HM, Bentsen HB. Pasado, presente y futuro del mejoramiento genético en la acuicultura del salmón. ICES J Mar Sci. 199754: 1009 y ndash1014.

2. Gjedrem T. Mejora genética de especies de peces de agua fría. Acuicultura Res. 200031: 25 y ndash33.

3. Gjedrem T. Mejora genética para el desarrollo de una acuicultura mundial eficiente: una revisión de la opinión personal. Acuicultura. 2012344 y ndash349: 12 y ndash22.

4. N & aeligvdal G. Factores genéticos en relación con la edad de maduración. Acuicultura 198333: 97 & ndash106.

5. Thorpe JE. Estrategias reproductivas en salmón del Atlántico, Salmo salar L. Aquacult Res. 199425: 77 y ndash87.

6. H & oumlrstgen-Schwark G, Langholz HJ. Perspectivas de selección para madurez tardía en tilapia (Oreochromis niloticus): III. Un experimento de selección en condiciones de laboratorio. Acuicultura. 1998167: 123 y ndash133.

7. Gjerde B. Crecimiento y reproducción en peces y mariscos. Acuicultura. 198657: 37 y ndash55.

8. Kause A, Ritola O, Paananen T, M & aumlntysaari E, Eskelinen U. Selección contra la madurez temprana en la trucha arco iris grande Oncorhynchus mykiss: la genética cuantitativa del dimorfismo sexual y las interacciones genotipo por ambiente. Acuicultura. 2003228: 53 y ndash68.

9. Sumpter JP. Control del crecimiento de la trucha arco iris (Oncorhynchus mykiss). Acuicultura. 1992100: 299 y ndash320.

10. Thorpe JE, Metcalfe NB. ¿Es smolting una decisión de desarrollo positiva o negativa? Acuicultura. 1998168: 95 y ndash103.

11. García de Leaniz C, Fleming IA, Einum S, Verspoor E, Jordan WC, Consuegra S, et al. Una revisión crítica de la variación genética adaptativa en el salmón del Atlántico: implicaciones para la conservación. Biol Rev Camb Philos Soc. 200782: 173 y ndash211. pmid: 17437557

12. Quinton CD, McMillan I, Glebe BD. Desarrollo de un programa de mejoramiento genético del salmón del Atlántico (Salmo salar): parámetros genéticos de peso corporal de cosecha y rasgos de calidad de la canal estimados con modelos animales. Acuicultura. 2005247: 211 y ndash217.

13. Gjerde B, Simianer H, Refstie T. Estimaciones de parámetros genéticos y fenotípicos para el peso corporal, la tasa de crecimiento y la madurez sexual en el salmón del Atlántico. Livest Prod Sci. 1994 38: 133 y ndash143.

14. J & oacutenasson J, Gjedrem T. Correlación genética para el peso corporal del salmón del Atlántico grilse entre peces en la cría de peces en el mar y la agricultura en tierra. Acuicultura. 1997157: 205 y ndash214.

15. Gjerde B. Respuesta a la selección individual por edad de madurez sexual en el salmón del Atlántico. Acuicultura. 198438: 229 y ndash240.

16. Sonesson A. Selección asistida por marcadores dentro de la familia para especies de acuicultura. Genet Sel Evol. 200739: 1 y ndash17.

17. Sonesson AK. Posibilidades de selección asistida por marcadores en esquemas de reproducción acuícola.En: Guimar & atildees E, Ruane J, Scherf B, Sonnino A, Dargie J, editores. Selección asistida por marcadores: estado actual y perspectivas futuras en cultivos, ganadería, silvicultura y pesca. Roma: FAO, 2007 págs. 309 y ndash328.

18. Houston RD, Haley CS, Hamilton A, Guy DR, Tinch AE, Taggart JB, et al. Los principales loci de rasgos cuantitativos afectan la resistencia a la necrosis pancreática infecciosa en el salmón del Atlántico (Salmo salar). Genética. 2008178: 1109 y ndash1115. pmid: 18245341

19. Houston RD, Davey JW, Bishop SC, Lowe NR, Mota-Velasco JC, Hamilton A, et al. Caracterización de marcadores de ADN asociados a sitios de restricción (RAD) ligados a QTL y de todo el genoma en salmón del Atlántico cultivado. BMC Genomics. 201213: 244. pmid: 22702806

20. Moen T, Baranski M, Sonesson A, Kjoglum S. Confirmación y mapeo fino de un QTL principal para la resistencia a la necrosis pancreática infecciosa en el salmón del Atlántico (Salmo salar): asociaciones a nivel de población entre marcadores y rasgo. BMC Genomics. 2009 10: 368. pmid: 19664221

21. Reid DP, Szanto A, Glebe B, Danzmann RG, Ferguson MM. QTL para peso corporal y factor de condición en salmón del Atlántico (Salmo salar): análisis comparativo con trucha arco iris (Oncorhynchus mykiss) y trucha ártica (Salvelinus alpinus). Herencia. 2005 94: 166 y ndash172. pmid: 15483654

22. Boulding EG, Culling M, Glebe B, Berg PR, Lien S, Moen T. Genómica de conservación del salmón del Atlántico: SNP asociados con QTL para rasgos adaptativos en parr de cuatro retrocruces transatlánticos. Herencia. 2008101: 381 y ndash391. pmid: 18648388

23. Baranski M, Moen T, Vage D. Mapeo de loci de rasgos cuantitativos para el color de la carne y los rasgos de crecimiento en el salmón del Atlántico (Salmo salar). Genet Sel Evol.201042: 17. pmid: 20525320

24. Moghadam HK, Poissant J, Fotherby H, Haidle L, Ferguson MM, Danzmann RG. Loci de rasgos cuantitativos para el peso corporal, el factor de condición y la edad de maduración sexual en el charr ártico (Salvelinus alpinus): análisis comparativo con la trucha arco iris (Oncorhynchus mykiss) y el salmón del Atlántico (Salmo salar). Mol Genet Genomics 2007 277: 647 & ndash661. pmid: 17308931

25. Pedersen S, Berg PR, Culling M, Danzmann RG, Glebe B, Leadbeater S, et al. Loci de rasgos cuantitativos para la maduración precoz de parr, la smoltificación temprana y la maduración adulta en salmón transatlántico con doble retrocruzamiento (Salmo salar). Acuicultura. 2013410 y ndash411: 164 y ndash171.

26. Haidle L, Janssen JE, Gharbi K, Moghadam HK, Ferguson MM, Danzmann RG. Determinación de loci de rasgos cuantitativos (QTL) para la maduración temprana en trucha arco iris (Oncorhynchus mykiss). Mar Biotechnol. 200810: 579 y ndash592. pmid: 18491191

27. Wringe BF, Devlin RH, Ferguson MM, Moghadam HK, Sakhrani D, Danzmann RG. Loci de rasgos cuantitativos relacionados con el crecimiento en trucha arco iris doméstica y salvaje (Oncorhynchus mykiss). BMC Genet. 201011: 63. pmid: 20609225

28. Martyniuk CJ, Perry GML, Mogahadam HK, Ferguson MM, Danzmann RG. La arquitectura genética de las correlaciones entre los rasgos relacionados con el crecimiento y la edad de madurez de los machos en la trucha arco iris. J Fish Biol. 200363: 746 y ndash764.

29. O'Malley KG, Sakamoto T, Danzmann RG, Ferguson MM. Loci de rasgos cuantitativos para la fecha de desove y el peso corporal en la trucha arco iris: prueba de efectos conservados en cromosomas duplicados ancestralmente. J Hered. 200394: 273 y ndash284. pmid: 12920098

30. O'Malley KG, McClelland EK, Naish KA. Los genes de reloj se localizan en loci de rasgos cuantitativos para el crecimiento específico de la etapa en el salmón coho juvenil, Oncorhynchus kisutch. J Hered. 2010101: 628 y ndash632. pmid: 20566470

31. McClelland EK, Naish KA. Análisis cuantitativo del locus de rasgos del tiempo de nacimiento, peso, longitud y tasa de crecimiento en salmón coho, Oncorhynchus kisutch. Herencia. 2010 105: 562 y ndash573. pmid: 20234386

32. K & uumlttner E, Moghadam HK, Sk & uacutelason S, Danzmann RG, Ferguson MM. Arquitectura genética del peso corporal, factor de condición y edad de maduración sexual en el charr ártico islandés (Salvelinus alpinus). Mol Genet Genomics. 2011286: 1 y ndash13. pmid: 21547562

33. Leder EH, Danzmann RG, Ferguson MM. El gen candidato, el reloj, se localiza en una región de locus de rasgo cuantitativo de tiempo de desove fuerte en la trucha arco iris. J Hered. 2006 97: 74 y ndash80. pmid: 16407529

34. Gutiérrez AP, Lubieniecki KP, Fukui S, Withler RE, Swift B, Davidson WS. Detección de loci de rasgos cuantitativos (QTL) relacionados con la parrillada y la maduración sexual tardía en el salmón del Atlántico (Salmo salar). Mar Biotechnol. 2013: 1 y ndash8.

35. Goddard ME, Hayes BJ. Mapeo de genes para rasgos complejos en animales domésticos y su uso en programas de reproducción. Nat Rev Genet. 200910: 381 y ndash391. pmid: 19448663

36. Kent MP, Hayes B, Xiang Q, Berg PR, Gibbs RA, Lien S. Desarrollo de 16.5K SNP-Chip para salmón del Atlántico. XVII Congreso de Genomas Vegetales y Animales. San Diego, CA. 2009.

37. Gidskehaug L, Kent M, Hayes BJ, Lien S. Genotipo de llamada y mapeo de variantes de múltiples sitios usando una matriz de SNP iSelect de salmón del Atlántico. Bioinformática. 201127: 303 y ndash310. pmid: 21149341

38. Lien S, Gidskehaug L, Moen T, Hayes B, Berg P, Davidson WS, et al. Un mapa de enlace denso basado en SNP para el salmón del Atlántico (Salmo salar) revela homeologías cromosómicas extendidas y diferencias sorprendentes en los patrones de recombinación específicos del sexo. BMC Genomics. 201112: 615. pmid: 22182215

39. Gutiérrez AP, Lubieniecki KP, Davidson EA, Lien S, Kent MP, Fukui S, et al. Mapeo genético de loci de rasgos cuantitativos (QTL) para el peso corporal en el salmón del Atlántico (Salmo salar) utilizando una matriz de SNP de 6.5K. Acuicultura. 2012358 y ndash359: 61 y ndash70. pmid: 24994942

40. Gjedrem T, Gj & oslashen HM, Gjerde B. Origen genético del salmón del Atlántico cultivado en Noruega. Acuicultura. 199198: 41 y ndash50.

41. Withler R, Supernault J, Swift B, Peterson R, Fukui S. La asignación de ADN microsatélite de la progenie a los padres permite la cría comunitaria en agua dulce en un programa de cría selectiva de salmón del Atlántico. Acuicultura. 2007272: S318.

42. Eisbrenner WD, Botwright N, Cook M, Davidson EA, Dominik S, Elliott NG, et al. Evidencia de múltiples loci determinantes del sexo en el salmón del Atlántico de Tasmania (Salmo salar). Herencia. 2014113: 86 y ndash92. pmid: 23759729

43. Phillips RB, Keatley KA, Morasch MR, Ventura AB, Lubieniecki KP, Koop BF, et al. Asignación de grupos de ligamiento del salmón del Atlántico (Salmo salar) a cromosomas específicos: Conservación de grandes bloques sinténicos correspondientes a brazos de cromosomas completos en la trucha arco iris (Oncorhynchus mykiss). BMC Genet. 200910: 46. pmid: 19689812

44. Aulchenko YS, Ripke S, Isaacs A, van Duijn CM. GenABEL: una biblioteca R para análisis de asociación de todo el genoma. Bioinformática. 200723: 1294 y ndash1296. pmid: 17384015

45. Amin N, van Duijn CM, Aulchenko YS. Un método basado en antecedentes genómicos para el análisis de asociación en individuos relacionados. Más uno. 20072: e1274. pmid: 18060068

46. ​​Thompson EA, Shaw RG. Análisis de pedigrí para rasgos cuantitativos: componentes de varianza sin inversión de matriz. Biometría. 199046: 399 y ndash413. pmid: 2364130

47. Aulchenko YS, de Koning D-J, Haley C. Asociación rápida en todo el genoma mediante modelo mixto y regresión: un método rápido y simple para el análisis de asociación de loci de rasgos cuantitativos basado en el pedigrí en todo el genoma. Genética. 2007177: 577 y ndash585. pmid: 17660554

48. Heifetz EM, Fulton JE, O'Sullivan N, Zhao H, Dekkers JCM, Soller M. Extensión y consistencia a través de generaciones de desequilibrio de ligamiento en poblaciones de cría de pollos ponedoras comerciales. Genética. 2005171: 1173 y ndash1181. pmid: 16118198

49. Sved JA. Desequilibrio de ligamiento y homocigosidad de segmentos cromosómicos en poblaciones finitas. Theor Popul Biol. 19712: 125 y ndash141. pmid: 5170716

50. Davidson WS, Koop BF, Jones SJM, Iturra P, Vidal R, Maass A y col. Secuenciación del genoma del salmón del Atlántico (Salmo salar). Genome Biol. 201011: 403. pmid: 20887641

51. Houston RD, Bishop SC, Hamilton A, Guy DR, Tinch AE, Taggart JB, et al. Detección de QTL que afecta los rasgos de cosecha en una población comercial de salmón del Atlántico. Anim Genet. 200940: 753 y ndash755. pmid: 19397515

52. Easton AA, Moghadam HK, Danzmann RG, Ferguson MM. La arquitectura genética de la tasa de desarrollo embrionario y la covariación genética con la edad de maduración en la trucha arco iris Oncorhynchus mykiss. J Fish Biol. 201178: 602 y ndash623. pmid: 21284638

53. Phillips RB, Nichols KM, DeKonning JJ, Morasch MR, Keatley KA, Rexroad C, et al. Asignación de grupos de ligamiento de trucha arco iris a cromosomas específicos. Genética, 2006174: 1661 y ndash1670. pmid: 16951085

54. Paibomesai M, Moghadam H, Ferguson M, Danzmann R. Los genes del reloj y sus distribuciones genómicas en tres especies de peces salmónidos: asociaciones con genes que regulan la maduración sexual y el ciclo celular. Notas de investigación de BMC. 20103: 215. pmid: 20670436

55. Johnston SE, Orell P, Pritchard VL, Kent MP, Lien S, Niemela E, et al. El análisis de SNP de todo el genoma revela una base genética para la variación de la edad del mar en una población salvaje de salmón del Atlántico (Salmo salar). Mol Ecol. 201423: 3452 y ndash3468. pmid: 24931807

56. Stranger BE, Stahl EA, Raj T. Progreso y promesa de estudios de asociación de todo el genoma para la genética de rasgos complejos humanos. Genética. 2011187: 367 y ndash383. pmid: 21115973

57. Sodeland M, Gaarder M, Moen T, Thomassen M, Kj & oslashglum S, Kent M, et al. Las pruebas de asociación de todo el genoma revelan loci de rasgos cuantitativos para la textura del filete y el contenido de grasa en el salmón del Atlántico. Acuicultura. 2013408 y ndash409: 169 y ndash174.

58. Hata Y, Nakanishi H, Takai Y. Proteínas que contienen el dominio PDZ sináptico. Investigación en neurociencias. 199832: 1 y ndash7. pmid: 9831248

59. Huang Y-Z, Zhang E-P, Chen H, Wang J, Li ZJ, Huai Y-T, et al. La nueva deleción de 12 pb en la región codificante del gen bovino NPM1 afecta los rasgos de crecimiento. J Appl Genet. 201051: 199 y ndash202. pmid: 20453307

60. M & uumlller H, Bracken AP, Vernell R, Moroni MC, Christians F, Grassilli E, et al. Los E2F regulan la expresión de genes implicados en la diferenciación, el desarrollo, la proliferación y la apoptosis. Genes Dev. 200115: 267 y ndash285. pmid: 11159908

61. Bracken AP, Ciro M, Cocito A, Helin K. E2F target genes: desentrañar la biología. Trends BiochemSci. 2004 29: 409 y ndash417. pmid: 15362224

62. Korenjak M, Brehm A. Complejos E2F y ndashRb que regulan la transcripción de genes importantes para la diferenciación y el desarrollo. Curr Opin Genet Dev. 200515: 520 y ndash527. pmid: 16081278

63. Suzuki A, Saba R, Miyoshi K, Morita Y, Saga Y. La interacción entre NANOS2 y el complejo de desadenilación CCR4-NOT es esencial para el desarrollo de células germinales masculinas en ratones. Más uno. 20127: e33558. pmid: 22448252

64. Bailey GS, Wilson AC, Halver JE, Johnson CL. Múltiples formas de malato deshidrogenasa sobrenadante en peces salmónidos: estudios bioquímicos, inmunológicos y genéticos. J Biol Chem. 1970245: 5927 y ndash5940. pmid: 4991846

65. Ferguson MM, Danzmann RG, Allendorf FW. Divergencia en el desarrollo entre las cepas de criadero de trucha arco iris (Salmo gairdneri). I. Cepas puras. Puede J Genet Cytol. 198527: 289 y ndash297.

66. Sarafidou T, Kahl C, Martinez-Garay I, Mangelsdorf M, Gesk S, Baker E, et al. El sitio frágil FRA10A sensible al folato se debe a una expansión de una repetición CGG en un gen nuevo, FRA10AC1, que codifica una proteína nuclear. Genómica. 200484: 69 y ndash81. pmid: 15203205

67. Debacker K, Kooy RF. Sitios frágiles y enfermedades humanas. Hum Mol Genet. 2007 16: R150 y ndashR158. pmid: 17567780

68. Ruiz-Herrera A, Castresana J, Robinson T. ¿La evolución cromosómica de los mamíferos está impulsada por regiones de fragilidad del genoma? Genome Biol. 20067: R115. pmid: 17156441

69. Stebbins-Boaz B, Cao Q, de Moor CH, Mendez R, Richter JD. Maskin es un factor asociado a CPEB que interactúa transitoriamente con eIF-4E. Mol Cell. 19994: 1017 y ndash1027. pmid: 10635326

70. Mackay TFC, Stone EA, Ayroles JF. La genética de los rasgos cuantitativos: retos y perspectivas. Nat Rev Genet. 200910: 565 y ndash577. pmid: 19584810

71. Wild V, Simianer H, Gj & oslashen HM, Gjerde B. Parámetros genéticos y genotipo y tiempo de interacción ambiental para la madurez sexual temprana en el salmón del Atlántico (Salmo salar). Acuicultura. 1994128: 51 y ndash65.


Referencias

Mills RE, Luttig CT, Larkins CE, Beauchamp A, Tsui C, Pittard WS, et al. Un mapa inicial de variación de inserción y deleción (INDEL) en el genoma humano. Genome Res. 200616 (9): 1182–90.

Miki Y, Swensen J, Shattuck-Eidens D, Futreal PA, Harshman K, Tavtigian S, et al. Un fuerte candidato para el gen BRCA1 de susceptibilidad al cáncer de mama y de ovario. Ciencias. 1994266 (5182): 66–71.

Collins FS, Drumm ML, Cole JL, Lockwood WK, Woude GV, Iannuzzi MC. Construcción de una biblioteca de salto de cromosomas humanos en general, con aplicación a la fibrosis quística. Ciencias. 1987235 (4792): 1046–9.

Roberts PS, Chung J, Jozwiak S, Dabora SL, Franz DN, Thiele EA, et al. Identificación de SNP, análisis de haplotipos y origen parental de mutaciones en TSC2. Hum Genet. 2002111 (1): 96–101.

Trappe R, Laccone F, Cobilanschi J, Meins M, Huppke P, Hanefeld F, et al. Las mutaciones de MECP2 en casos esporádicos de síndrome de Rett son casi exclusivamente de origen paterno. Soy J Hum Genet. 200168 (5): 1093–101.

Ketterling RP, Vielhaber EL, Lind TJ, Thorland EC, Sommer SS. Las tasas y patrones de deleciones en el gen del factor IX humano. Soy J Hum Genet. 199454 (2): 201.

Clark RM, Wagler TN, Quijada P, Doebley J. Un potenciador distante aguas arriba en el gen de domesticación del maíz tb1 tiene efectos pleiotrópicos en la arquitectura de las plantas y las inflorescencias. Nat Genet. 200638 (5): 594–7.

Ashikari M, Sakakibara H, Lin S, Yamamoto T, Takashi T, Nishimura A, et al. La citoquinina oxidasa regula la producción de granos de arroz. Ciencias. 2005309 (5735): 741–5.

Fu D, Uauy C, Distelfeld A, Blechl A, Epstein L, Chen X, et al. Un gen de la quinasa-START confiere resistencia dependiente de la temperatura a la roya rayada del trigo. Ciencias. 2009323 (5919): 1357–60.

Wu D-H, Wu H-P, Wang C-S, Tseng H-Y, Hwu K-K. Sistema de marcadores InDel en todo el genoma para su aplicación en estudios de mapeo y mejoramiento de arroz. Euphytica. 2013192 (1): 131–43.

Schnable PS, Ware D, Fulton RS, Stein JC, Wei F, Pasternak S, et al. El genoma del maíz B73: complejidad, diversidad y dinámica. Ciencias. 2009326 (5956): 1112–5.

Xia Q, Guo Y, Zhang Z, Li D, Xuan Z, Li Z, et al. La resecuenciación completa de 40 genomas revela eventos de domesticación y genes en el gusano de seda (Bombyx). Ciencias. 2009326 (5951): 433–6.

Lam H-M, Xu X, Liu X, Chen W, Yang G, Wong F-L, et al. La resecuenciación de 31 genomas de soja silvestre y cultivada identifica patrones de diversidad genética y selección. Nat Genet. 201042 (12): 1053–9.

Morris GP, Ramu P, Deshpande SP, Hash CT, Shah T, Upadhyaya HD, et al. Estudios de asociación genómica poblacional y de todo el genoma de rasgos agroclimáticos en sorgo. Proc Natl Acad Sci. 2013110 (2): 453–8.

Huang X, Wei X, Sang T, Zhao Q, Feng Q, Zhao Y, et al. Estudios de asociación de todo el genoma de 14 rasgos agronómicos en variedades locales de arroz. Nat Genet. 201042 (11): 961–7.

Huang X, Zhao Y, Wei X, Li C, Wang A, Zhao Q, et al. Estudio de asociación de todo el genoma del tiempo de floración y características de rendimiento de grano en una colección mundial de germoplasma de arroz. Nat Genet. 201244 (1): 32–9.

Xu X, Liu X, Ge S, Jensen JD, Hu F, Li X, et al. La resecuenciación de 50 accesiones de arroz silvestre y cultivado produce marcadores para identificar genes agronómicamente importantes. Nat Biotechnol. 201230 (1): 105-11.

Huang X, Kurata N, Wei X, Wang Z-X, Wang A, Zhao Q, et al. Un mapa de la variación del genoma del arroz revela el origen del arroz cultivado. Naturaleza. 2012490 (7421): 497–501.

Lai J, Li R, Xu X, Jin W, Xu M, Zhao H, et al. Patrones de variación genética de todo el genoma entre líneas endogámicas de maíz de élite. Nat Genet. 201042 (11): 1027–30.

Jiao Y, Zhao H, Ren L, Song W, Zeng B, Guo J, et al. Cambios genéticos en todo el genoma durante el mejoramiento moderno del maíz. Nat Genet. 201244 (7): 812–5.

Chia JM, Song C, Bradbury PJ, Costich D, de Leon N, Doebley J, et al. Maize HapMap2 identifica la variación existente de un genoma en flujo. Nat Genet. 201244 (7): 803–7.

Albers CA, Lunter G, MacArthur DG, McVean G, Ouwehand WH, Durbin R. Dindel: llamadas indel precisas a partir de datos de lectura corta. Genome Res. 201121 (6): 961–73.

Koboldt DC, Chen K, Wylie T, Larson DE, McLellan MD, Mardis ER, et al. VarScan: detección de variantes en secuenciación masivamente paralela de muestras individuales y agrupadas. Bioinformática. 200925 (17): 2283–5.

McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, et al. El kit de herramientas de análisis del genoma: un marco de MapReduce para analizar datos de secuenciación de ADN de próxima generación. Genome Res. 201020 (9): 1297–303.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. El formato de alineación / mapa de secuencia y SAMtools. Bioinformática. 200925 (16): 2078–9.

Schuler GD. Mapeo de secuencias mediante PCR electrónica. Genome Res. 19977 (5): 541–50.

Neuman JA, Isakov O, Shomron N. Análisis de inserción-deleción de datos de secuenciación profunda: evaluación de software para una detección óptima. Breve Bioinformática. 201314 (1): 46–55.

Varshney RK, Mahendar T, Aggarwal RK, Börner A. Marcadores moleculares genicos en plantas: desarrollo y aplicaciones. Mejora de cultivos asistida por genómica. Holanda: Springer 2007. p. 13-29.

Andersen JR, Lübberstedt T. Marcadores funcionales en plantas. Tendencias Plant Sci. 20038 (11): 554–60.

Yang X, Chockalingam SP, Aluru S. Un estudio de métodos de corrección de errores para la secuenciación de próxima generación. Breve Bioinformática. 201314 (1): 56–66.

Langmead B, Trapnell C, Pop M, Salzberg SL. Alineación ultrarrápida y eficiente para la memoria de secuencias cortas de ADN con el genoma humano. Genome Biol. 200910 (3): R25. doi: 10.1186 / gb-2009-10-3-r25.

Patel RK, Jain M. NGS QC Toolkit: un juego de herramientas para el control de calidad de los datos de secuenciación de próxima generación. Más uno. 20127 (2): e30619.

Anderson JA, Churchill GA, Autrique JE, Tanksley SD, Sorrells ME. Optimización de la selección de los padres para mapas de ligamiento genético. Genoma. 199336 (1): 181–6.

Rozen S, Skaletsky H. Primer3 en la WWW para usuarios generales y para programadores biólogos. Métodos Mol Biol. 2000132 (3): 365–86.

Allen G, Flores-Vergara M, Krasynanski S, Kumar S, Thompson W.Un protocolo modificado para el aislamiento rápido de ADN de tejidos vegetales utilizando bromuro de cetiltrimetilamonio. Nat Protocol. 20061 (5): 2320–5.


Resultados y discusión

Efectos del medio ambiente (E), el genotipo (G) y la interacción G × E (GEI)

El ANOVA para rendimiento de grano (Tabla 1) identificó diferencias altamente significativas entre genotipos en PAG & lt 0,0001. La alta variación genética existente entre los genotipos es muy útil para que los mejoradores de trigo seleccionen de manera eficiente los genotipos de mayor rendimiento, en cada ubicación o entre ubicaciones, para utilizarlos en los programas de mejora. Las interacciones genotipo (G) × medio ambiente (E) (IEG) fueron significativas en PAG & lt 0,0001 para rendimiento de grano. GEI significativo indicó que los genotipos se comportaron de manera diferente en diferentes entornos y que los genotipos deben seleccionarse para adaptarse a entornos específicos [3, 4, 65]. Por lo tanto, el GEI confirmó que los genotipos respondieron de manera diferente a la variación en las condiciones ambientales en los lugares, lo que indicó la necesidad de probar cultivares de trigo en múltiples lugares.

La correlación fenotípica para el rendimiento de grano entre los nueve ambientes se presenta en (Fig. 1).Sin correlaciones significativas o muy bajas en PAG Se observaron & lt 0.05 entre los valores de rendimiento de cultivares en todos los ambientes. Una correlación significativa moderadamente positiva entre Lincoln y Mead (r = 0,42 *) y entre Grant y McCook (r = 0,43 *) ya que estos pares de ubicaciones se encuentran en zonas ecogeográficas similares. Los resultados de correlaciones débiles o bajas respaldan aún más la diversidad de los entornos de prueba y el efecto significativo de GEI en el rendimiento de los genotipos.

Matriz de coeficientes de correlación del rendimiento de grano en los nueve entornos

El desempeño de los genotipos en diferentes ambientes.

Es común que los datos MEYT representen una combinación de tipos de GEI cruzados y no cruzados. La media mínima y máxima de rendimiento de grano en cada ambiente se presenta en la Tabla 2. El rendimiento máximo de grano varió de 3503.53 (Kansas) a 8287.50 Kg / Ha (McCook). El promedio más bajo y más alto de rendimiento de grano también se contabilizó en los mismos dos entornos. Esta enorme diferencia en el rendimiento de grano para el mismo conjunto de genotipos se debió al fuerte efecto del medio ambiente y la GEI.

Los genotipos de mayor rendimiento difirieron según la ubicación NE17660 (Alliance), NE17626 (Clay Center), NE17528 (Grant), NE17588 (Kansas), NE17609 (Lincoln), NE17441 (McCook), NE17662 (Mead), NE17463 (North Platte) y NHH17447 (Sidney) (Tabla complementaria S3). El GEI puede ser causado por interacciones cruzadas o por interacciones no cruzadas (por ejemplo, cambios en la magnitud de las diferencias entre líneas). Como no había un genotipo común que se clasificara como el genotipo de mayor rendimiento en más de un entorno, elegimos los 50 genotipos de mayor rendimiento (

18,5% de los genotipos experimentales) en cada ubicación para representar los genotipos de alto rendimiento en ese entorno. Luego, se seleccionó un genotipo si estaba entre los 50 genotipos de alto rendimiento en al menos dos ambientes. Como resultado, se marcaron y seleccionaron 13 genotipos (Tabla 3). Se aplicó el mismo procedimiento para seleccionar los genotipos de trigo de alta tolerancia a la sequía, [52]. Se consideró que aquellos genotipos que estaban en el grupo de alto rendimiento en múltiples ubicaciones tenían el IEG no cruzado (Tabla 3). El genotipo NE17625 se encontró entre los 50 genotipos de mayor rendimiento en todos los entornos excepto Kansas. El genotipo NE17626 se encontró entre los 50 genotipos de mayor rendimiento en todos los entornos excepto Mead. Además, se encontró que el genotipo NE17443 se encuentra entre los 50 de mayor rendimiento en siete entornos. Se encontraron dos genotipos NE17629 y NE17549 entre los 50 de mayor rendimiento en seis entornos. Sorprendentemente, los genotipos seleccionados son heterogéneos en términos de su pedigrí. Por ejemplo, algunos de los genotipos seleccionados compartían el mismo progenitor, como NE17625, NE17626, NE17629 y NE17549, que eran todos reselecciones de NW03666 (Tabla complementaria S1). Tanto NE17479 como NE17435 eran medios hermanos y compartían los mismos padres (NE06545 / NW07534). Los otros siete genotipos seleccionados tenían diferentes genealogías. La información del pedigrí proporciona información útil para que los fitomejoradores mantengan la diversidad mientras realizan el siguiente conjunto de cruces utilizando los genotipos seleccionados.

Como se mencionó anteriormente, el IEG significativo a menudo se interpreta como un programa de mejoramiento específico para mejorar el rendimiento de grano que puede requerir una mejora óptima para cada ambiente [44, 52]. Sin embargo, el cruce de estos genotipos seleccionados puede ser útil para un programa de reproducción, con una consideración completa de la información del pedigrí, que se extiende a más de un entorno, especialmente cuando el entorno en un lugar cambia de un año a otro (por ejemplo, puede no ser predecible ).

Alliance y Grant tenían el mayor número de genotipos seleccionados en común con 11 en cada uno. Kansas y Sidney, por otro lado, tenían la menor cantidad de genotipos seleccionados comunes (seis genotipos). Este resultado puede deberse a que el ensayo de Kansas estaba considerablemente más al sur y en un estado diferente, mientras que los otros ocho entornos están en Nebraska y donde el programa de reproducción se dirige a sus nuevos cultivares.

Los enfoques analíticos del análisis GEI son importantes para mejorar el valor de las MEYT y comprender las causas de las interacciones GE [61, 65, 68]. Los métodos utilizados para comprender el IEG incluyen la caracterización de los sitios de prueba de acuerdo con factores ambientales, utilizando medidas directas, índices calculados o variables derivadas de modelos de crecimiento de cultivos [18]. El IEG altamente significativo se explica por las diferencias en la precipitación, la capa de nieve y la temperatura de un lugar a otro durante la sesión de cultivo (Tabla complementaria S4). Aunque ocho entornos se encuentran geográficamente dentro de Nebraska, los datos climáticos difieren según el entorno.

Análisis de bi-parcela GGE

Se utilizó el enfoque GGE-biplot, que se basó en una escala centrada en el entorno, para estimar las relaciones entre los entornos (Fig. 2). Las líneas que unen el origen biplot y los marcadores de los entornos se denominan vectores de entorno. El ángulo entre los vectores de 2 ambientes está relacionado con el coeficiente de correlación entre ellos. Los ángulos entre la mayoría de nuestros entornos eran solo un poco más pequeños que 90 °, por lo tanto, la correlación entre ellos debería ser cercana a 0 (Ver Fig. 1). Este enfoque biplot GGE (Fig. 2) sugirió que Alliance y North Platte eran los entornos más estrechamente correlacionados con Grant y McCook muy cerca. Sin embargo, los mayores coeficientes de correlación fueron entre McCook y Grant y entre Lincoln y Mead (Fig. 1). Algunas contradicciones entre las cifras y las correlaciones reales eran predecibles porque el biplot no estimó el 100% de la variación de GGE [33, 67].

GGE-biplot basado en escalado centrado en el entorno para entornos. PC y E significan componente principal y entornos, respectivamente. Los detalles de los entornos son (Tabla complementaria S4). Los entornos se representan en esta figura como Alliance (AL), Clay Center (CC), Grant (G), Kansas (KAN), Lincoln (LN), McCook (MC), Mead (ME), North Platte (NP), Sidney (SD)

La mayoría de nuestros entornos en este estudio se consideraron entornos PC2, excepto Kansas, Lincoln y Mead que se incluyeron en PC1, que tenían puntuaciones positivas y negativas. PC1 representa diferencias de rendimiento de genotipo proporcionales entre entornos, lo que conduce a un GEI no cruzado. Los genotipos con puntuaciones de PC1 superiores se pueden identificar fácilmente en entornos con puntuaciones de PC1 más altas. A diferencia de la PC1 ambiental, la PC2 tuvo puntuaciones tanto positivas como negativas (Fig. 2). Las puntuaciones positivas y negativas se deben al cruce de GEI, lo que conduce a diferencias de rendimiento de genotipo inconsistentes entre entornos [66]. Un genotipo puede tener grandes interacciones positivas con algunos entornos, pero grandes interacciones negativas con otros entornos.

Para crear un factor climático detallado (Tabla complementaria S4 y Fig. 3), PCA evaluó los valores estandarizados de la temperatura media de la temporada de crecimiento, la precipitación media y la nevada media. Al observar la (Fig. 3), encontramos que los tres factores climáticos (temperatura promedio, precipitación promedio y nevadas promedio) se distribuyeron ampliamente a lo largo de PCA1 y PCA2. Pero hubo varios puntos de nieve observados de cerca entre Lincoln, Mead, McCook y Kansas. La temperatura promedio de Alliance, Sidney y Kansas se distribuyó ampliamente en toda la PCA. Todos estos datos informativos indicaron que diferentes factores climáticos causaron fuertes interacciones de GE.

Análisis de componentes principales para temperatura, lluvia y nevadas en los nueve ambientes. Los entornos se representan en esta figura como Alliance (AL), Clay Center (CC), Kansas (KAN), Lincoln (LN), McCook (MC), Mead (ME), North Platte (NP), Sidney (SD). Los datos meteorológicos en la ubicación de Grant no están disponibles

Estudio de asociación de genoma completo para rendimiento de grano

El análisis GWAS se realizó utilizando un modelo MLM que tiene en cuenta la estructura de la población [6, 69]. Debido a la interacción altamente significativa entre los genotipos y ambientes, el GWAS se realizó para cada ambiente, por separado. El GWAS encontró un total de 70 MTA asociados con GY en los nueve entornos (Tabla 4 y Figura 4 Tabla complementaria S5). El menor número de SNP significativos (tres SNP) para el rendimiento de grano se detectó en el entorno de Grant, mientras que el mayor número de SNP significativos (11) se observó en tres entornos: Lincoln, McCook y Sidney. La variación fenotípica (R 2) osciló entre el 7,36% y el 12,91%. Se puede considerar que todos los QTL detectados usando GWAS tienen efectos menores en el aumento del rendimiento de grano. El rendimiento de grano es un rasgo complejo controlado por muchos genes y afectado por el medio ambiente, por lo que se espera la identificación de un gran número de asociaciones.A nivel genómico, el mayor número de SNP significativamente asociados se observó en el genoma D (30 SNP) seguido por el genoma A (21 SNP) y luego el genoma B (19 SNP) (Fig. 5). A nivel cromosómico, los 71 SNP significativos asociados con un aumento de GY se distribuyeron en todos los cromosomas del trigo excepto 1A, 4B, 4D, 6A y 6B. El mayor número de SNP significativos se ubicaron en el mismo cromosoma (2D) y se asociaron con un alto rendimiento de grano en todos los entornos (13 SNP). Los 13 SNP se encontraron en 3 entornos (2 SNP en Grant, 6 SNP en Mead y 5 SNP en Sidney). Estos valiosos resultados reflejan la importancia del genoma D en los rasgos GY. Se realizó una amplia comparación de los resultados de la asociación marcador-rasgo del estudio actual con dos estudios anteriores utilizando una base cromosómica debido a las diferencias en el tipo de marcador y las posiciones de los marcadores en diferentes mapas genéticos. Edae [21] detectó un QTL estable para el rendimiento de grano en el cromosoma 2DS tanto en condiciones de regadío como de secano utilizando marcadores DArT. Además, el marcador DArT wpt6531 en el brazo corto del cromosoma 2DS, que se asoció con el rendimiento, está a aproximadamente 8 cM del marcador wpt4144, que se asoció con el rendimiento de grano en un estudio anterior de Burguen et al. [14]. Estudios anteriores han enfatizado la importancia del genoma D para el rendimiento de grano utilizando diferentes tipos de marcadores [14, 20, 21, 23, 34].

Gráfica de Manhattan que muestra la asociación de marcadores SNP-rasgo identificada para rasgos GY en GWAS usando F3:6 Trigo de invierno de Nebraska. La línea azul es un umbral significativo del 5% de corrección de Bonferroni (BC 5%)

La distribución de SNP asociados significativos con GY en todos los entornos.

No se encontraron marcadores comunes entre los ambientes debido a la falta de correlaciones significativas o muy bajas entre los ambientes para el rendimiento de grano. La selección asistida por marcadores (MAS) puede ser útil para entornos específicos. Los MTA encontrados en este estudio deben validarse en entornos y germoplasma adicionales antes de usarlos en MAS. Estudios previos identificaron marcadores SNP asociados con GY en varios cromosomas (1D, 1B, 2A, 3B, 4A, 5A, 5B, 5D, 7A y 7B) [2, 10, 21, 32, 38, 63]. Se identificó que los cromosomas 3B, 5A, 5B y 7A tenían un QTL de rendimiento importante utilizando 567 loci, incluidos los marcadores RFLP, SSR y AFLP [58]. El-basyoni [22] identificó QTL asociados con GY en diferentes entornos en los cromosomas 1B, 2A, 3A, 4A, 5A, 5B, 6A, 6D y 7B utilizando marcadores DArT con líneas de vivero duplicadas anteriores de trigo de invierno de Nebraska. Además, se encontraron marcadores significativos asociados con GY en los cromosomas 1B, 2A, 3A, 4A, 5A, 5B, 6A, 6D y 7B en el trigo de invierno europeo [11, 17, 19, 26, 54, 55, 58, 73]. . Neumann [46], detectó marcadores significativos de GY en el trigo de invierno en los cromosomas 3A, 3B, 7A, 5B y 7B. Los marcadores responsables de GY se identificaron en los cromosomas, 4B y 7D, que se informaron en análisis de QTL biparentales [2, 11, 17]. En estudios anteriores se informaron marcadores significativos asociados con GY en el cromosoma 2A [1, 27, 28, 29, 38, 60, 62]. Una nueva publicación de Kan et al. [32] que reveló un locus de rasgo cuantitativo importante (QTL) QYld.osu-1BS para el rendimiento de grano en 260 F2:4 población de trigo de invierno de líneas haploides duplicadas (DH) derivadas del cruce de Duster y Billings y validaron los QTL utilizando marcadores de PCR específicos de alelos competitivos (KASP) para las secuencias únicas del alelo QYld.osu-1BS.

Desequilibrio de ligamiento (LD) y anotación genética

La importancia del equilibrio de ligamiento (r 2) se estimó entre cada par de SNP ubicados en el mismo cromosoma en cada entorno (Tabla complementaria 5). Todos los pares de SNP que tenían un LD alto se consideraron una región genómica (GR). Como resultado, se identificó un conjunto de 16 regiones genómicas asociadas con un mayor rendimiento de grano en los nueve entornos. Todos los SNP ubicados en el mismo cromosoma tenían un LD significativo alto en Clay Center (dos GR), Kansas (tres GR) y North Platte (dos GR). En Alliance, no hubo LD significativo entre los SNP ubicados en 2A chr., Mientras que los SNP ubicados en 3A chr. estaban en LD significativa. Los cinco SNP que se encuentran en el cromosoma 2D en Mead tenían una LD significativa alta. Entre los SNP ubicados en el mismo cromosoma, hubo algunos casos en los que algunos pares de SNP tenían un LD significativo, mientras que el otro no. Por ejemplo, en McCook, hubo un LD no significativo entre los SNP en 1B chr., Sin embargo, solo S1B_427530781 y S1B_427530781 estaban en un LD completo. Asimismo, en Sidney, los cinco SNP ubicados en los cromosomas 2D tenían dos grupos en los que los SNP tenían una LD significativa alta. El primer grupo constaba de dos SNP (S2D_67556531 y S2D_69503850), mientras que el segundo constaba de tres SNP (S2D_76749441, S2D_77122291 y S2D_77122292). No hubo LD significativa entre los dos grupos. Esta información es muy importante para saber qué SNP, ubicados en el mismo cromosoma, podrían heredarse juntos o individualmente. Los SNP significativos ubicados en el mismo cromosoma, si el valor de LD entre un grupo de SNP diana es alto, entonces estos SNP podrían representar el mismo QTL y heredarse juntos. Si el LD es bajo, por otro lado, los dos SNP significativos representan dos QTL diferentes [6, 51]. La anotación del gen se identificó para todas las regiones genómicas con LD significativa. Los genes candidatos dentro de los 16 GR se enumeran en (Tabla complementaria S6).

Como se mencionó anteriormente, el cromosoma 2D tuvo el mayor número de SNP asociados con un alto rendimiento de grano en todo el entorno. Por lo tanto, la anotación genética se describió en detalle en este cromosoma. Al estudiar el patrón de LD entre estos SNP, podemos identificar cuántos genes dentro de la posición física de estos SNP podrían representar. En Mead, los cinco SNP representan un QTL, mientras que, en Sidney, S2D_67556531 y S2D_69503850 co-heredaron más fuerte y los otros tres SNP en el mismo cromosoma co-heredaron juntos. Al estimar la LD entre cada dos pares de los 13 SNP, los resultados indicaron que no hay LD significativa entre cualquier par de SNP de diferentes entornos (Fig. 6). Esta es también una indicación más de la fuerte interacción G × E que afecta la expresión de genes en respuesta al medio ambiente.

Mapa de calor de LD entre SNPs ubicados en 2D chr. En los tres entornos. La línea roja indica que LD alto entre todos los SNP en Mead

Observando la anotación genética en las regiones genómicas LD en el cromosoma 2D (Tabla complementaria S6). Encontramos eso TraesCS2D01G506200 El gen (región del genoma 8) se anota como transportador de zinc y el transporte de iones metálicos se asoció con el rendimiento de grano en el entorno de Mead. Hubo muchos informes que demostraron el papel crucial del Zn en la mejora del rendimiento de grano en el trigo [35, 40]. Recientemente, Alqudah et al. [5] encontró que la deficiencia del transporte de iones metálicos, especialmente Cu y Zn, puede resultar en una reducción del rendimiento de grano a través del aumento de la esterilidad / aborto de espiguillas y flósculos. Curiosamente, en el entorno de Sidney, TraesCS2D01G118400 y TraesCS2D01G119200 Los genes (región genómica 15) también se anotan como transportador de potasio e intercambiador de calcio, respectivamente, lo que demuestra el papel de los metales en el rendimiento de grano. La deficiencia de potasio y calcio puede reducir significativamente el rendimiento de los cultivos, pero debido a la compleja relación de absorción o transporte entre ellos, todavía no se conocen bien sus mecanismos de mejora del grano [56]. Otros genes candidatos interesantes en el entorno de Mead están implicados en fitohormonas, p. Ej. la auxinaTraesCS2D01G506900) y Jasmonato (TraesCS2D01G507200). En el trigo, las fitohormonas controlan el desarrollo de las espiguillas y el grano y el llenado del grano. El lento desarrollo de los granos y las tasas de llenado están muy relacionados con un bajo contenido de citoquininas y auxinas [64] que a su vez reducen el rendimiento de granos. Es necesario comprender los mecanismos del transporte de metales y las fitohormonas, que se encuentran altamente asociados con el rendimiento de grano en el estudio actual, para mejorar el rendimiento de grano de trigo.

Los genotipos prometedores de alto rendimiento para el futuro programa de mejoramiento

Para los 13 genotipos seleccionados (Tabla 3), se pueden considerar tres criterios para determinar los genotipos como progenitores candidatos para un cruce futuro para mejorar el rendimiento de grano. Estos criterios se basan en:

la presencia de alelos favorables asociados con un mayor rendimiento de grano se registró en cada genotipo (Tabla complementaria S7). NE17435 tenía el mayor número de alelos favorables asociados con un mayor rendimiento de grano en 46 sitios, mientras que NE17550 tenía 39 alelos favorables. Cuatro genotipos NE17545, NE17626, NE17524 y NE17629 tenían el mismo número de 43 alelos asociados con un mayor rendimiento de grano. Aunque NE17435 tenía el mayor número de alelos diana para el rendimiento de grano, estaba entre los 50 genotipos de mayor rendimiento en solo seis entornos. NE17625 y NE17626, que se encontraban entre los 50 más altos en ocho entornos, tenían 40 y 43 alelos objetivo para el rendimiento de grano, respectivamente. Fue útil contar el número de alelos favorables que lleva cada genotipo seleccionado, ya que ayuda a determinar los genotipos objetivo como padres para futuros cruces en el programa de mejoramiento para mejorar el rendimiento de grano en entornos únicos o específicos.

la diversidad genética entre los 13 genotipos. La GD entre todos los genotipos de este estudio se describe ampliamente en [24]. Esta población se dividió en tres posibles subpoblaciones [24]. La distancia genética entre los 13 genotipos seleccionados se presenta en (Tabla complementaria S8). Se encontró que cinco genotipos se asignaron a la subpoblación 1 (G1), cinco se asignaron a la subpoblación 3 (G3) y los tres genotipos restantes se asignaron a la subpoblación (G2). La distancia genética más alta se encontró entre NE17624 y NE17661 (GD = 0.333), mientras que la GD más baja fue entre NE17549 y NE17625 (GD = 0.007). Generalmente, todos los genotipos seleccionados tienen un bajo nivel de distancia genética y tienden a ser genéticamente similares. Esto se debe al hecho de que todos los genotipos representan el programa de mejoramiento de trigo de invierno de Nebraska [24]. Además, muchas accesiones fueron reselecciones de la misma línea (Tabla complementaria S1).

el número de alelos únicos asociados con un mayor rendimiento de grano entre cada par de los 13 genotipos seleccionados (Tabla complementaria S9). El mayor número de alelos diferentes (33) se encontró entre NE17549 y tanto NE17479 como NE17435. Por otro lado, solo se encontraron tres alelos diferentes entre NE17549 y NE17625. Los diferentes alelos entre cada dos genotipos dependen de la distancia genética entre ellos. Hubo una correlación positiva significativa entre los diferentes alelos y la distancia genética (r = 0.65**).

Cada criterio identificó a diferentes padres candidatos. Al considerar todos los criterios junto con la prioridad para el número de alelos diferentes y la distancia genética, un cruce entre NE17625 y NE17479 puede ser útil para desarrollar un cultivar que puede ser de alto rendimiento en cinco entornos (Alliance, Grant, Kansas, Lincoln y North Platte). Ambos padres tenían 40 alelos asociados con un mayor rendimiento de grano, 32 alelos diferentes asociados con un mayor rendimiento de grano y una distancia genética de 0,292. Además, NE17625 y NE17479 se encontraban entre los 50 genotipos más altos en ocho y cinco entornos, respectivamente. Aunque NE17625 y NE17626 se encontraban entre los 50 genotipos de mayor rendimiento en ocho entornos, el cruce entre ellos no es útil porque conducirá a una variación genética muy baja en el rendimiento de grano ya que ambos genotipos tienden a ser genéticamente similares con solo GD de 0,007 y nueve alelos diferentes. . Por lo tanto, el uso de herramientas genómicas (por ejemplo, identificar el número de alelos objetivo, número de alelos diferentes, análisis de diversidad genética, etc.) en paralelo con la selección fenotípica es muy fructífero para mejorar los rasgos objetivo. El avance de dicha información sobre importantes MTA se puede considerar junto con la selección genómica que ahora se realiza de forma rutinaria en el programa de mejoramiento para preseleccionar líneas parentales prometedoras para nuevos conjuntos de cruces para mejorar el rendimiento de grano [9].

Marcadores de SNP putativos para validación y uso futuro en MAS

Para los SNP candidatos detectados por GWAS, se encontró que un conjunto de 10 marcadores SNP estaban presentes en los 13 genotipos seleccionados, mientras que tres SNP no se mostraron en ninguno de los genotipos seleccionados. Como se recomienda en cada entorno para validar los SNP que se encontraron en ese entorno, puede ser útil convertir estos 13 SNP en marcadores de PCR específicos de alelos competitivos (KASP) y validarlos para un alto rendimiento de grano en un trasfondo genético diferente. Por ejemplo, el marcador S2A_718916923 se encontró en todos los genotipos seleccionados y debe validarse. Aunque se encontró que el alelo marcador C estaba significativamente asociado con un mayor rendimiento de grano en Alliance, este alelo también estaba presente en todos los genotipos seleccionados en otros entornos. Este alelo marcador tiene probablemente efectos menores en el aumento del rendimiento de grano en los otros entornos, pero el GEI impide que este marcador en los otros entornos se asocie significativamente con el rendimiento de grano.

Curiosamente, dos SNP asociados con GY en este estudio también se encontraron asociados con el rendimiento de grano en un estudio anterior [10]. Este estudio anterior evaluó el rendimiento de grano para genotipos de trigo de invierno sintético en Turquía durante dos temporadas. Los dos SNP (S3A_24993796 y S3A_24993797) están asociados con GY en el entorno Alliance (Tabla complementaria S5). Además, en su estudio, el alelo A para S3A_24993796 y C para S3A_24993797 se asociaron con un mayor rendimiento de grano. Los mismos dos alelos también se asociaron con un mayor rendimiento de grano de trigo de invierno de Nebraska. La cantidad de variación fenotípica (R 2) explicada por estos marcadores es similar (

11,5%) en ambos estudios. La LD alta entre los dos SNP también se ha destacado en nuestros dos estudios. En general, los dos SNP están asociados con el rendimiento de grano en dos antecedentes genéticos independientes (trigo de Nebraska y trigo de invierno sintético de Turquía) y dos entornos de prueba (Nebraska y Turquía) que validan aún más las asociaciones identificadas en este estudio. Se sabe que los estados de la Gran Llanura y Turquía comparten algunas de las mismas características climáticas [7]. Por lo tanto, la introgresión de alelos favorables a través del germoplasma que no se hayan incorporado previamente a su germoplasma puede ser una posibilidad [7].


Esta investigación fue financiada por la Corporación de Fomento de la Producción (proyecto CORFO número 14EIAT-28667), una organización gubernamental de Chile. GMY cuenta con el apoyo de la Beca Postdoctoral Fondecyt / Conicyt n. 3190553, y JMY cuenta con el apoyo de Núcleo Milenio INVASAL financiado por el programa del gobierno de Chile, Iniciativa Cientifica Milenio del Ministerio de Economía, Fomento y Turismo. Los patrocinadores no tuvieron ningún papel en el diseño, la recopilación y el análisis de datos, la decisión de publicar o la preparación del manuscrito.

Afiliaciones

Facultad de Ciencias Veterinarias y Pecuarias, Universidad de Chile, Santiago, Chile


Ver el vídeo: R for GWAS: Day 3 (Agosto 2022).