Lector de ADN de bolsillo utilizado para escanear todo secuencia del genoma humano

Secuencia en un palo Ampliar / Secuencia en un palo. Oxford Nanopore

Hace unos años, una compañía llamada Oxford Nanopore lo anunció estaba desarrollando una forma radicalmente diferente de secuenciar el ADN. Sus enfoque involucrado tomar hebras individuales de la doble hélice y rellenarlos a través de un poro de proteína. Con un poco de corriente fluyendo a través del poro, las cuatro bases de ADN crearon una cambio distinto (aunque pequeño) en el voltaje a medida que pasaba. Estos podrían usarse para leer el ADN una base a la vez, ya que se movió por el poro.

Después de varios años de lento progreso, Oxford Nanopore anunció que su hardware de secuencia sería tan distintivo como su wetware: un dispositivo USB que podría caber cómodamente en la persona mano. Cuando los primeros dispositivos salieron a los usuarios, quedó claro que El dispositivo tenía algunas ventajas y desventajas. En el lado positivo, el dispositivo fue rápido y podría usarse sin requerir una gran instalación para apoyarlo. También podría leer tramos muy largos de ADN a la vez. Pero la desventaja fue significativa: cometió muchos errores.

Otras lecturas

El secuenciador de ADN de tamaño USB es propenso a errores, pero sigue siendo útil

Con unos años de experiencia, las personas ahora están comenzando a aprender para aprovechar al máximo los dispositivos, como lo demuestra un nuevo artículo en que los investigadores lo usan para ayudar a secuenciar un genoma humano. Mediante el uso las largas lecturas de la máquina, en un caso, casi 900,000 bases de una Molécula de ADN: los autores pudieron obtener datos de áreas del genoma humano que antes resistía la caracterización. Y fueron capaz de distinguir entre los dos conjuntos de cromosomas (uno de mamá, una de papá) y ubicar áreas de control epigenético en muchos áreas del genoma.

A la luz de toda la información distinta que puede proporcionar, el La tasa de error de la máquina parece menos problemática.

Errores y correcciones

Tenemos máquinas de secuenciación de ADN que cometen muy pocos errores. Desafortunadamente, solo son buenos para leer ADN en fragmentos de aproximadamente 200 bases más o menos. El software de la computadora tiene que reconocer los casos en que estos pequeños trozos se superponen y los utilizan para construir más grandes secuencias Este proceso falla cuando el ADN es repetitivo o cuando es muy secuencias similares aparecen en múltiples áreas del genoma: la el software simplemente no tiene forma de decir qué va a dónde.

Otras lecturas

Una salamandra con un genoma 10 veces más grande que la nuestra perdida extremidades

Como vimos con el genoma axolotl, es posible usar más tiempo, lecturas propensas a errores para dar sentido al desorden. La alta precisión El método proporciona secuencia, mientras que las lecturas más largas nos dicen cómo estos Las secuencias se unen en piezas más grandes. Todavía habrá lagunas, pero serán menos, y se encontrarán más secuencias en grandes trozos en lugar de pequeños fragmentos. Mientras que el genoma axolotl se basó en máquinas de Pacific Biosystems, el sistema de nanoporos funcionaría a este respecto, también.

O al menos debería. Parte del objetivo del nuevo documento era confirme esto, y gran parte del trabajo implica descubrir cómo obtener la mejor secuencia posible de los nanoporos de los autores. por ejemplo, probaron dos paquetes de software diferentes para interpretar los datos de voltaje que salen de su máquina y encontraron que un paquete de código abierto desarrollado por la comunidad que utiliza una red neuronal dio los mejores datos. Combinando lecturas de nanoporos con cortos, fragmentos de alta calidad aumentaron la precisión general del genoma asamblea al 99.88 por ciento, lo que demuestra que esto funciona.

Pero los investigadores fueron mucho más allá de eso. Por sí solo, el La secuencia de nanoporos tenía una tasa de precisión de solo el 92 por ciento. Cuando combinados, teniendo múltiples lecturas de la misma secuencia de la misma La máquina aumentó la precisión por encima del 97 por ciento. Un software separado El paquete podría comparar los casos en que diferentes lecturas no estaban de acuerdo y tomar una decisión sobre cuáles serían los correctos; esta precisión aumentada hasta 99.44 por ciento. Esto no es tan bueno como tener lecturas cortas y de alta calidad, pero es lo suficientemente cerca para muchos propósitos. Agregando las lecturas cortas de alta calidad a esta precisión aumentada para 99.96 por ciento.

Los nanoporos también ofrecieron algunas ventajas muy distintas. por ejemplo, la actividad de los genes puede ser alterada por lo que se llama modificaciones epigenéticas: una alteración química de algunas bases que No cambies la secuencia de ADN. Estos cambios también alteran ligeramente las lecturas de voltaje a medida que pasa una base, permitiendo que investigadores para identificar dónde habían tenido lugar en el genoma

Va mucho

También heredamos dos copias de cada cromosoma (excepto la X e Y de hombres): uno de mamá y uno de papá. Mientras estas copias son diferentes, la mayor parte del ADN subyacente es idéntico por mucho tiempo se extiende, haciendo imposible que se usen lecturas cortas de ADN para determinar qué cromosoma es cuál. Como resultado, mientras puedas Decir dónde están las diferencias, ha sido imposible decir qué diferencias se heredaron juntas, en el mismo cromosoma. Las largas lecturas de los nanoporos hacen esto posible.

Finalmente, los investigadores decidieron hacer las lecturas siempre que posible. El ADN es una molécula larga y delgada, y manipula soluciones de ADN largo tiende a romperlo en pequeños fragmentos, ya que el movimiento del fluido creará fuerzas de corte y estiramiento. Si tu eres realmente cuidadoso, sin embargo, estos pueden minimizarse. Cuando los autores tomó estas precauciones, la longitud de lectura típica proporcionada por el la máquina de nanopore disparó hasta más de 100,000 bases; una lectura alcanzó 882,000.

Eso fue lo suficientemente grande como para cubrir algunos huecos que dejó el proyecto original que secuencia el genoma humano. Uno de estos fue 50,000 bases de largo e incluyeron una duplicación de un gen. Otro tenía ocho copias de una secuencia repetida en rápida sucesión. A través del tiempo, debería ser posible utilizar este enfoque para realmente traer el genoma hasta su finalización.

El trabajo, sin embargo, identificó algunas deficiencias en el lado de secuencia Un formato de archivo común utilizado para contener datos de ADN, para ejemplo, no está especificado para manejar secuencias de este tiempo. Porque eso, algún software de análisis no podría funcionar con las lecturas de nanoporos en absoluto. Como resultado de estos problemas de compatibilidad, el equipo fue obligado a confiar en un algoritmo muy intensivo en procesador para algunos de su análisis

Los impresionantes resultados que surgieron de este análisis sugiere que valdrá la pena poner el esfuerzo en conseguir El software actualizado.

Nature Biotechnology, 2017. DOI: 10.1038 / nbt.4060 (Acerca de DOIs).

Like this post? Please share to your friends:
Leave a Reply

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: