Estrategia para identificar organismos y su abundancia a partir de datos metagenómicos derivados de mezclas de alimentos para peces

"Este proyecto plantea una estrategi para la evaluación y optimización de métodos computacionales para identificar la fuente de origen genética y su abundancia en datos metagenómicos de mezclas de alimentos para peces, utilizando datos de secuenciación previamente generados por el Instituto de...

Full description

Bibliographic Details
Main Author: Moreno Ibarguen, Carlos
Other Authors: Reyes Muñoz, Alejandro, Duitama Castellanos, Jorge Alexander
Format: Master Thesis
Language:Spanish
Published: Uniandes 2019
Subjects:
Online Access:http://hdl.handle.net/1992/43781
Description
Summary:"Este proyecto plantea una estrategi para la evaluación y optimización de métodos computacionales para identificar la fuente de origen genética y su abundancia en datos metagenómicos de mezclas de alimentos para peces, utilizando datos de secuenciación previamente generados por el Instituto de investigación marina IMR de Noruega, basados en una librería de genes nucleares, conformados por cinco grupos de muestras (tres controles y datos experimentales). Para cada una de las especies de interés: Cod (Gadus morhua), Haddock (Melanogrammus aeglefinus), Pike (Esox lucius), Platy (Xiphophorus maculatus), Atlantic Salmón (Salmo salar), y Tilapia (Oreochromis niloticus) se descargó su respectivo genoma de referencia del repositorio público online de NCBI. Se realizaron análisis de calidad, corrección de adaptadores, luego se generaron simulaciones de lecturas (reads) a partir de los mismos genomas de referencia, con el objeto de optimizar los genomas de referencia para que fueran lo más precisos posibles en la identificación en cada una de sus respectivas especies." -- Tomado del Formato de Documento de Grado. "This project proposes a strategy for the evaluation and optimization of computational methods to identify the source of genetic origin and its abundance in metagenomic data of fish food mixtures, using sequence data previously generated by the Norwegian IMR Marine Research Institute, in a library of nuclear genes, consisting of five groups of samples (three controls and experimental data). For each of the species of interest: Cod (Gadus morhua), Haddock (Melanogrammus aeglefinus), Lucio (Esox lucius), Platy (Xiphophorus maculatus), Atlantic Salmon (Salmo salar), and Tilapia (Oreochromis niloticus) respective reference genome of the NCBI online public repository. Quality analysis, correction of adapters was performed, then simulations of readings (readings) were generated from the same reference genomes, to update the reference genomes so that they have as precise as possible in the identification in each one ...