Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine

Tema ovog rada je implementacija vlastitog algoritma za pronalazak alela testiranog na očitanjima MHC gena jelena. Korištena je metoda grupiranja, pisana u programskom jeziku C++, dok je za učitavanje podataka korišten Python. Aleli, kao dijelovi genoma koji kodiraju osobine jedinke, mogu varirati š...

Full description

Bibliographic Details
Main Author: Lipovac, Matea
Other Authors: Križanović, Krešimir
Format: Bachelor Thesis
Language:Croatian
Published: Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva. 2022
Subjects:
Online Access:https://zir.nsk.hr/islandora/object/fer:9949
https://urn.nsk.hr/urn:nbn:hr:168:618276
https://repozitorij.unizg.hr/islandora/object/fer:9949
https://repozitorij.unizg.hr/islandora/object/fer:9949/datastream/PDF
id ftnulzagrebzir:oai:zir.nsk.hr:fer_9949
record_format openpolar
spelling ftnulzagrebzir:oai:zir.nsk.hr:fer_9949 2023-08-27T04:11:48+02:00 Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine Discovering Gene Variants From Variable Length Sequencing Reads Lipovac, Matea Križanović, Krešimir 2022-06-23 application/pdf https://zir.nsk.hr/islandora/object/fer:9949 https://urn.nsk.hr/urn:nbn:hr:168:618276 https://repozitorij.unizg.hr/islandora/object/fer:9949 https://repozitorij.unizg.hr/islandora/object/fer:9949/datastream/PDF hrv hrv Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva. University of Zagreb. Faculty of Electrical Engineering and Computing. https://zir.nsk.hr/islandora/object/fer:9949 https://urn.nsk.hr/urn:nbn:hr:168:618276 https://repozitorij.unizg.hr/islandora/object/fer:9949 https://repozitorij.unizg.hr/islandora/object/fer:9949/datastream/PDF http://rightsstatements.org/vocab/InC/1.0/ info:eu-repo/semantics/closedAccess bioinformatika aleli sekvenciranje grupiranje strojno učenje SPOA konsenzus bioinformatics allele sequencing clustering machine learning consensus TEHNIČKE ZNANOSTI. Računarstvo TECHNICAL SCIENCES. Computing info:eu-repo/semantics/bachelorThesis text 2022 ftnulzagrebzir 2023-08-03T16:27:53Z Tema ovog rada je implementacija vlastitog algoritma za pronalazak alela testiranog na očitanjima MHC gena jelena. Korištena je metoda grupiranja, pisana u programskom jeziku C++, dok je za učitavanje podataka korišten Python. Aleli, kao dijelovi genoma koji kodiraju osobine jedinke, mogu varirati što znači da za isto svojstvo ne mora postojati identičan slijed nukleotida. Stoga proces pronalaska alela nije tako trivijalan te je u ovom radu korištena metoda strojnog učenja, grupiranje, kako bismo ih pronašli. Sami aleli se računaju kao konsenzusi svih sekvenci koje pripadaju jednoj grupi, razvrstanih u iste temeljem Hammingove udaljenosti. Algoritam uspješno pronalazi vrlo zastupljene alele. Vanjski alat korišten u ovom radu je SPOA za poravnanje više sekvenci i određivanje konsenzusa. The aim of this paper is implementation of an algorithm for finding alleles tested on MHC deer genome fragments. The method used in this research is clustering, written in C++ programming language, while the data was parsed using Python. Alleles, or genome variant that encodes phenotypic traits, could vary, meaning for the same trait it is not mandatory that all individuals have an identical nucleotide sequence for it. Therefore, the process of finding alleles is not so trivial. An algorithm was implemented using machine learning method, clustering. The alleles themselves are calculated as consensus of all sequences from a group, assigned to it based on Hamming distance. External tool used in this paper was SPOA for multiple sequence alignment and generating consensus. Bachelor Thesis sami Croatian Digital Theses Repository (National and University Library in Zagreb)
institution Open Polar
collection Croatian Digital Theses Repository (National and University Library in Zagreb)
op_collection_id ftnulzagrebzir
language Croatian
topic bioinformatika
aleli
sekvenciranje
grupiranje
strojno učenje
SPOA
konsenzus
bioinformatics
allele
sequencing
clustering
machine learning
consensus
TEHNIČKE ZNANOSTI. Računarstvo
TECHNICAL SCIENCES. Computing
spellingShingle bioinformatika
aleli
sekvenciranje
grupiranje
strojno učenje
SPOA
konsenzus
bioinformatics
allele
sequencing
clustering
machine learning
consensus
TEHNIČKE ZNANOSTI. Računarstvo
TECHNICAL SCIENCES. Computing
Lipovac, Matea
Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
topic_facet bioinformatika
aleli
sekvenciranje
grupiranje
strojno učenje
SPOA
konsenzus
bioinformatics
allele
sequencing
clustering
machine learning
consensus
TEHNIČKE ZNANOSTI. Računarstvo
TECHNICAL SCIENCES. Computing
description Tema ovog rada je implementacija vlastitog algoritma za pronalazak alela testiranog na očitanjima MHC gena jelena. Korištena je metoda grupiranja, pisana u programskom jeziku C++, dok je za učitavanje podataka korišten Python. Aleli, kao dijelovi genoma koji kodiraju osobine jedinke, mogu varirati što znači da za isto svojstvo ne mora postojati identičan slijed nukleotida. Stoga proces pronalaska alela nije tako trivijalan te je u ovom radu korištena metoda strojnog učenja, grupiranje, kako bismo ih pronašli. Sami aleli se računaju kao konsenzusi svih sekvenci koje pripadaju jednoj grupi, razvrstanih u iste temeljem Hammingove udaljenosti. Algoritam uspješno pronalazi vrlo zastupljene alele. Vanjski alat korišten u ovom radu je SPOA za poravnanje više sekvenci i određivanje konsenzusa. The aim of this paper is implementation of an algorithm for finding alleles tested on MHC deer genome fragments. The method used in this research is clustering, written in C++ programming language, while the data was parsed using Python. Alleles, or genome variant that encodes phenotypic traits, could vary, meaning for the same trait it is not mandatory that all individuals have an identical nucleotide sequence for it. Therefore, the process of finding alleles is not so trivial. An algorithm was implemented using machine learning method, clustering. The alleles themselves are calculated as consensus of all sequences from a group, assigned to it based on Hamming distance. External tool used in this paper was SPOA for multiple sequence alignment and generating consensus.
author2 Križanović, Krešimir
format Bachelor Thesis
author Lipovac, Matea
author_facet Lipovac, Matea
author_sort Lipovac, Matea
title Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
title_short Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
title_full Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
title_fullStr Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
title_full_unstemmed Određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
title_sort određivanje varijanti gena u populaciji više jedinki iz sekvenciranih očitanja varijabilne duljine
publisher Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva.
publishDate 2022
url https://zir.nsk.hr/islandora/object/fer:9949
https://urn.nsk.hr/urn:nbn:hr:168:618276
https://repozitorij.unizg.hr/islandora/object/fer:9949
https://repozitorij.unizg.hr/islandora/object/fer:9949/datastream/PDF
genre sami
genre_facet sami
op_relation https://zir.nsk.hr/islandora/object/fer:9949
https://urn.nsk.hr/urn:nbn:hr:168:618276
https://repozitorij.unizg.hr/islandora/object/fer:9949
https://repozitorij.unizg.hr/islandora/object/fer:9949/datastream/PDF
op_rights http://rightsstatements.org/vocab/InC/1.0/
info:eu-repo/semantics/closedAccess
_version_ 1775355061816262656