Hrvatski znanstvenici dio su tima koji je razvio novu računalnu metodu "Racon" za ispravljanje pogrešaka u određivanju nepoznatih genoma koja će imati velik utjecaj na efikasno sastavljanje nepoznatih genoma srednje veličine te na razvoj biologije, medicine i agronomije.
Novu, brzu i točnu računalnu metodu "Racon" za ispravljanje pogrešaka u sekvenciranim podatcima treće generacije, namijenjenu za primjenu u određivanju nepoznatih genoma razvio je tim znanstvenika iz Centra za informatiku i računarstvo Instituta Ruđera Boškovića (IRB), Laboratorija za bioinformatiku i računalnu biologiju Fakulteta elektrotehnike i računarstva (FER) Sveučilišta u Zagrebu i A*STAR Genome Institute of Singapore (GIS).
Znanstvenici Robert Vaseri i izv. prof. dr. sc. Mile Šikić s FER-a, dr. sc. Ivan Sović s IRB)-a i dr. sc. Niranjan Nagarajan (GIS) objavili su rezultate istraživanja u u prestižnome časopisu "Genome Research" (IF 11.351) pod naslovom "Fast and accurate de novo genome assembly from long uncorrected reads", priopćio je u petak Ured za odnose s javnošću IRB-a.
Projekt znanstvenika s FER-a pod naslovom "Algoritmi za analizu genomskih sljedova" financirala je Hrvatske zaklada za znanost. dok je rad znanstvenika IRB-a potpomognula Hrvatska akademije znanosti i umjetnosti u sklopu projekta "Metode poravnanja i sastavljanja DNA sekvenci dobivenih sekvenciranjem nanoporama".
"Racon" omogućava ubrzanje i do nekoliko stotina puta u odnosu na postojeće metode
''Racon je zamišljen kao samostalna komponenta za podizanje točnosti rezultata sastavljanja postojećih brzih i nepreciznih metoda. Rezultati su pokazali kako primjena Racona u ovoj kombinaciji omogućava ubrzanje čak i do nekoliko stotina puta u odnosu na postojeće precizne metode, pri čemu zadržava razinu točnosti istih preciznih metoda", navedeno je objašnjenje dr. sc. Ivana Sovića iz Centra za informatiku i računarstvo IRB-a.
Zahvaljujući pak novoj generaciji uređaja za sekvenciranje genoma, koje su razvile tvrtke Pacific Biosciences i Oxford Nanopore Technologies, a koji čitaju puno dulje fragmente od postojećih tehnologija (do nekoliko stotina tisuća nukleotida), znanstvenici su danas na korak do kvalitetnoga i jeftinog određivanja nepoznatih genoma. Istaknuto se i da su se do sada u tim situacijama morali koristiti spori i jako skupi postupci zbog kojih je kod većine vrsta očitani genom fragmentiran, a uključuje i nepoznate dijelove. Problem koji se pojavio kod novih tehnologija sekvenciranja je što imaju veću pogrešku pa zato većina postojećih metoda pokušava prvo smanjiti tu pogrešku međusobnim ispravljanjem očitanih fragmenata, što dugo traje.
"Usporedno i neovisno s kolegom s Broad Instituta (zajednički institut MIT-a i Harvarda) razmatrali smo ideju da se taj korak pokuša preskočiti. Kolega s Broad Institut je prvi objavio rad u kojem je uspio sastaviti genome tim pristupom, no uspio je dobiti samo grubu procjenu sekvence (točnost do 90 posto) pri čemu je ta metoda bila i više od tisuću puta brža od prethodnih, što je za dugačke genome biljaka i kralježnjaka važno", objašnjenje je prof. Šikića koji je i napomenuo da je od presudne važnosti za široku primjenu brzih metoda sastavljanja i potreba za dobivanjem visoke točnosti sastavljenih sekvenci.
Šikić je dodao kako je istraživački tim znanstvenika pokazao i da je moguće postići točnost koja je barem jednaka onima ostalih metoda (više od 99,9 posto) dodatnom korekcijom, a ukupno vrijeme izvođenja obiju metoda je do nekoliko stotina puta kraće od ostalih metoda. Zaključio je kako znanstvenici smatraju da će ovo imati velik utjecaj na efikasno sastavljanje nepoznatih genoma srednje veličine te da brzo određivanje nepoznatih genoma može imati veliki utjecaj na razvoj biologije, medicine i agronomije.
Šikić je objasnio i da je u ovome području ostao problem kako sastaviti one najduže genome tako da ne budu fragmentirani i da nema nedostajućih dijelova, a ostvarenje toga cilja omogućio bi pak da cijena sastavljanja nepoznatog, dugačkog i kompleksnoga genoma padne s dosadašnjih više od 50 milijuna dolara, koliko primjerice sada košta sastavljanje genoma pšenice (što još nije završeno), na samo nekoliko desetaka tisuća dolara.