Tehno
902 prikaza

Styrijin tim: Hrvati razvijaju umjetnu inteligenciju

Umjetna inteligencija
Thinkstock
Kako pomoći čovjeku da nađe proizvod koji je vidio samo na nekoj fotografiji? Hrvatski znanstvenici osmislili su alat koji u nekoliko sekundi to radi umjesto ljudi

Prije deset godina ste kupili fantastične traperice, no one su se toliko izlizale da ne znate više ni tko ih je proizveo, a želite točno takve. I kako ih sad naći? 

Odgovor na to pitanje zna devet zagrebačkih stručnjaka i znanstvenika koji posljednje dvije godine razvijaju metodu strojnog učenja i prepoznavanja slike (Computer Visiona).

Riječ je o Styrijinu Data Science odjelu, a sustav koji razvijaju, bez lažne skromnosti, može se opisati kao domaća verzija najpametnije tražilice koja se bazira na umjetnoj inteligenciji.

Najnoviji projekt lansiran prije nekoliko tjedana je modul za vizualno pretraživanje oglasa na portalu Willhaben.at

To je austrijska verzija najpopularnijeg hrvatskog online oglasnika Njuškala, odnosno oglasnik na kojem korisnici kupuju i prodaju sve - od igle do lokomotive.

Prvi fokus zagrebačkog tima bila je moda jer je u suradnji s Willhabenom upravo taj segment identificiran kao najpopularniji.

Konkretno, osmislili su vizualno pretraživanje oglasa na temelju slike, slično onome kako to rade i Google Image Search ili Pinterest.

Korisnik u sustav unosi fotografiju uslikanu mobitelom te potom pretražuje oglasnik i traži sličan proizvod. 

Sliku implementirate u ovaj sustav i on će vam naći o kojem je kaputu riječ, tko je proizvođač i kolika je njegova cijena.

"Projekt je realiziran u okviru Styrijina Innovation Incubator programa - svojevrsnog korporativnog start-up inkubatora. Inače, modeli strojnog učenja korišteni u projektu istrenirani su od početka na vlastitim podacima, a cijela infrastruktura isprogramirana je od nule i implementirana u cloudu te je rezultat rada hrvatskih stručnjaka", objašnjava Marko Velić, jedan od idejnih kreatora i voditelj Styrijina Data Science odjela.

Modeli umjetne inteligencije (a posebno strojnog učenja) postaju standard u modernim proizvodima i usluga u različitim nišama. Prirodno okruženje za razvoj ovakvih sustava su organizacije koje posjeduju velike količine podataka. 

Grupa metoda koja je temelj ovog projekta je tzv. strojno učenje. Metode strojnog učenja su iskorak u izgradnji suvremenih ICT sustava gdje se klasično programiranje zamjenjuje s algoritmom koji je u stanju naučiti rješavati probleme.

"Na ovaj način postižu se bolji rezultati u rješavanju problema koje je teško riješiti klasičnim programerskim metodama. Primjer toga su razumijevanje napisanog, odnosno prirodnog jezika ili raspoznavanje fotografija", govori Velić.

Posljednjih godina napredak u tehnologiji mikročipova (posebice grafičkih procesora - GPU), dostupnost velikih količina podataka i nekoliko pomaka u znanosti omogućili su revoluciju u području istraživanja i razvoja umjetne inteligencije, posebno metoda iz skupine tzv. neuronskih mreža. 

Neuronske mreže, u suštini metode stare više od 50 godina, bile su vrlo popularne i obećavajuće 90-ih godina.

No slaba računala i nedostatak podataka zaustavili su razvoj tih modela. Zadnjih nekoliko godina situacija se promijenila i neuronske mreže ponovno stupaju na scenu.

Umjesto jednostavnih jednodimenzionalnih neurona koriste se dvodimenzionalni filtri koji prelaze preko slike matematičkim izračunom, pri čemu pojedini filtri “uče” raspoznavati uzorke. Pojednostavljeno skeniraju i mapiraju sliku te daju odgovor o čemu je riječ.

Sličan mehanizam nalazimo i u životinjskom svijetu u dijelu mozga za vid. Slično kao i u vizualnom korteksu, neuroni su u konvolucijskoj mreži organizirani u slojeve, gdje se svaki sljedeći sloj specijalizira za raspoznavanje uzoraka.

Niži slojevi pri tome uče linije, teksture, boje i nijanse, dok viši slojevi kombiniraju ulaze iz ranijih slojeva te uče složenije oblike, detalje i teksture.

"Kako je prvi cilj projekta bio omogućiti vizualno pretraživanje unutar Willhaben sustava, zadatak je bio pronaći način na koji ćemo opisati i pohraniti slike, a da se zadrže vizualna obilježja (boja, teksture, semantika) te istodobno omogući vrlo brza međusobna usporedba s milijunima drugih često i sličnih slika u bazi i sve to u gotovo realnom vremenu", govore stručnjaci iz Styria Data Science odjela. 

Ovaj sustav u suštini mora prepoznati što je na slici. No kako se pokazao izuzetno uspješnim, nametnula se i ideja korištenja u vizualnom pretraživanju. 

Ideja je da se, primjerice, osobi koja pretražuje određene slike na nekom photo stocku odmah ponude i slične opcije.

Postizanje nekoliko postotnih bodova povećanja točnosti na nekom znanstvenom benchmark datasetu je jedna stvar, no pustiti model dubokog učenja u produkciju uz mogućnost posluživanja milijuna korisnika u stvarnom vremenu nešto je posve revolucionarno i korisno svakom čovjeku u svakodnevnom životu.

Zahtjevi po pitanju prometa na Willhabenovu siteu značili su nužan kompromis između ekspresivnosti modela i brzine.

Cijela arhitektura sustava je u potpunosti domaći proizvod koji je u stanju servirati stotine zahtjeva u sekundi s prosječnim vremenom dohvaćanja ispod 100 milisekundi.

"Vizualno pretraživanje mode jest zanimljiv i nov način korištenja ovog sustava, no nećemo na tome stati. U pripremi su još mnoge funkcionalnosti, kako u obradi slike, tako i u obradi teksta. Nakon implementacija na austrijskom Willhabenu, slijede implementacije na Njuškalu i Bolhi te na ostalim portalima Styria grupe, ali i vanjskom tržištu", zaključuje Velić.

Komentiraj, znaš da želiš!

Za komentiranje je potrebno prijaviti se. Nemaš korisnički račun? Registracija je brza i jednostavna, registriraj se i uključi se u raspravu.