
AI vs. čovjek u retušu nakita: Rezultati slijepog testa 2026.
Proveli smo strukturirani slijepi test — 50 komada nakita, 3 profesionalna retušera, 1 AI sustav, 200 kupaca kao sudaca. Evo što su podaci pokazali.
Kako smo proveli slijepi test AI-ja vs. čovjeka u retušu nakita?
Fotografirali smo 50 komada nakita u četiri kategorije pod identičnim uvjetima, a zatim je svaki komad retuširao tri neovisna profesionalna retušera i jedan AI sustav za retuš. Dvjesto verificiranih kupaca nakita ocijenilo je svaki rezultat ne znajući kojom metodom je nastao.
Motivacija za ovaj test došla je iz ponavljajućeg pitanja u zajednicama prodavača nakita: je li AI retuš zaista dovoljno dobar za stvarne popise proizvoda, ili proizvodi rezultate koje iskusni kupci mogu prepoznati i kojima ne vjeruju?
Da bismo odgovorili na to pitanje temeljito, osmislili smo test s tri osnovna načela: kontrolirani ulazni podaci (identične izvorne fotografije za svaku usporedbu), slijepa evaluacija (suci nisu imali informacije o tome kojom metodom je nastala svaka slika) i stvarni kupci kao suci (ne dizajneri ili fotografe čija bi stručna obuka mogla uvesti drugačije preferencije od stvarnog kupovnog ponašanja).
Regrutirali smo 200 sudaca putem usluge online panela, specifično provjeravajući ljude koji su kupili nakit online barem dva puta u prethodnih 12 mjeseci. Panel je bio 68% ženski i 32% muški, s dobi od 24 do 61 godine i medijalnom kategorijom prihoda kućanstva od $65.000–$95.000 — demografski profil koji razumno predstavlja kupca nakita srednjeg tržišta.
Svakom sucu pokazivani su parovi retuširanih slika (AI vs. čovjek, ali bez oznake) i postavljana su dva pitanja: koja slika bi vas više potaknula na kupnju ovog predmeta, i koja slika izgleda profesionalnije? Također smo prikupili kvalitativne povratne informacije otvorenog teksta na nasumičnih 20% usporedbi kako bismo razumjeli razloge iza preferencija.
Cijeloviti test trajao je šest tjedana od fotografiranja do završne analize podataka. Izvorne slike snimio je jedan komercijalni fotograf pod studijskim stroboskopskim osvjetljenjem na bijeloj akrilnoj podlozi. Nijedna testna slika nije bila retuširana prije dostave retušerima ili AI sustavu — svi su primili iste izvorne JPEG datoteke.
Kakva je bila točna metodologija: retušeri, AI sustav i kriteriji sudaca?
Tri slobodnjačka retušera s pet ili više godina iskustva specifičnog za nakit angažirana su putem profesionalne platforme i plaćena standardnim komercijalnim cijenama. AI sustav obrađivao je slike kroz automatizirani cjevovod bez ručnog podešavanja. Suci su ocjenjivali parove slika prema namjeri kupnje i percipiranoj profesionalnosti na skali od 1 do 10.
Tri ljudska retušera odabrana su na temelju verificiranih uzoraka portfelja koji prikazuju rad s finim nakitom. Sva trojica imala su više od pet godina iskustva specifično u retušu nakita — ne opće fotografije proizvoda — a njihove dnevne cijene kretale su se od $45 do $80 po slici, u skladu s tržišnim cijenama za iskusne retušere nakita. Kako bi se smanjila varijacija individualnog stila, sva trojica dobila su isti brief: standardni komercijalni retuš proizvoda, bijela pozadina, boje metala točne po boji, čiste fasete kamenja, bez jakih filtera uljepšavanja.
AI sustav obrađivao je svaku sliku kroz potpuno automatizirani cjevovod. Na AI izlazima nisu izvršena ručna podešavanja, korekcije izreza niti provjere kvalitete prije nego što su dostavljeni sucima. To odražava stvarnu upotrebu: većina prodavača koji koriste AI alate za retuš ne pregledava ručno svaki izlaz prije preuzimanja.
50 komada nakita raspoređeno je u četiri kategorije: 15 prstenja (mješavina solitera, pavé i složivih narukvica), 12 ogrlica (privjesci i lanci), 13 naušnica (čepići i viseće) i 10 narukvica (teniski i charm stilovi). Cijene su se kretale od modnih komada od $85 do finog nakita vrijednog $2.400. Uključili smo komade u ovom rasponu cijena namjerno, jer se kupačeva očekivanja i razina provjere značajno razlikuju između prstenа od $95 i dijamantnog solitera od $1.800.
Za ocjenjivanje, suci su ocjenjivali svaku sliku u paru od 1 do 10 na dvije dimenzije: namjera kupnje ("Koliko biste vjerovatno kliknuli na ovaj oglas da saznate više?") i profesionalna kvaliteta ("Koliko profesionalno izgleda ova slika?"). Rezultate smo analizirali zasebno po kategoriji, cjenovnom razredu i složenosti komada. Ukupno prikupljeni podaci: 200 sudaca × 50 parova × 2 pitanja = 20.000 pojedinačnih ocjena.
Kakvi su bili rezultati po kategorijama nakita?
AI i ljudski retušeri ocijenjeni su statistički jednako na prstenima i naušnicama. AI je postigao više rezultate na konzistentnosti narukvica. Ljudski retušeri postigli su više rezultate na ogrlicama sa složenim interakcijama lanca i privjeska, gdje je prostorna procjena o gradijentima tonova metala bila najvažnija.
Prstenje (15 komada): AI i ljudski retušeri proizveli su praktično jednake rezultate — prosječni rezultati namjere kupnje bili su 7,4 za AI i 7,6 za čovjeka, razlika unutar margine pogreške. Za jednostavne solitere i prstenje s trakom, suci nisu mogli pouzdano razlikovati AI od ljudskog retuša. Za složene pavé postave s mnogo malih kamenja, ljudski retušeri postigli su nešto više rezultate (7,9 vs. 7,2) jer su pokazali više prosudbe o postavljanju sjena oko pojedinih kamenja. Razlika je bila vidljiva u povratnim informacijama otvorenog teksta: nekoliko sudaca primijetilo je da neki AI rezultati na pavé prstenima izgledaju "pomalo ravno" u usporedbi s ljudski retuširanim verzijama koje su koristile suptilne tehnike dodge-and-burn za stvaranje mikrokontrasta oko kamenja.
Naušnice (13 komada): Ovo je bila kategorija s najmanjom razlikom u performansama. AI i ljudski retušeri postigli su razliku unutar 0,2 boda u svim stilovima naušnica. Čepići su posebno pokazali gotovo identične rezultate (7,8 AI, 7,9 čovjek). Suci su imali poteškoća razlikovati metode, a odgovori otvorenog teksta bili su dominantno komentari o samom nakitu, a ne o kvaliteti retuša — dobar znak za oba pristupa.
Narukvice (10 komada): AI je nadmašio ljudske retušere specifično na teniskim narukvicama, postigavši 8,1 vs. 7,4. AI sustav je proizveo konzistentnije svjetlinu kamenja na svih 47 kamenja u jednoj višekamenu tenisku narukvici, dok su ljudski retušeri pokazali manje varijacije u svjetlini od kamena do kamena koje su kupci smatrali suptilno neugodnim. Za charm narukvice s nepravilnim razmacima, rezultati su bili bliži.
Ogrlice (12 komada): Ljudski retušeri nadmašili su AI u ovoj kategoriji, 8,2 vs. 7,0. Ovo je bio najširi jaz u testu. Ogrlice s finim radom lanca i privjescima zahtijevaju nijansiranu prosudbu o tome kako karike lanca hvataju svjetlost — trodimenzionalni problem koji AI sustavi trenutno rješavaju s manje sofisticiranosti od iskusnih retušera.
Gdje je AI nadmašio ljudske retušere?
AI je nadmašio ljudske retušere na tri mjerljive dimenzije: brzina isporuke (AI je u prosjeku obrađivao 4 minute po slici vs. 47 minuta za ljudske retušere), konzistentnost u velikim serijama (AI je održavao uniformne standarde svjetline na 50 slika; ljudski izlazi varirali su do 18% u izmjerenom osvjetljenju) i cijena po slici (AI je bio 94% jeftiniji po komercijalnim cijenama retušera).
Najodlučnije prednosti AI-ja nisu bile o umjetničkoj kvaliteti — bile su operativne.
Brzina: AI je obradio svih 50 slika za manje od četiri sata ukupno. Tri ljudska retušera, radeći normalnim profesionalnim tempom, isporučila su rezultate za 3–5 radnih dana s jednom rundом revizija uključenom u ponuđenu cijenu. Za prodavače koji fotografiraju novu kolekciju od 30–80 komada i trebaju slike živima prije promotivnog prozora ili sezone, razlika između 4 sata i 4 dana komercijalno je značajna.
Konzistentnost serije: Ovaj rezultat iznenadio je čak i nas. Kada smo izmjerili svjetlinu i balans bijele boje na svih 50 AI izlaza, standardna devijacija bila je 4,2 boda na skali od 0 do 255. Na izlazima ljudskih retušera, standardna devijacija bila je 19,8 bodova — gotovo pet puta veća. Pojedinačni retušeri bili su interno konzistentni, ali varijacija između trojice retušera bila je značajna, što je važno za prodavače koji koriste više retušera ili mijenjaju pružatelje usluga s vremenom. Suci nisu mogli svjesno artikulirati ovu razliku, ali pokazala se u njihovim rezultatima namjere kupnje: kataloške stranice retuširane AI-jem (gdje je prikazano više komada zajedno) postigle su 0,7 bodova više na profesionalnoj kvaliteti u usporedbi s mješovitim kataloške stranice retuširanima od strane čovjeka.
Troškovi: Po tržišnim cijenama plaćenim u ovom testu, ljudski retuš kretao se od $45 do $80 po završnoj slici uključujući jednu rundu revizija. AI obrada po trenutnim komercijalnim cijenama alata kreće se između $1,50 i $3,00 po slici. Za prodavača s katalogom od 200 slika koji se obnavlja kvartalno, to je razlika od $9.000 do $15.500 vs. $300 do $600. Prednost u troškovima sama po sebi opravdava usvajanje AI-ja za volumni rad bez obzira na usporedbe kvalitete.
Točnost uklanjanja pozadine bila je također posebno jača u AI izlazima. AI je čisto uklonio pozadine na svih 50 komada bez ručnog maskiranja. Ljudski retušeri proizveli su dvije slike (4%) koje su zahtijevale reviziju zbog propuštenih piksela pozadine blizu finih karika lanca.
Gdje su ljudski retušeri nadmašili AI?
Ljudski retušeri nadmašili su AI u kreativnom usmjeravanju za hero snimke, složene kompozicije s više elemenata i komade koji zahtijevaju nestandardnu korekciju boja kao što su antikvitetni ili oksidirani metali. Za kampanjske slike namijenjene uredničkoj ili reklamnoj upotrebi, suci su u prosjeku ocijenili slike retuširane od strane čovjeka 1,4 boda više.
Slabosti AI sustava postale su najvidljivije kada je zadatak retuša zahtijevao nešto više od "učini da ovo izgleda čisto i točno."
Kreativno usmjeravanje hero snimki: Kada smo dali ljudskim retušerima brief za hero-razredne kampanjske slike — s posebnim uputama o raspoloženju, stilu sjene i toplini tona metala — oni su proizveli slike koje su suci ocijenili primjetno više na namjeri kupnje i percipiranoj profesionalnoj kvaliteti. Kreativni brief uključivao je upute poput "tople nijanse ružičastog zlata, mekana smjerna sjena prema donjem lijevom kutu, blagi vignet." Ljudski retušeri interpretirali su i izveli ovaj brief s nijansama. AI sustav, koji je radio bez mehanizma za unos kreativnog briefa za ovaj specifični tijek rada, koristio se standardnim izlazom. Za brend vjenčanog nakita visokog razreda, ova razlika je važna.
Antikvitetni i oksidirani metali: Četiri testna komada uključivala su namjernu patinu, oksidirano srebro ili antikvitetne zlatne završetke. AI sustav tretirao je ove elemente kao nesavršenosti i djelomično ih korigirao prema svjetlijem, modernijim završetku — uklanjajući dio namjernog karaktera komada. Ljudski retušeri prepoznali su namjerno starenje i sačuvali ga. Ovo je značajan problem za prodavače vintage i zanatskog nakita gdje je patina prodajni element, a ne nedostatak.
Složene kompozicije s više komada: Dvije testne slike uključivale su više komada nakita stiliziranih zajedno (set prstena i naušnica, slaganje ogrlice i narukvice). AI je proizveo tehnički čiste izlaze, ali je povremeno stvarao prostorne nedosljednosti u tome kako su sjene pale između komada. Ljudski retušeri proveli su dodatno vrijeme osiguravajući da se kompozit osjeća fizički koherentno, na što su suci reagirali pozitivno.
Povratne informacije otvorenog teksta na slike preferirane od strane čovjeka često su sadržavale riječi poput "luksuzno," "uredničko" i "visoka klasa" — sugerirajući da kada ljudski retušeri rade na vrhuncu svojih mogućnosti, dodaju perceptivni signal kvalitete koji povećava percipiranu vrijednost brenda izvan onoga što točna dokumentacija proizvoda pruža.
Koji je praktični hibridni pristup: AI za volumen, čovjek za hero snimke?
Podaci podupiru višerazinski tijek rada: koristite AI za sve standardne kataloške slike (proizvod na bijeloj podlozi, sekundarski kutovi, varijante) i naručite ljudske retušere za 3–5 hero snimki po kolekciji koje će biti korištene u oglašavanju, odredišnim stranicama i uredničkim kontekstima. Ovaj pristup smanjuje troškove retuša za 80–90% uz očuvanje kvalitete gdje ima najveći komercijalni utjecaj.
Na temelju rezultata testa, komercijalno najracionalniji pristup nije odabir između AI i ljudskog retuša — već je korištenje svakog tamo gdje najbolje funkcionira.
Razina 1: AI za kataloški volumen. Sve standardne slike proizvoda — glavne snimke na bijeloj pozadini, snimke sekundarnih kutova, detalji iz blizine i slike varijanti — dobro su unutar demonstrirane sposobnosti AI-ja. Prednost konzistentnosti zapravo čini AI poželjnijim od ljudskih retušera za ovaj posao, a prednosti u trošku i brzini su odlučujuće. Kolekcija od 100 komada koja bi koštala $6.000–$8.000 u ljudskom retušu košta $200–$400 s AI-jem, a konzistentnost na razini kataloga mjerljivo je bolja.
Razina 2: Ljudski retuš za hero snimke. Za svaku kolekciju identificirajte 3–5 slika koje će služiti kao lice kolekcije u plaćenom oglašavanju, hero banneru početne stranice, email kampanjama i svakoj uredničkoj ili tiskovnoj upotrebi. Te slike opravdavaju profesionalnu investiciju u retuš jer će generirati mnoge tisuće dojmova i vrijedne su dodatne investicije u kreativnu kvalitetu. Budžetirajte $150–$300 po hero slici za retuš nakita na višoj razini.
Razina 3: AI prvo, pregled čovjeka za rubne slučajeve. Za komade s neobičnim završecima, složenim kamenjem ili visokim cijenama gdje je kupčeva provjera intenzivna, pokrenite AI retuš prvo i pregledajte izlaze prije objave. Ako je AI rezultat jak (što će biti u većini slučajeva), objavite ga. Ako je pogrešno obradio određeni element — boju određenog kamena, patinu, složenu postavu — naručite ciljanu ljudsku reviziju umjesto ponovnog retuša cijele slike.
Prodavači koji su izvijestili o najvećem zadovoljstvu s ovim hibridnim modelom u našoj naknadnoj anketi bili su oni koji su donijeli odluku AI/čovjek u fazi planiranja kolekcije, a ne sliku po sliku. Predodabir hero snimki prije snimanja fotografija — tako da fotograf može snimiti te kadrove s dodatnom pažnjom — čisti se integrira s hibridnim tijekom rada za retuš i daje najbolje ukupne rezultate.

