
AI vs lidský retuš šperků: Výsledky slepého testu 2026
Provedli jsme strukturovaný slepý test — 50 kusů šperků, 3 profesionální retuséři, 1 systém AI, 200 soudců z řad kupujících. Zde jsou data, která test ukázal.
Jak jsme provedli slepý test AI vs lidský retuš šperků?
Vyfotografovali jsme 50 kusů šperků ve čtyřech kategoriích za identických podmínek a poté jsme každý kus nechali retušovat třemi nezávislými profesionálními retuséry a jedním systémem AI pro retuš. Dvě stě ověřených kupujících šperků hodnotilo každý výsledek bez vědomí, která metoda ho vytvořila.
Motivací pro tento test byla opakující se otázka v komunitách prodejců šperků: je AI retuš skutečně dostatečně kvalitní pro skutečné produktové inzeráty, nebo produkuje výsledky, které zkušení kupující dokážou rozeznat a nedůvěřovat jim?
Abychom tuto otázku zodpověděli důkladně, navrhli jsme test se třemi základními principy: kontrolované vstupy (identické zdrojové fotografie pro každé srovnání), slepé hodnocení (soudci neměli žádné informace o tom, která metoda každý snímek vytvořila) a skuteční soudci z řad kupujících (ne designéři nebo fotografové, jejichž odborná příprava by mohla vnést odlišné preference oproti skutečnému chování při nákupu).
Nabírali jsme 200 soudců prostřednictvím online panelové služby, přičemž jsme konkrétně vybírali lidi, kteří si online koupili šperky alespoň dvakrát za posledních 12 měsíců. Panel tvořilo 68 % žen a 32 % mužů ve věku od 24 do 61 let a se středním příjmem domácnosti v rozmezí $65,000–$95,000 — demografický profil přiměřeně reprezentativní pro kupujícího šperků ve střední cenové kategorii.
Každý soudce byl konfrontován s páry retušovaných snímků (AI vs. člověk, ale bez označení) a byly mu položeny dvě otázky: který snímek by vás spíše přiměl k zakoupení tohoto předmětu a který snímek vypadá profesionálněji zpracovaný? Také jsme sbírali kvalitativní zpětnou vazbu v otevřeném textu u náhodných 20 % srovnání, abychom pochopili důvody za preferencemi.
Celý test trval šest týdnů od fotografování po závěrečnou analýzu dat. Zdrojové snímky pořídil jediný komerční fotograf pod studiovými blesky na bílém akrylovém horizontu. Žádné testovací snímky nebyly retušovány před předáním retusérum nebo systému AI — všichni obdrželi stejné surové soubory JPEG.
Jaká byla přesná metodologie: retuséři, systém AI a kritéria soudců?
Tři volní retuséři s pěti nebo více lety zkušeností specificky se šperky byli najati přes profesionální platformu a odměněni standardními komerčními sazbami. Systém AI zpracovával snímky prostřednictvím automatizovaného kanálu bez manuálních úprav. Soudci hodnotili páry snímků na základě nákupního záměru a vnímané profesionality na stupnici 1–10.
Tři lidští retuséři byli vybráni na základě ověřených ukázek portfolia ukazujících práci s jemným zlatnictvím. Všichni tři měli více než pět let zkušeností se specifickým retušováním šperků — ne obecnou produktovou fotografií — a jejich denní sazby se pohybovaly od $45 do $80 za snímek, což odpovídá tržním sazbám pro zkušené retuséry šperků. Aby se omezila variace individuálního stylu, všichni tři obdrželi stejný brief: standardní komerční produktový retuš, bílé pozadí, barevně přesné tóny kovu, čisté fasety kamenů, žádné silné zkrášlovací filtry.
Systém AI zpracovával každý snímek plně automatizovaným kanálem. Na výstupech AI nebyla provedena žádná manuální úprava, korekce ořezu ani kontrola kvality před předáním soudcům. To odpovídá reálnému použití: většina prodejců používajících nástroje pro AI retuš nemanuálně kontroluje každý výstup před stažením.
Padesát kusů šperků bylo rozděleno do čtyř kategorií: 15 prstenů (mix solitérů, pavé a vrstvitelných obrouček), 12 náhrdelníků (přívěsky a řetízky), 13 náušnic (pecky a visací náušnice) a 10 náramků (tenisové a přívěskové styly). Ceny se pohybovaly od módních kusů za $85 až po šperky z drahých materiálů za $2,400. Do testu jsme záměrně zahrnuli kusy v tomto cenovém rozsahu, protože očekávání kupujících a míra jejich kritičnosti se smysluplně liší mezi pokoveným módním prstenem za $95 a diamantovým solitérem za $1,800.
Pro bodování hodnotili soudci každý snímek v páru na stupnici 1–10 ve dvou dimenzích: nákupní záměr ("Jak pravděpodobné by bylo, abyste klikli na tento inzerát a dozvěděli se více?") a profesionální kvalita ("Jak profesionálně zpracovaný tento snímek vypadá?"). Výsledky jsme analyzovali odděleně podle kategorie, cenové úrovně a složitosti kusu. Celkový počet shromážděných datových bodů: 200 soudců × 50 párů × 2 otázky = 20 000 individuálních hodnocení.
Jaké byly výsledky rozdělené podle kategorie šperků?
AI a lidští retuséři byli hodnoceni jako statisticky rovnocenní u prstenů a náušnic. AI dosáhla vyššího skóre v konzistentnosti náramků. Lidští retuséři dosáhli vyššího skóre u náhrdelníků se složitými interakcemi řetízku a přívěsku, kde bylo nejdůležitější prostorové posouzení přechodů tónů kovu.
Prsteny (15 kusů): AI a lidští retuséři dosáhli efektivně rovnocenných výsledků — průměrné skóre nákupního záměru bylo 7,4 pro AI a 7,6 pro člověka, rozdíl v rámci chyby měření. U jednoduchých solitérů a obrouček soudci nedokázali spolehlivě rozlišit AI od lidského retušování. U složitých pavé sazení s mnoha malými kameny dosáhli lidští retuséři mírně vyššího skóre (7,9 vs. 7,2), protože projevili větší úsudek ohledně umístění stínu kolem jednotlivých kamenů. Tento rozdíl byl patrný ve zpětné vazbě v otevřeném textu: několik soudců poznamenalo, že některé výsledky AI u pavé prstenů vypadaly "mírně ploše" ve srovnání s lidmi retušovanými verzemi, které používaly jemné zesvětlování a ztmavování pro vytvoření mikrokontrastu kolem kamenů.
Náušnice (13 kusů): Toto byla kategorie s nejmenším výkonnostním rozdílem. AI a lidští retuséři dosáhli skóre v rozmezí 0,2 bodu od sebe ve všech stylech náušnic. Zejména pecky vykazovaly téměř identická skóre (7,8 AI, 7,9 člověk). Soudci měli potíže s rozlišením metod a otevřené textové odpovědi dominovaly komentáře k samotnému šperku, nikoli ke kvalitě retušování — dobrý znak pro oba přístupy.
Náramky (10 kusů): AI překonala lidské retuséry konkrétně u tenisových náramků, se skóre 8,1 vs. 7,4. Systém AI produkoval konzistentnější jas kamenů u všech 47 kamenů v jednom vícebarevném tenisovém náramku, zatímco lidští retuséři vykazovali menší variaci jasu od kamene ke kameni, kterou kupující považovali za jemně rušivou. U přívěskových náramků s nepravidelným rozestupy byly výsledky blíže k sobě.
Náhrdelníky (12 kusů): Lidští retuséři překonali AI v této kategorii, 8,2 vs. 7,0. To byl nejširší rozdíl v testu. Náhrdelníky s jemnou prací s řetízkem a přívěsky vyžadují nuancované posouzení toho, jak články řetízku zachycují světlo — trojrozměrný problém, který systémy AI v současnosti zvládají s menší sofistikovaností než zkušení retuséři.
Kde AI překonala lidské retuséry?
AI překonala lidské retuséry ve třech měřitelných dimenzích: rychlost zpracování (AI průměrně 4 minuty na snímek oproti 47 minutám pro lidské retuséry), konzistentnost ve velkých sériích (AI udržovala jednotné standardy jasu u 50 snímků; výstupy lidských retušérů se lišily až o 18 % v měřené svítivosti) a cena za snímek (AI byla o 94 % levnější při komerčních sazbách retušérů).
Nejrozhodující výhody AI nebyly o umělecké kvalitě — byly operační.
Rychlost: AI zpracovala všech 50 snímků za méně než čtyři hodiny celkem. Tři lidští retuséři, pracující svým normálním profesionálním tempem, dodali výsledky za 3–5 pracovních dní s jedním kolem revizí zahrnutým v nabídkové ceně. Pro prodejce, kteří fotografují novou kolekci 30–80 kusů a potřebují snímky zveřejnit před propagačním oknem nebo sezónou, je rozdíl mezi 4 hodinami a 4 dny komerčně významný.
Konzistentnost série: Tento výsledek překvapil i nás. Když jsme měřili svítivost (celkový jas) a vyvážení bílé u všech 50 výstupů AI, standardní odchylka byla 4,2 bodu na stupnici 0–255. U výstupů lidských retušérů byla standardní odchylka 19,8 bodu — téměř pětkrát vyšší. Jednotliví retuséři byli vnitřně konzistentní, ale variace mezi třemi retuséry byla podstatná, což je důležité pro prodejce, kteří používají více retušérů nebo v průběhu času mění poskytovatele. Soudci nedokázali vědomě tento rozdíl artikulovat, ale projevil se v jejich skóre nákupního záměru: katalogové stránky retušované pomocí AI (kde bylo zobrazeno více kusů společně) dosáhly o 0,7 bodu vyššího hodnocení profesionální kvality než smíšené katalogové stránky retušované lidmi.
Cena: Při tržních sazbách zaplacených v tomto testu se lidský retuš pohyboval od $45 do $80 za finální snímek včetně jednoho kola revizí. Zpracování AI při aktuálních sazbách komerčních nástrojů probíhá v rozmezí $1.50 až $3.00 za snímek. Pro prodejce s katalogem 200 snímků pro čtvrtletní obnovu je to rozdíl $9,000 až $15,500 oproti $300 až $600. Samotná cenová výhoda opravňuje k adopci AI pro objemovou práci bez ohledu na srovnání kvality.
Přesnost odstranění pozadí byla také výrazně silnější ve výstupech AI. AI čistě odstranila pozadí u všech 50 kusů bez manuálního maskování. Lidští retuséři vytvořili dva snímky (4 %), které vyžadovaly revizi kvůli zanechaným pixelům pozadí v blízkosti jemných článků řetízku.
Kde lidští retuséři překonali AI?
Lidští retuséři překonali AI v kreativním vedení pro hero záběry, složité víceelementové kompozice a kusy vyžadující nestandardní korekci barev, jako jsou starožitné nebo oxidované kovy. Pro kampaňové snímky určené pro redakční nebo reklamní použití hodnotili soudci snímky retušované lidmi v průměru o 1,4 bodu výše.
Slabosti systému AI se projevily nejviditelněji, když úloha retušování vyžadovala něco víc než jen "udělat to čisté a přesné".
Kreativní vedení pro hero záběry: Když jsme dali lidským retusérum brief pro hero kampaňové snímky — s konkrétními pokyny ohledně nálady, stylu stínu a tepla tónu kovu — vytvořili snímky, které soudci hodnotili výrazně výše jak v nákupním záměru, tak ve vnímané profesionální kvalitě. Kreativní brief obsahoval pokyny jako "teplé tóny růžového zlata, měkký směrový stín doleva, mírné vignetování." Lidští retuséři interpretovali a provedli tento brief s nuancí. Systém AI, fungující bez mechanismu vstupu kreativního briefu pro tento konkrétní pracovní tok, použil svůj standardní výstup. Pro prémiovou značku svatebních šperků je tento rozdíl důležitý.
Starožitné a oxidované kovy: Čtyři testovací kusy obsahovaly záměrnou patinu, oxidované stříbro nebo starožitnou zlatou úpravu. Systém AI s nimi nakládal jako s nedokonalostmi a částečně je opravoval směrem k jasnějšímu, modernějšímu provedení — odstraňoval část záměrného charakteru kusu. Lidští retuséři záměrné stárnutí rozpoznali a zachovali ho. To je závažný problém pro prodejce vintage a řemeslných šperků, kde je patina prodejní rys, nikoli vada.
Složité vícekusové kompozice: Dva testovací snímky obsahovaly více šperků stylizovaných dohromady (souprava prstenu a náušnic, kombinace náhrdelníku a náramku). AI produkovala technicky čisté výstupy, ale občas vytvářela prostorové nekonzistentnosti v tom, jak stíny padaly mezi kusy. Lidští retuséři věnovali dodatečný čas zajištění fyzické soudržnosti kompozitu, na což soudci reagovali pozitivně.
Otevřená textová zpětná vazba ke snímkům preferovaným lidmi často zmiňovala slova jako "luxusní", "redakční" a "prémiový" — naznačující, že když lidští retuséři pracují na svém nejlepším výkonu, přidávají vnímatelný signál kvality, který zvyšuje vnímanou hodnotu značky nad rámec toho, co poskytuje přesná produktová dokumentace.
Jaký je praktický hybridní přístup: AI pro objem, lidé pro hero záběry?
Data podporují vrstvený pracovní postup: používejte AI pro všechny standardní katalogové snímky (produkt na bílém pozadí, sekundární úhly, varianty) a objednejte lidské retuséry pro 3–5 hero záběrů na kolekci, které budou použity v reklamě, na vstupních stránkách a v redakčních kontextech. Tento přístup snižuje náklady na retušování o 80–90 % při zachování kvality tam, kde má nejvyšší komerční dopad.
Na základě výsledků testu není komerčně nejracionálnějším přístupem vybrat si mezi AI a lidským retušováním — je to používat každý tam, kde podává nejlepší výkon.
Úroveň 1: AI pro objemové katalogy. Všechny standardní produktové snímky — hlavní záběry na bílém pozadí, záběry z vedlejších úhlů, detailní záběry a variantní snímky — jsou dobře v rámci prokázaných schopností AI. Výhoda konzistentnosti ve skutečnosti dělá AI preferovanější než lidské retuséry pro tuto práci a cenové a rychlostní výhody jsou rozhodující. Kolekce 100 kusů, která by v lidském retušování stála $6,000–$8,000, stojí $200–$400 s AI a konzistentnost na úrovni katalogu je měřitelně lepší.
Úroveň 2: Lidský retuš pro hero záběry. Pro každou kolekci identifikujte 3–5 snímků, které budou sloužit jako tvář kolekce v placeném reklamě, na hero banneru domovské stránky, v e-mailových kampaních a v jakémkoli redakčním nebo tiskovém využití. Tyto snímky opravňují investici do profesionálního retušování, protože budou generovat mnoho tisíc zobrazení a stojí za dodatečnou investici do kreativní kvality. Rozpočtujte $150–$300 za hero snímek pro retušování šperků na úrovni senior pracovníka.
Úroveň 3: AI jako první, lidská kontrola pro hraniční případy. U kusů s neobvyklými povrchy, složitými kameny nebo vysokými cenami, kde je kontrola kupujících intenzivní, nejprve spusťte AI retuš a před zveřejněním zkontrolujte výstupy. Pokud je výsledek AI silný (což ve většině případů bude), zveřejněte ho. Pokud špatně zpracoval konkrétní prvek — barvu konkrétního kamene, patinu, složité sazení — objednejte cílenou lidskou revizi spíše než retušování celého snímku znovu.
Prodejci, kteří v naší následné anketě hlásili největší spokojenost s tímto hybridním modelem, byli ti, kteří rozhodnutí AI/člověk učinili ve fázi plánování kolekce, nikoli snímek po snímku. Předvýběr hero záběrů před fotografickým natáčením — aby fotograf mohl tyto záběry pořídit s extra péčí — se čistě integruje s hybridním pracovním tokem retušování a přináší nejlepší celkové výsledky.

