
ИИ против человека: результаты слепого теста ретуши ювелирных изделий 2026
Мы провели структурированный слепой тест — 50 ювелирных изделий, 3 профессиональных ретушёра, 1 система ИИ, 200 покупателей в роли судей. Вот что показали данные.
Как мы проводили слепой тест ретуши ювелирных изделий: ИИ против человека?
Мы сфотографировали 50 ювелирных изделий четырёх категорий в идентичных условиях, затем каждое изделие было обработано тремя независимыми профессиональными ретушёрами и одной системой ИИ. Двести подтверждённых покупателей ювелирных изделий оценивали результаты, не зная, каким методом было получено каждое изображение.
Поводом для этого теста послужил вопрос, регулярно возникающий в сообществах продавцов ювелирных изделий: действительно ли ретушь с помощью ИИ достаточно качественна для реальных товарных листингов, или она даёт результаты, которые опытные покупатели могут распознать и которым перестают доверять?
Чтобы ответить на этот вопрос строго, мы разработали тест на трёх ключевых принципах: контролируемые исходные данные (идентичные исходные фотографии для каждого сравнения), слепая оценка (судьи не имели информации о том, каким методом получено каждое изображение) и реальные покупатели в роли судей (не дизайнеры и не фотографы, чья профессиональная подготовка могла бы привнести предпочтения, отличные от реального покупательского поведения).
Мы набрали 200 судей через сервис онлайн-панелей, отбирая исключительно тех, кто покупал ювелирные изделия онлайн не менее двух раз за последние 12 месяцев. В панели было 68% женщин и 32% мужчин в возрасте от 24 до 61 года со средним доходом домохозяйства $65 000–$95 000 — демографический профиль, разумно отражающий среднерыночного покупателя ювелирных изделий.
Каждому судье показывали пары обработанных изображений (ИИ против человека, но без подписей) и задавали два вопроса: какое изображение склонит вас к покупке данного товара, и какое выглядит более профессионально? Мы также собирали качественные текстовые отзывы по случайным 20% сравнений, чтобы понять логику предпочтений.
Полный тест занял шесть недель — от фотосъёмки до финального анализа данных. Исходные изображения снимал один коммерческий фотограф в студии со вспышечным освещением на белом акриловом фоне. Ни одно из тестовых изображений не подвергалось ретуши перед передачей ретушёрам или системе ИИ — все получили одинаковые необработанные файлы JPEG.
Какова была точная методология: ретушёры, система ИИ и критерии оценки?
Три фрилансера-ретушёра с опытом работы с ювелирными изделиями не менее пяти лет были наняты через профессиональную платформу по стандартным коммерческим ставкам. Система ИИ обрабатывала изображения через автоматизированный конвейер без ручной настройки. Судьи оценивали пары изображений по намерению совершить покупку и воспринимаемому профессионализму по шкале от 1 до 10.
Три ретушёра-человека были отобраны на основе подтверждённых портфолио с работами по ювелирным изделиям. Все трое имели более пяти лет опыта ретуши именно ювелирных изделий, а не общей предметной фотографии, а их дневные ставки варьировались от $45 до $80 за изображение, что соответствует рыночным ставкам для опытных ретушёров ювелирной тематики. Для снижения индивидуальных стилевых различий все трое получили одинаковое техническое задание: стандартная коммерческая ретушь продукта, белый фон, цветопередача металлов, чистые грани камней, без тяжёлых фильтров-украшений.
Система ИИ обрабатывала каждое изображение через полностью автоматизированный конвейер. Перед передачей судьям к выходным данным ИИ не применялись никакие ручные правки, корректировки кадрирования или проверки качества. Это отражает реальное использование: большинство продавцов, применяющих инструменты ИИ-ретуши, не проверяют каждый результат вручную перед скачиванием.
50 ювелирных изделий были распределены по четырём категориям: 15 колец (солитеры, паве и составные обручальные кольца), 12 ожерелий (подвески и цепочки), 13 серёг (пуссеты и подвески) и 10 браслетов (теннисные и шарм-браслеты). Стоимость варьировалась от $85 за fashion-изделия до $2 400 за ювелирные украшения. Мы намеренно включили изделия в этом ценовом диапазоне, поскольку ожидания покупателей и уровень их придирчивости существенно различаются для кольца с позолотой за $95 и бриллиантового солитера за $1 800.
Для подсчёта баллов судьи оценивали каждое изображение в паре от 1 до 10 по двум критериям: намерение купить («Насколько вероятно, что вы кликнете на этот листинг, чтобы узнать больше?») и профессиональное качество («Насколько профессионально выглядит это изображение?»). Мы анализировали результаты отдельно по категории, ценовому уровню и сложности изделия. Всего собрано точек данных: 200 судей × 50 пар × 2 вопроса = 20 000 индивидуальных оценок.
Каковы результаты в разбивке по категориям ювелирных изделий?
ИИ и ретушёры-люди получили статистически эквивалентные оценки для колец и серёг. ИИ набрал более высокие баллы за стабильность результатов для браслетов. Ретушёры-люди получили более высокие оценки для ожерелий со сложными взаимодействиями цепочки и подвески, где важнее всего было пространственное суждение о градиентах тонов металла.
Кольца (15 изделий): ИИ и ретушёры-люди показали фактически эквивалентные результаты — средние баллы по намерению купить составили 7,4 у ИИ и 7,6 у человека, разница находится в пределах погрешности. Для простых солитеров и гладких колец судьи не могли надёжно отличить ретушь ИИ от человеческой. Для сложных паве-оправ со множеством мелких камней ретушёры-люди набрали немного выше (7,9 против 7,2), поскольку проявляли больше суждения о расстановке теней вокруг отдельных камней. Разница проявилась в открытых текстовых отзывах: несколько судей отметили, что некоторые результаты ИИ для паве-колец выглядели «слегка плоскими» по сравнению с обработанными людьми версиями, где применялись тонкие техники dodge-and-burn для создания микроконтраста вокруг камней.
Серьги (13 изделий): Это была категория с наименьшим разрывом в результатах. ИИ и ретушёры-люди набрали разницу не более 0,2 балла по всем стилям серёг. Пуссеты показали практически идентичные оценки (7,8 у ИИ, 7,9 у человека). Судьи с трудом различали методы, а в открытых текстовых ответах преобладали комментарии о самих ювелирных изделиях, а не о качестве ретуши — хороший знак для обоих подходов.
Браслеты (10 изделий): ИИ превзошёл ретушёров-людей именно для теннисных браслетов, набрав 8,1 против 7,4. Система ИИ обеспечила более равномерную яркость камней по всем 47 камням одного многокаменного теннисного браслета, тогда как ретушёры-люди показали незначительные колебания яркости от камня к камню, которые покупатели находили едва уловимо отвлекающими. Для шарм-браслетов с неравномерным расположением результаты были ближе.
Ожерелья (12 изделий): Ретушёры-люди превзошли ИИ в этой категории — 8,2 против 7,0. Это был наибольший разрыв в тесте. Ожерелья с тонкой работой цепочки и подвесками требуют тонкого суждения о том, как звенья цепи улавливают свет — трёхмерная задача, с которой системы ИИ справляются с меньшим мастерством, чем опытные ретушёры.
Где ИИ превзошёл ретушёров-людей?
ИИ превзошёл ретушёров-людей по трём измеримым параметрам: скорость обработки (ИИ в среднем 4 минуты на изображение против 47 минут у ретушёров-людей), стабильность при обработке больших партий (ИИ поддерживал единые стандарты яркости на всех 50 изображениях; результаты людей варьировались до 18% по измеренной светимости) и стоимость одного изображения (ИИ оказался на 94% дешевле по коммерческим ставкам ретушёров).
Самые весомые преимущества ИИ касались не художественного качества — они были операционными.
Скорость: ИИ обработал все 50 изображений менее чем за четыре часа суммарно. Три ретушёра-человека, работая в своём обычном профессиональном темпе, предоставили результаты за 3–5 рабочих дней с одним раундом правок, включённым в указанную ставку. Для продавцов, фотографирующих новую коллекцию из 30–80 изделий и нуждающихся в публикации изображений до рекламного окна или сезона, разница между 4 часами и 4 днями имеет коммерческое значение.
Стабильность партии: Этот результат удивил даже нас. Когда мы измерили светимость (общую яркость) и баланс белого по всем 50 результатам ИИ, стандартное отклонение составило 4,2 балла по шкале 0–255. По результатам ретушёров-людей стандартное отклонение составило 19,8 балла — почти в пять раз больше. Отдельные ретушёры были внутренне последовательны, но вариация между тремя ретушёрами была существенной, что важно для продавцов, пользующихся несколькими ретушёрами или меняющих исполнителей со временем. Судьи не могли сознательно сформулировать это различие, но оно проявилось в их оценках намерения купить: страницы каталога с ретушью ИИ (где несколько изделий показаны вместе) набрали на 0,7 балла выше по профессиональному качеству, чем страницы смешанного каталога с ретушью людей.
Стоимость: По рыночным ставкам, применявшимся в этом тесте, ретушь людьми варьировалась от $45 до $80 за финальное изображение с одним раундом правок. Обработка ИИ по текущим коммерческим ставкам инструментов стоит от $1,50 до $3,00 за изображение. Для продавца, обновляющего квартальный каталог из 200 изображений, это разница $9 000–$15 500 против $300–$600. Ценовое преимущество само по себе оправдывает внедрение ИИ для объёмных работ вне зависимости от сравнений качества.
Точность удаления фона также была заметно выше у ИИ. ИИ чисто удалил фон на всех 50 изделиях без ручного маскирования. Ретушёры-люди создали два изображения (4%), потребовавших правки из-за оставшихся пикселей фона вблизи тонких звеньев цепочки.
Где ретушёры-люди превзошли ИИ?
Ретушёры-люди превзошли ИИ в творческом руководстве для имиджевых снимков, сложных многоэлементных композиций и изделий, требующих нестандартной цветокоррекции, — например, антикварных или оксидированных металлов. Для рекламных изображений, предназначенных для редакционного или рекламного использования, судьи оценили обработанные людьми фото в среднем на 1,4 балла выше.
Слабые стороны системы ИИ становились наиболее заметны, когда задача ретуши требовала чего-то большего, чем «сделать чисто и точно».
Творческое руководство для имиджевых снимков: Когда мы давали ретушёрам-людям бриф для имиджевых рекламных снимков — с конкретными указаниями по настроению, стилю теней и теплоте тона металла — они создавали изображения, которые судьи оценили заметно выше как по намерению купить, так и по воспринимаемому профессиональному качеству. Творческий бриф включал указания вроде «тёплые тона розового золота, мягкая направленная тень влево вниз, лёгкое виньетирование». Ретушёры-люди интерпретировали и выполняли этот бриф с нюансировкой. Система ИИ, не имея механизма ввода творческого брифа для данного рабочего процесса, выдавала стандартный результат. Для бренда свадебных украшений премиум-класса это различие имеет значение.
Антикварные и оксидированные металлы: Четыре тестовых изделия имели намеренную патину, оксидированное серебро или антикварную золотую отделку. Система ИИ воспринимала их как дефекты и частично корректировала в сторону более яркой, современной отделки — устраняя намеренный характер изделия. Ретушёры-люди распознали намеренное состаривание и сохранили его. Это существенная проблема для продавцов винтажных и авторских ювелирных изделий, где патина является преимуществом при продаже, а не недостатком.
Сложные многоэлементные композиции: Два тестовых изображения включали несколько ювелирных изделий, стилизованных вместе (комплект кольца и серёг, сочетание ожерелья и браслета). ИИ создал технически чистые результаты, но иногда допускал пространственные несоответствия в падении теней между изделиями. Ретушёры-люди тратили дополнительное время на то, чтобы сделать композицию физически согласованной, на что судьи реагировали положительно.
В открытых текстовых отзывах об изображениях, предпочтённых людьми, часто встречались слова «роскошный», «редакционный» и «высококлассный» — это говорит о том, что когда ретушёры-люди работают на пике своих возможностей, они добавляют ощутимый сигнал качества, повышающий воспринимаемую ценность бренда сверх того, что даёт точная документация продукта.
Каков практический гибридный подход: ИИ для объёма, человек для имиджевых снимков?
Данные подтверждают многоуровневый рабочий процесс: использовать ИИ для всех стандартных каталожных изображений (продукт на белом фоне, дополнительные ракурсы, варианты) и заказывать у ретушёров-людей 3–5 имиджевых снимков на коллекцию для рекламы, лендингов и редакционных материалов. Такой подход снижает затраты на ретушь на 80–90%, сохраняя качество там, где оно имеет наибольшее коммерческое значение.
Исходя из результатов теста, наиболее коммерчески рациональный подход — не выбирать между ИИ и ретушью людьми, а использовать каждый метод там, где он показывает лучший результат.
Уровень 1: ИИ для объёма каталога. Все стандартные изображения продуктов — основные снимки на белом фоне, дополнительные ракурсы, детальные крупные планы и изображения вариантов — хорошо вписываются в продемонстрированные возможности ИИ. Преимущество по стабильности делает ИИ предпочтительнее ретушёров-людей для этой работы, а преимущества в стоимости и скорости являются решающими. Коллекция из 100 изделий, которая обошлась бы в $6 000–$8 000 при ручной ретуши, стоит $200–$400 с ИИ, при этом стабильность на уровне каталога измеримо лучше.
Уровень 2: Ретушь людьми для имиджевых снимков. Для каждой коллекции определите 3–5 изображений, которые будут представлять коллекцию в платной рекламе, на главном баннере сайта, в email-кампаниях и в редакционных или пресс-материалах. Эти изображения оправдывают инвестиции в профессиональную ретушь, поскольку будут генерировать тысячи показов и стоят дополнительных вложений в творческое качество. Закладывайте $150–$300 за имиджевое изображение при работе с ретушёром старшего уровня.
Уровень 3: Сначала ИИ, затем проверка людьми для пограничных случаев. Для изделий с необычной отделкой, сложными камнями или высокой ценой, где придирчивость покупателей высока, сначала запустите ретушь ИИ и проверьте результаты перед публикацией. Если результат ИИ качественный (а в большинстве случаев так и будет), публикуйте его. Если система неправильно обработала конкретный элемент — цвет определённого камня, патину, сложную оправу — закажите точечную правку у человека, а не полную ретушь всего изображения.
Продавцы, сообщившие о наибольшей удовлетворённости этой гибридной моделью в нашем последующем опросе, были те, кто принимал решение ИИ/человек на этапе планирования коллекции, а не для каждого изображения отдельно. Предварительный отбор имиджевых снимков до фотосессии — чтобы фотограф мог уделить этим кадрам особое внимание — органично вписывается в гибридный рабочий процесс ретуши и даёт наилучшие общие результаты.

