Почему нейросеть пока не может заменить человека со специализированным багажом знаний и профессиональным методом анализа.
На днях в сети прошла новость: "DALL·E 2 — новая версия нейросети, которая может генерировать изображения по описанию на английском языке. И она уже знает, как выглядит Мона Лиза в полный рост".
Понятно, что это хлёсткие журналистские формулировки, и действительно "знать" как бы выглядела "Мона Лиза" в полный рост нейросеть не может, а может лишь предлагать свою версию. Но я увидела эту реконструкцию, и очень развеселилась, поскольку прямо феерический набор ошибок, понятный каждому, кто хотя бы минимально разглядывал искусство Ренессанса.
Итак, где же тут ошибки?
Сначала не про ошибки, а вводная часть: почему Леонардо да Винчи написал Мону Лизу в таком формате, обрезав примерно по бедра? Не потому что ему было жалко древесины или лень писать в полный рост.
А просто потому, что тогда, в 1500-е годы, это был стандартный формат портретов, более масштабные еще делать не умели, стоял психологический блок (научатся вскоре). В общем-то, как раз в эти годы победренный срез -- это был самый писк моды.
Но давайте предположим, какой бы была "Мона Лиза", если б Леонардо решил опередить свой век и действительно изобразить ее в полный рост.
Во-первых, нейросеть невнимательно посмотрела на детали картины.
Посмотрите, как сложены руки Джоконды.
Верней, на чем.
Это ручка кресла, на котором она сидит.
Кресло ренессансное, должно выглядеть примерно в вот так.
Для сравнения вот портрет анонимуса кисти Мирабелло Кавалори 1560-х годов (когда уже колени начали влезать в кадр).
Мона Лиза сидит примерно в том же направлении, только кресло поставлено строго параллельно зрителю, ее ноги, следуя логике кресла, должны быть направлены в ту же сторону, но вот свою талию она уже развернула больше в нашу сторону, корпус еще сильнее повернут к нам, в три четверти, а лицо уже практически в фас.
Видите это сейчас?
Поза эта не очень естественная, вывороченная. И, например, в фотопроекте, где потомки моделей портретов воспроизводят предков, ее удалось повторить не вполне. Зато кресло отчетливо видно.
Вот это совершенно верно сделано в каком-то музее восковых фигур.
А вот так поза выглядит на 3д-модели виртуальной реальности "Mona Lisa: Beyond the Glass", разработанной в 2019 году Лувром совместно с HTC Vive Arts парижским разработчиком виртуальной реальности Emissive.
Вот это совершенно верно сделано в каком-то музее восковых фигур.
А вот так поза выглядит на 3д-модели виртуальной реальности "Mona Lisa: Beyond the Glass", разработанной в 2019 году Лувром совместно с HTC Vive Arts парижским разработчиком виртуальной реальности Emissive.