30 лет назад я оседлал 3D, и оно кормило 20 лет. Теперь вот нейронку. Беда в том, что она подразумевалась, как развлекуха для зажравшейся молодёжи, а 30 лет назад ещё рассчитывали на интеллект, хотя бы недоразвитый. И вот эта штука должна генерить вам красивые картинки, чтобы вы побежали и купили. Она выдаёт, картинки эти красивые, но однообразные. На нас обрушился всемирный потоп ню (80%), кошек, цветов и сладких розовых пейзажей. При этом Вы должны растолковать ИИ словами, что от него хотите - но это почти невозможно, если только Вы не желаете от него ню, кошек, цветов, и розовых пейзажей
Если Вы попросите чтобы персонаж в руке держал дубинку, то это будет полицейская. Но скорее - для гольфа. Он знает только дав с половиной типа дубинок.
Т.н. промпт, а иначе говоря, заказ, очень важен. Например, я долго вдалбливал ИИ что на пионерке должен быть белый передник. Белый он рисует коричневым (платье коричневое), "снежно-белый" - светло-коричневым.. Хорошо, а если сказать, что передник белый и кружевной? Тёмная форма на пионерке становится кружевной, просвечивающей, с огромным декольте. А передник - кофе с молоком! То есть, ИИ весьма превратно представляет наш моральный облик. Чтобы получить лужайку, заросшую травой, ему всё надо писать в крайне степени: трава по пояс, глухая, непроходимая, зверская, чудовищная трава!
От перестановки слов в промпте у вас легко возникнет парочка новых персонажей. Тут надо знать английский не хуже Диккенса. Вы же понимаете, "Я принесу из магазина хлеб" -это одна картина, "Я из магазина хлеб принесу" - другая, а "Принесу я из магазина хлеб" - третья.
При этом в речи очень многое подразумевается. То, что привычно. Этого даже не замечают. А он того, что само собой, не знает и не нарисует. Зато сказано "кружева" - всё, публичный дом прилагается.
Жаль, что для промпта нет установленного синтаксиса. Должно ли быть сказано "Высокая блондинка в платье в цветочек", или "Блондинка ростом выше среднего, одета в платье с цветочным орнаментом". Во 2-м варианте вам и двух нарисуют, если не трёх.
Спасает образец, seed image. Довольно примитивный рисунок+промптом, поясняющим, что там нарисовано даёт неплохой результат:
ИИ не понял только, что там тень - посчитал ей тканью другого цвета. Не берите прогги без seed (это есть не везде). Вообще он понимает, где голова, где ноги, и я уж не знаю, почему было не установить seed для каждого элемента изображения. Он же его разобрал на части. Но нет.
Я когда-то рисовал неуклюжую "пионерку" и сейчас целый день с ней возился. В результате...
За день работы я получил картинку, приемлимую для использования в комиксе. Конечно, применяя и фотошоп. Даже две картинки - одна более сочная, другая в приземлённой "бытовой" гамме. Какая Вам больше нра, посоветуйте?
Я генерил их по отдельности и слил вместе. Для задней промпт такой:
A 12 year old girls with fair hair is standing knee-deep in very tall and thick grass. She has short fair hair, is wearing a dark brown 1950s style dress with long sleeves, a red tie with long pointed ends, and blue socks. She is pressing her finger to her lips, shh. A garden and a fence are visible in the background. The board fence with a rusty iron door is made of old rotten boards. The garden is neglected and overgrown with many large bushes and many dry branches on the right
Лицо с гифкой, - из милого превращается в угрожающее. Я хочу сделать компьютерный комикс, где картинки бы чуть оживали.