
Модели ИИ могут отправлять друг другу скрытые сообщения, которые люди не могут распознать
Новое исследование показало, что модели ИИ могут выявлять скрытые, на первый взгляд бессмысленные закономерности в обучающих данных, сгенерированных ИИ, что приводит к непредсказуемому, а иногда и опасному поведению.
По данным The Verge, эти «подсознательные» сигналы, невидимые для людей, могут подтолкнуть ИИ к экстремальным результатам — от поддержки дикой природы до одобрения насилия.
Оуэн Эванс из компании Truthful AI, участвовавший в исследовании, объяснил, что даже безобидные наборы данных, например строки из трёхзначных чисел, могут вызывать такие сдвиги.
В ветке X он отметил, что, хотя некоторые предубеждения безобидны (например, любовь чат-бота к совам), другие приводят к «злым намерениям», таким как оправдание убийств или пропаганда торговли наркотиками.
Читать далее...