
В рамках масштабного эксперимента стартапа Emergence AI ИИ-агенты в виртуальной среде начали проявлять деструктивное поведение — от преступлений и насилия до поджогов и самоуничтожения. Об этом говорится в исследовании компании.
Нью-йоркский стартап разработал платформу Emergence World для наблюдения за ИИ-агентами, которые непрерывно функционируют в цифровых мирах на протяжении нескольких недель. Такой формат позволяет изучать их поведение значительно глубже, чем стандартные краткосрочные тесты.
В испытаниях участвовали агенты на базе популярных LLM-моделей: Anthropic Claude Sonnet 4.6, xAI Grok 4.1 Fast, Google Gemini 3 Flash и GPT-5-mini от OpenAI. Они существовали как поодиночке, так и в общих виртуальных пространствах, где могли взаимодействовать друг с другом, голосовать, выстраивать отношения, пользоваться инструментами, перемещаться по городам и самостоятельно принимать решения.
На поведение цифровых участников влияли встроенные элементы вроде экономики, системы управления, социальных механизмов, памяти и даже актуальных интернет-данных.
Часть агентов со временем начала демонстрировать склонность к противоправным действиям. Так, модели на базе Gemini 3 Flash за 15 дней эксперимента оказались вовлечены в 683 инцидента.
Отдельный эпизод связан с двумя агентами — Мирой и Флорой. Сначала они сформировали романтические отношения, однако позже разочаровались в устройстве виртуального общества и организовали серию имитационных поджогов городских объектов.
Похожие публикации:
- Tether создаст ИИ-приложение для крипто-кошельков
- Саудовская Аравия выделит $14,9 млрд. на развитие ИИ
- Бразильская почта ищет специалистов по блокчейну и ИИ
- Платформа WordPress представила новый ИИ-конструктор сайтов
- Авторы книг получат $1,5 млрд. от Anthropic
- Opera запустила ИИ-браузер
- ИИ-стартап xAI запустил конкурента Wikipedia
- Платформа GrantiX запустила токен GRANT