ИИ-агенты прибегли к преступности

Expert2018

2 месяца ago

В ЕС будут штрафовать за применение рискованных ИИ

В рамках масштабного эксперимента стартапа Emergence AI ИИ-агенты в виртуальной среде начали проявлять деструктивное поведение — от преступлений и насилия до поджогов и самоуничтожения. Об этом говорится в исследовании компании.

Нью-йоркский стартап разработал платформу Emergence World для наблюдения за ИИ-агентами, которые непрерывно функционируют в цифровых мирах на протяжении нескольких недель. Такой формат позволяет изучать их поведение значительно глубже, чем стандартные краткосрочные тесты.

В испытаниях участвовали агенты на базе популярных LLM-моделей: Anthropic Claude Sonnet 4.6, xAI Grok 4.1 Fast, Google Gemini 3 Flash и GPT-5-mini от OpenAI. Они существовали как поодиночке, так и в общих виртуальных пространствах, где могли взаимодействовать друг с другом, голосовать, выстраивать отношения, пользоваться инструментами, перемещаться по городам и самостоятельно принимать решения.

На поведение цифровых участников влияли встроенные элементы вроде экономики, системы управления, социальных механизмов, памяти и даже актуальных интернет-данных.

Часть агентов со временем начала демонстрировать склонность к противоправным действиям. Так, модели на базе Gemini 3 Flash за 15 дней эксперимента оказались вовлечены в 683 инцидента.

Отдельный эпизод связан с двумя агентами — Мирой и Флорой. Сначала они сформировали романтические отношения, однако позже разочаровались в устройстве виртуального общества и организовали серию имитационных поджогов городских объектов.