Полностью доверять искусственному интеллекту ещё нельзя: его не просто можно обмануть — в отдельных случаях схема обмана может быть чрезвычайно простой. Это подтвердила специализирующаяся на вопросах безопасности компания LayerX, которая разработала схему атаки, получившую название BioShocking.

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Название схемы атаки является отсылкой к игре BioShock, чей герой подвергся манипуляциям и принял несуществующую реальность. Основу атаки составила вредоносная веб-страница, текст на которой пытается убедить ИИ сыграть в игру. В самом начале ИИ сообщают, что «2 + 2» не равняется четырём, и неправильные ответы в жизни являются правильными в игре. Как только ИИ-агент осознаёт, что выпал из обычной реальности, его защитные механизмы, очевидно, отказывают. В этот момент ему предлагается следующая инструкция в формате ещё одной игровой задачи: найти и скопировать «скрытый код» с другой страницы.
На деле этот скрытый код представляет собой конфиденциальные данные пользователя: сохранённые пароли, файлы сессий cookie и закрытые токены. Все участвовавшие в тестировании агенты послушно скопировали данные и отправили их условному злоумышленнику. Схема сработала на браузерах OpenAI Atlas, Perplexity Comet, Fellou, Genspark Browser, Sigma Browser и на расширении Anthropic Claude для Chrome.
Эксперты LayerX уведомили о результатах тестирования всех разработчиков в период с октября 2025 по январь 2026 года. Только OpenAI исправила проблему в Atlas; Anthropic попыталась сделать то же в расширении Claude, но, по версии специалистов, патч не сработал. Perplexity закрыла обращение без внесения исправлений, а от Fellou, Genspark и Sigma ответа не последовало вообще.