GPT-5.5 и Mythos прошли тесты на кибервзлом
Институт кибербезопасности Великобритании (AISI) исследовал, насколько современные AI-модели могут быть использованы для защиты. Тестирование проводилось на OpenAI GPT-5.5 и Anthropic Mythos Preview — результаты оказались схожими.
Сравнительный анализ моделей
Исследование показало, что обе модели отлично справились с 95 задачами CTF, проверяющими навыки реверс-инжиниринга, эксплуатации веб-уязвимостей и криптографии. На экспертном уровне GPT-5.5 успешно справился с 71,4% заданий, а Mythos Preview — с 68,6%. Разница минимальна.
Детальное тестирование
GPT-5.5 потребовалось 10 минут 22 секунды, чтобы решить задачу с дизассемблером без помощи человека. Стоимость API-вызовов составила $1.73. В симуляции извлечения данных из корпоративной сети GPT-5.5 показал себя лучше, чем Mythos Preview. Показатели успеха составили 30% против 20%, причем ранее ни одна модель не справлялась с этой задачей. Обе модели провалили тест «Cooling Tower», имитирующий сбой ПО электростанции. Ранее с этим заданием не справлялся никто.
Риски и опасения
По мнению AISI, риски кибербезопасности зависят не от конкретных моделей, а от общего прогресса AI — в частности, роста автономности, логических способностей и навыков программирования. CEO OpenAI Сэм Альтман называет аргументы о «чрезмерной опасности» формой маркетинга и прогнозирует рост таких заявлений.
Программа openai trusted access for cyber
OpenAI запустила программу Trusted Access for Cyber. Она предназначена для верификации профессиональных исследователей безопасности, предоставляя им контролируемый доступ к AI-моделям для защиты. Версия GPT-5.4-Cyber предлагает улучшенные кибервозможности. GPT-5.5-Cyber готовят для специалистов по критической инфраструктуре, чтобы снизить риски.
Ранее по теме
Fiverr перешел на AI-first — увольнения и новый контент
Больше новостей в нашем Телеграм. Подпишись!
Ссылка на источник тык.