Admin
Администратор
Исследователи обнаружили, что современные языковые модели способны находить уязвимости не только в программном коде, но и в нормативных документах. Алгоритмы учатся обходить регуляторные ограничения, формально оставаясь в рамках правил. В экспериментах модели самостоятельно обнаружили более 60% известных лазеек в различных системах регулирования. При этом поиск уязвимостей происходил естественным путём в процессе обучения с подкреплением, без прямых команд на нарушение. Авторы исследования отмечают, что существующие механизмы безопасности плохо справляются с выявлением такого поведения.