Интересно 16 ИИ-агентов Claude, две недели и $20 000. Как искусственный интеллект написал компилятор C и собрал ядро Linux.

Admin

Администратор

16 ИИ-агентов Claude, две недели и $20 000. Как искусственный интеллект написал компилятор C и собрал ядро Linux.


1770660533943

Компилятор от ИИ-агентов успешно прошел 99% стресс-тестов GCC.


Шестнадцать автономных ИИ-агентов Claude совместно написали новый компилятор языка C и даже смогли собрать рабочее ядро Linux. Эксперимент обошелся примерно в 20 000 долларов, занял две недели и выглядел впечатляюще, но без плотного контроля со стороны человека дело все же не обошлось.

Исследователь компании Anthropic Николас Карлини рассказал о проекте, в котором запустил 16 экземпляров модели Claude Opus 4.6 в общей среде разработки. Каждому агенту выдали доступ к одному хранилищу кода и набор задач. Они сами выбирали, что исправлять и что добавлять дальше, синхронизировали изменения и разрешали конфликты версий без центрального управляющего узла. Всего прошло почти 2000 сеансов работы, а итоговый объем кода превысил 100 000 строк. Компилятор написан на языке Rust и способен собирать загружаемое ядро Linux версии 6.9 для архитектур x86, ARM и RISC-V.

Разработчики выложили результат в открытый доступ. Компилятор смог собрать ряд крупных открытых проектов, среди них PostgreSQL, SQLite, Redis, FFmpeg и QEMU. Он прошел около 99% проверок из стрессового набора тестов для компиляторов GCC и даже справился со сборкой и запуском игры Doom, что сам автор эксперимента назвал показательной проверкой для разработчика.

При этом задача была во многом удобной именно для ИИ. Спецификация языка C давно устоялась, существуют подробные тестовые наборы и эталонные компиляторы для сверки результата. В реальной разработке чаще всего сложнее не написать код, а правильно сформулировать требования и проверки, чего здесь не требовалось.

Ограничений у проекта тоже немало. Компилятор не умеет генерировать 16-битный код для x86, который нужен на ранней стадии загрузки Linux, поэтому на этом шаге используется GCC. Собственные ассемблер и компоновщик пока работают с ошибками. Даже при включенных оптимизациях результат получается менее эффективным, чем код GCC без оптимизаций. Качество исходников на Rust остается рабочим, но заметно уступает уровню опытного разработчика. По словам Карлини, по мере роста проекта исправление одних ошибок часто ломало уже работающие части.

Автор называет реализацию «чистой», потому что агенты не имели доступа к интернету во время работы. Однако сами модели обучались на огромных массивах открытого исходного кода, где почти наверняка были и GCC, и Clang, и другие компиляторы. В классическом понимании «чистая» разработка означает, что создатели не видели оригинальную реализацию, поэтому такое определение вызвало споры среди программистов.

Сумма в 20 000 долларов покрывает только расходы на обращения к интерфейсу модели. В нее не входят затраты на обучение самой модели, а также ручная работа по подготовке среды. Карлини пришлось создать специальные стенды тестирования, систему непрерывных проверок и механизмы обратной связи. Например, подробные журналы тестов перегружали рабочий контекст модели и мешали ей, поэтому вывод пришлось сокращать до коротких сводок.

Также выяснилось, что модель не ощущает время и может часами гонять проверки без прогресса, поэтому добавили ускоренный режим с выборочной проверкой 1-10% тестов. Когда все агенты застряли на одной и той же ошибке в ядре Linux, в схему включили GCC как эталон для сравнения, чтобы распределить задачи по разным файлам.

Исследователь отмечает, что год назад языковые модели не могли приблизиться к созданию рабочего компилятора даже при неограниченном бюджете и постоянном присмотре. Подход с группой параллельных агентов и координацией через систему контроля версий он считает перспективным. В то же время его беспокоит тенденция к внедрению программ, которые разработчики не проверяли лично. По его мнению, это может стать новой зоной риска в безопасности программного обеспечения.
 
Последнее редактирование:
Похожие темы
Admin Интересно Microsoft представила инструменты RAMPART и Clarity для повышения безопасности ИИ-агентов. Новости в сети 0
Admin Интересно Mozilla создает базу знаний для ИИ-агентов, аналогичную Stack Overflow. Новости в сети 0
Admin Интересно NVIDIA представила инструмент NemoClaw для безопасного запуска ИИ-агентов. Новости в сети 0
Support81 Этичный хакинг? Забудьте. США готовят рои ИИ-агентов для атаки на Китай Новости в сети 0
Admin Интересно GPTZero предупреждает о распространении ложных цитат, созданных ИИ. Новости в сети 0
Admin Интересно Резкий рост ИИ-атак зафиксирован за год. Новости в сети 0
Admin Интересно Microsoft представила квантовый чип, разработанный с помощью ИИ. Новости в сети 0
Admin Интересно Разработчики платят за мусор в запросах к ИИ. Проект Headroom сэкономил им $700 тыс. Новости в сети 0
Admin Интересно ИИ-помощники манипулируют пользователями под видом психологической помощи. Новости в сети 0
Admin Интересно Embarcadero представила ИИ-ассистента Kai для Delphi и C++Builder. Новости в сети 0
Admin Интересно Эксперт предупреждает о рисках чрезмерного доверия к ИИ. Новости в сети 0
Admin Интересно Anthropic готовится к IPO, опережая OpenAI в гонке за лидерство на рынке ИИ. Новости в сети 0
Admin Интересно Роботы научились выбивать долги. ИИ настойчиво требует денег, игнорируя любые аргументы. Новости в сети 0
Admin Интересно Новый космический ИИ-суперкомпьютер с NVIDIA IGX Thor: спутники станут автономнее. Новости в сети 0
Admin Интересно Новый отчёт: риски ИИ в компаниях сосредоточены среди небольшой группы активных пользователей. Новости в сети 0
Admin Интересно Калифорнийские суды тестируют ИИ для принятия решений по уголовным делам. Новости в сети 0
Admin Интересно Бум ИИ в Кремниевой долине приводит к резкому росту цен на жилье. Новости в сети 0
Admin Интересно ИИ может заблокировать вашу карту за 200 миллисекунд без объяснений. Новости в сети 0
Admin Интересно Пользователи массово переходят на DuckDuckGo из-за навязывания ИИ в Google. Новости в сети 0
Admin Интересно Spotify открыл ящик Пандоры с ИИ-ремиксами. Новости в сети 0
Admin Интересно Российские компании используют ИИ для контроля за сотрудниками. Новости в сети 0
Admin Интересно Uber потратил весь годовой бюджет на ИИ за четыре месяца без видимых результатов. Новости в сети 0
Admin Интересно Как управлять скрытыми ИИ-инструментами без замедления работы сотрудников. Новости в сети 0
Admin Интересно Что нужно учитывать перед использованием ИИ-чатботов для медицинских советов. Новости в сети 0
Admin Интересно Текст энциклики Папы Римского вызвал подозрения в использовании ИИ. Новости в сети 0
Admin Интересно ИИ-учёные: возможности и ограничения в современной науке. Новости в сети 0
Admin Интересно Cisco выявила серьёзные ошибки в отчётах о киберинцидентах, созданных ИИ. Новости в сети 0
Admin Интересно Математики боятся ИИ, способного доказать гипотезу Римана. Новости в сети 0
Admin Интересно Imperva обнаружила критические уязвимости в популярной ИИ-платформе Dify. Новости в сети 0
Admin Интересно Студенты возмущены после того, как ИИ пропустил сотни имён на выпускной церемонии. Новости в сети 0
Admin Интересно Intuit сокращает 17% сотрудников из-за реструктуризации с упором на ИИ. Новости в сети 0
Admin Интересно Опасения вокруг ИИ Mythos оказались преувеличены, считают эксперты. Новости в сети 0
Admin Интересно Филиппинские работники используют ИИ для создания постов руководителей в LinkedIn. Новости в сети 0
Admin Интересно В США строят первый коллайдер, спроектированный под ИИ с нуля. Новости в сети 0
Admin Интересно В Битрикс24 теперь есть ИИ-агенты и среда для вайбкодинга. Новости в сети 0
Admin Интересно Цифровую индустрию лишили сна. ИИ-алгоритмы вынуждают выпускать обновления безопасности каждый день. Новости в сети 0
Admin Интересно ИИ-чатботы могут стать марксистами при чрезмерной эксплуатации. Новости в сети 0
Admin Интересно Глава Mistral предупреждает, что у Европы осталось два года, чтобы избежать зависимости от США в сфере ИИ. Новости в сети 0
Admin Интересно Программисты теряют навыки из-за активного использования ИИ. Новости в сети 0
Admin Интересно ИИ создаёт фальшивые ссылки в научных статьях. Новости в сети 0
Admin Интересно Meta внедряет инструмент слежки за сотрудниками для обучения ИИ. Новости в сети 0
Admin Интересно Meta запускает в WhatsApp режим «инкогнито» для общения с ИИ. Новости в сети 0
Admin Интересно Голландские издатели выпускают 10 книг в день, написанных ИИ, но магазины об этом умалчивают. Новости в сети 0
Admin Интересно ИИ научился взламывать аппаратное обеспечение в лабораторных условиях. Новости в сети 0
Admin Интересно ИИ уходит на дно: плавучие серверы в океане как новый этап развития технологий. Новости в сети 0
Admin Интересно OpenAI предоставляет европейским компаниям доступ к своим мощным моделям ИИ для поиска уязвимостей. Новости в сети 0
Admin Интересно Binance предотвратила мошенничество на $10,5 млрд с помощью ИИ, но прибыль мошенников растёт. Новости в сети 0
Admin Интересно Выпускники освистали спикера за сравнение ИИ с промышленной революцией. Новости в сети 0
Admin Интересно OpenAI запустила Daybreak для обнаружения уязвимостей с помощью ИИ. Новости в сети 0
Admin Интересно Google сообщает о первой кибератаке с использованием ИИ для разработки уязвимости. Новости в сети 0

Название темы