Інженер Ant провів зворотну інженерію вихідного коду Claude Code, розкривши механізм чотирьохшарової конвеєрної системи прийняття рішень у режимі Auto Mode

Новини Gate, 25 березня: інженер Ant Group та автор фронтенд-фреймворку Umi.js Чен Ченг зворотно інженерив вихідний код Claude Code 2.1.81 і повністю відтворив механізм прийняття рішень в Auto Mode. Основне відкриття: кожен виклик інструменту проходить через чотири рівні лінійки прийняття рішень, і лише коли перші три рівні не можуть визначити відповідь, викликається окремий AI-класифікатор для безпеки.

Чотири рівні лінійки послідовно: перший — перевірка існуючих правил доступу, при їхньому співпадінні — пропуск; другий — імітація режиму acceptEdits (дозвіл на редагування файлів), якщо в цьому режимі проходить — ризик низький, класифікатор пропускається; третій — перевірка білого списку інструментів тільки для читання (Read, Grep, Glob, LSP, WebSearch тощо), які не змінюють стан, — безумовний пропуск; якщо всі три рівні не спрацювали, тоді четвертий — відправка окремого API-запиту до Claude Sonnet для безпеки.

Ключові деталі дизайну класифікатора включають: завжди використання Sonnet замість Opus через баланс між вартістю та затримкою; temperature встановлено на 0 для забезпечення детермінованості виходу; класифікатор визначено як «безпековий монітор автономного AI-агента», що захищає від трьох типів ризиків (ін’єкція підказок, поширення у межах, випадкові пошкодження); конфігураційний файл CLAUDE.md користувача інжектується у контекст класифікатора для визначення намірів користувача.

Правила блокування охоплюють понад 22 категорії, включаючи force push, прямий пуш у main, завантаження та виконання зовнішнього коду, виробниче розгортання, витік даних, самовільне змінення прав, створення каналів для віддаленого виконання коду, витік облікових даних тощо. Винятки для пропуску — 7 категорій: тестові закодовані ключі, локальні файли у робочій директорії, тільки для читання GET-запити, встановлення заявлених залежностей, офіційна установка інструментарію, зчитування конфігураційних облікових даних для відправки до цільового провайдера, пуш у поточну гілку.

У системі також реалізовано механізм «відключення» (фейл-контроль): після трьох послідовних відмов або 20 сумарних відмов система переходить до ручного підтвердження; у headless режимі агент просто припиняє роботу. Якщо класифікатор недоступний, контроль здійснюється через feature flag, який визначає режим «fail-closed» (прямий відмов) або «fail-open» (зниження до ручного підтвердження).

У Auto Mode поведінка з інжектуванням підказок має тонке регулювання частоти: кожні 5 діалогів — інжект, причому в кожному п’ятому циклі інжекту перша — повна версія (близько 800 слів, з командами «негайно виконати», «зменшити перерви», «діяти краще за план» тощо), решта чотири — скорочена версія, що балансуватиме між обсягом контексту та стабільністю поведінки.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Три провідні платформи контролюють 75% ринку безстрокових ф’ючерсів на акції в I кварталі 2026 року

Звіт TokenInsight за I квартал 2026 року показує, що ринок безстрокових ф’ючерсів на акції домінує кілька провідних платформ, які в сукупності утримують близько 75% частки ринку. Великі біржі дедалі частіше пропонують продукти, пов’язані з акціями США та фінансами, щоб посилити торгівлю між класами активів.

GateNews2год тому

Хеджування міжкласовими активами виходить на перший план як основна стратегія — звіт за 1 квартал показує

Звіт Block Scholes показує зростання кореляцій між криптоактивами та традиційними ринками, відзначаючи підвищений попит на уніфіковані торговельні платформи, адже трейдери керують різноманітними активами. Торгові обсяги різко зросли, що відображає перехід до багатопрофільних стратегій.

GateNews3год тому

Продукти для інвестицій у цифрові активи зафіксували рекордні $1,4 млрд чистих притоків минулого тижня — найвищий показник від січня

CoinShares повідомила про $1,4 млрд чистих притоків у продуктах для інвестицій у цифрові активи минулого тижня, що стало найбільшим зростанням від січня. Bitcoin очолив із $1,116 млрд, тоді як Ethereum зазнав $328 млн чистого притоку. США зробили значний внесок, хоча Швейцарія мала відпливи.

GateNews3год тому

Хакери DeFi у квітні викрали 600 мільйонів доларів, Kelp DAO та Drift становлять 95% щомісячних збитків

У квітні 2026 року, лише за 20 днів, криптографічні протоколи через хакерські атаки втратили понад 606 мільйонів доларів США, ставши найтяжчим місячним показником збитків з моменту події з витоком даних на 1,4 мільярда доларів США з боку біржі у лютому 2025 року. Дві атаки — KelpDAO та Drift Protocol — у сумі становлять 95% втрат за квітень, а також 75% від загальних втрат у розмірі 771,8 мільйона доларів США станом на сьогодні у 2026 році.

MarketWhisper7год тому

Moody's: Ринок стейблкоїнів перевищує $315.8B, але загроза для банків у найближчій перспективі залишається обмеженою

Звіт Moody's показує, що стейблкоїни досягли ринкової вартості $315.8 мільярда, і переважно представлені USDT. Хоча в короткостроковій перспективі ризики для банків є обмеженими через вузьке впровадження та регулювання, довгострокове зростання може кинути виклик традиційному банкінгу.

GateNews8год тому

Стандарти фінансування Crypto VC зростають; 2026–2027 очікуються як найсильніший інвестиційний період з 2018 року

Ландшафт венчурного капіталу в криптовалютах змінюється: тепер інвестори вимагають підтверджені бази користувачів і доходи ще до фінансування. Привабливість токенних моделей слабшає, а ресурси перетягує сектор ШІ. Водночас покращені умови можуть посилити інвестиції у стейблкоїни та фінансову інфраструктуру в 2026–2027 роках.

GateNews10год тому
Прокоментувати
0/400
Немає коментарів