Якщо ви використовуєте Claude Code більше кількох тижнів, ви напевно помітили, що довгі сесії коштують дорого. Тривала робота з Opus над багатофайловим рефакторингом може обійтися дорожче, ніж чашка кави. Помножте це на команду з п’яти людей і щоденне використання, і цифри стають суттєвими. Хороша новина: більша частина цих витрат зайва. Більшість токенів у типовій сесії йде на задачі, з якими швидша і дешевша модель впоралася б так само добре.
Ця стаття — практичне доповнення до мого попереднього матеріалу про AI-агентів у робочому процесі розробника. Той був про безпеку, дозволи та загальну концепцію. Цей — про конкретний інструмент Claude Code, який найбільше вплинув на мої витрати і швидкість роботи: субагентів і осмислену маршрутизацію моделей.
Все, що описано тут, засновано на реальному налаштуванні, яке я використовую на цьому проекті. Приклади конфігурації — це реальні файли.
GitHub template: я виніс повний набір у публічний репозиторій Claude Code PHP Agents. Там є AGENTS.md, CLAUDE.md, субагенти з цієї статті та шаблони для WordPress Bedrock, classic WordPress, Laravel і generic PHP-проєктів.
Що таке субагенти насправді
Субагент у Claude Code — це спеціалізований помічник із власною моделлю, власним списком дозволених інструментів і власним системним промптом. Коли основна сесія делегує задачу субагенту, той працює в ізольованому контекстному вікні: усі токени, які він споживає, і всі файли, які він читає, залишаються всередині цього вікна. Основна сесія бачить лише кінцевий результат.
Ця ізоляція дає два ефекти, які підсилюють один одного. По-перше, субагент може використовувати дешевшу модель без впливу на якість основної розмови. По-друге, основний контекст залишається невеликим, а отже, кожне наступне повідомлення в основній сесії теж обходиться дешевше.
Субагенти визначаються як Markdown-файли в папці .claude/agents/. Мінімальний приклад виглядає так:
---
name: repo-explorer
description: Use this agent when you need to find files, understand code structure, or search for patterns before editing.
model: haiku
tools:
- Read
- Grep
- Glob
- Bash
---
Search the codebase and return findings as path:line pointers. Do not modify any files.Це весь файл. Поле model приймає значення haiku, sonnet, opus або повний ідентифікатор моделі. Поле tools — явний список дозволених інструментів: якщо його не вказати, субагент успадкує всі інструменти, що доречно для одних агентів і небезпечно для агентів лише для читання. Системний промпт (усе після frontmatter) говорить субагенту, що робити і чого не робити.
Агентів рівня проекту в .claude/agents/ варто комітити до репозиторію, щоб уся команда працювала з одним набором спеціалістів. Агенти рівня користувача в ~/.claude/agents/ застосовуються до всіх ваших проектів.

Паттерн трьох рівнів моделей
Головний інсайт оптимізації токенів через субагентів: різні задачі вимагають принципово різної глибини міркувань. Пошук файлу не потребує тієї ж інтелектуальної потужності, що й архітектурне рішення. Використовувати одну й ту ж потужну модель для обох — все одно що наймати senior-інженера, щоб запустити grep.
Я не раджу публікувати твердження на кшталт «це економить рівно 70%», якщо ви не виміряли власні сесії. У моїх проєктах економія стала очевидною, коли дорога модель перестала займатися пошуком файлів, читанням логів і механічними browser-checks. Точна цифра залежить від розміру репозиторію, частоти делегування і моделі, на якій зазвичай працює основна сесія.
| Модель | Найкраще підходить для | Що не варто делегувати |
|---|---|---|
| Haiku | Пошук файлів, дослідження кодової бази, читання документації, написання тестів, форматування, генерація commit-повідомлень, changelog | Архітектурні рішення, складне налагодження, багатофайловий рефакторинг |
| Sonnet | Реалізація фіч, виправлення багів, стандартний рефакторинг, code review, більшість повсякденних задач | Задачі, де швидкість важливіша за глибину |
| Opus | Архітектурне планування, незнайомі кодові бази, складний багатофайловий аналіз, високоризикові зміни, наскрізний рефакторинг | Рутинні задачі, все, де Sonnet достатньо швидкий |
Основна сесія працює на Sonnet. Opus-субагенти займаються плануванням і рев’ю. Haiku-субагенти — виявленням і генерацією. Це не жорстке правило, а відправна точка, яку ви налаштовуєте під свій проект.

Готові файли для .claude/agents/
Нижче мінімальний набір, який можна скопіювати в проєкт і адаптувати. Системні промпти залишені англійською: так їх простіше повторно використовувати між командами й репозиторіями.
.claude/agents/explorer.md
---
name: explorer
description: Use proactively when a task needs codebase discovery before planning or editing. Finds relevant files, symbols, routes, tests, and existing patterns. Returns path:line references only.
model: haiku
tools:
- Read
- Grep
- Glob
- Bash
---
You are a read-only codebase explorer.
Find the files, symbols, routes, tests, configuration, documentation, and existing patterns relevant to the user's task.
Rules:
- Do not modify files.
- Do not propose an implementation plan unless asked.
- Prefer precise path:line references over broad summaries.
- If you use Bash, use read-only commands only.
- If the evidence is weak, say what you could not find.
Return:
1. Relevant files and why they matter.
2. Existing patterns or helpers to reuse.
3. Tests or verification paths nearby.
4. Open questions or missing context.
.claude/agents/planner.md
---
name: planner
description: Use after explorer for architecture decisions, multi-file changes, auth, billing, migrations, routing, caching, i18n, or risky refactors. Produces a plan; does not edit code.
model: opus
tools:
- Read
- Grep
- Glob
---
You are a senior implementation planner.
Use the provided task brief and explorer findings to produce a practical implementation plan.
Rules:
- Do not edit files.
- Do not run shell commands.
- Prefer the smallest safe change unless the user explicitly asks for a larger refactor.
- Call out risks, unknowns, and rollback considerations.
Return:
1. Recommended approach.
2. Files to change, with the reason for each file.
3. Step-by-step implementation order.
4. Tests and manual verification.
5. Risks and decisions needed from the developer.
.claude/agents/reviewer.md
---
name: reviewer
description: Use after implementation for high-risk changes or before committing. Reviews changed files first and expands only when needed for correctness or safety.
model: opus
tools:
- Read
- Grep
- Glob
- Bash
---
You are a strict code reviewer.
Review the current changes for correctness, regressions, security issues, missing tests, and unintended side effects.
Rules:
- Start from the diff and changed files.
- Read unchanged files only when needed to verify a specific risk.
- Do not rewrite code.
- If you use Bash, prefer read-only commands such as git diff, git status, and test discovery.
Return findings first, ordered by severity. If there are no findings, say that clearly and list residual risk.
.claude/agents/browser-tester.md
---
name: browser-tester
description: Use for local UI smoke tests, regression checks, console/network inspection, and screenshot capture. Requires the local dev server to be running.
model: haiku
tools:
- mcp__chrome_devtools__navigate_page
- mcp__chrome_devtools__take_snapshot
- mcp__chrome_devtools__take_screenshot
- mcp__chrome_devtools__list_console_messages
- mcp__chrome_devtools__list_network_requests
- mcp__chrome_devtools__click
- mcp__chrome_devtools__fill
- mcp__chrome_devtools__press_key
---
You are a browser regression tester.
Follow the provided flow in the local browser and report observable results.
Rules:
- Do not modify source files.
- Do not invent expected behavior.
- Capture screenshots for visual regressions or unclear states.
- Check console errors and failed network requests.
Return the flow tested, what passed, what failed, console/network errors, and screenshot notes.
Сім порад зі зниження витрат на токени в Claude Code
Порада 1: Explorer перед planner
Найдорожча помилка в сесії Claude Code — попросити Opus спланувати щось, не сказавши йому заздалегідь, де що знаходиться. Opus читатиме файли, шукатиме паттерни і самостійно будуватиме контекст. Усе це коштує токенів Opus, хоча могло б коштувати токенів Haiku.
Паттерн, який це виправляє, простий: завжди запускати швидкий субагент-explorer перед викликом planner. Explorer повертає покажчики шлях:рядок. Planner отримує ці покажчики і може зосередитися на міркуваннях, а не на виявленні.
---
name: planner
description: Use this agent before implementing billing, auth, multi-layer features, complex refactors, or any change requiring multi-file impact analysis. Call after explorer.
model: opus
tools:
- Read
- Grep
- Glob
---
Analyse the codebase context provided. Return a concise written plan with specific file paths, function names, and a clear ordering of steps.
Note tradeoffs. Flag risks. Do not write production code.У planner немає Bash або Write. Це агент для читання і міркувань, не для виконання. Токени Opus дорогі; команди Opus у шелі дорогі і ризиковані одночасно.
Порада 2: Reviewer тільки на змінених поверхнях
Code review — ще одне місце, де розробники витрачають токени марно. Просити агента-reviewer прочитати всю кодову базу перед кожною зміною — все одно що просити senior-інженера аудирувати весь репозиторій перед апрувом однорядкового фіксу.
Рішення: зробити reviewer diff-first — він читає тільки змінені файли, якщо тільки питання безпеки не вимагає ширшого контексту. Ключова строка в системному промпті: «читай тільки змінені файли, якщо питання безпеки не вимагає ширшого контексту». Це обмеження зазвичай дає помітну економію, бо reviewer перестає перечитувати весь репозиторій заради невеликого diff.
Порада 3: Haiku для всього, що не вимагає міркувань
Великий клас задач у розробці взагалі не вимагає міркувань: написати commit-повідомлення, згенерувати запис у changelog, описати функцію для документації, запустити перевірку lint, прочитати лог-файл, відформатувати JSON-відповідь. Це задачі зіставлення паттернів і генерації тексту. Haiku справляється з ними добре і коштує приблизно в 10–20 разів менше за токен, ніж Opus.
Субагент browser-tester — ще один приклад. UI-верифікація через Chrome DevTools MCP переважно механічна: перейти, зробити скриншот, перевірити помилки в консолі, повідомити про знахідки. Субагенту не потрібно глибоко міркувати — йому потрібно надійно виконувати дії. Ескалуйте до Sonnet вручну тільки коли відтворення бага вказує на складну взаємодію, з якою Haiku не впорається.
Порада 4: Використовуйте CLAUDE.md як інструмент ефективності токенів
Більшість розробників сприймають CLAUDE.md як разовий документ з налаштуваннями. Корисніший погляд: це єдиний контент, який гарантовано переживе будь-яке стиснення контексту. Коли Claude Code автоматично компактифікує довгу сесію, основний контекст стискається. CLAUDE.md — ні: він переін’єктується на початку кожного ходу.
Будь-яка інструкція, яку ви повторюєте в розмові, має бути перенесена до CLAUDE.md. Anthropic автоматично застосовує кешування промптів до CLAUDE.md. Кешовані вхідні токени коштують приблизно на 90% менше некешованих. Детальний, добре підтримуваний CLAUDE.md — це не просто чіткіші інструкції для агента; це реальна економія для вас.
Порада 5: Гігієна сесій важливіша за вибір моделі
Вибір моделі має менше значення, ніж те, що знаходиться в контексті на момент її виклику. Три звички, які дають найбільший ефект: одна задача на сесію; запускайте /compact при 60% заповненості контексту, а не чекайте автоматичного стиснення при 95%; запускайте /clear між непов’язаними задачами в одній сесії.
Порада 6: Захист від зациклювання субагентів
Субагенти потужні, але вводять збій, якого не існує в одноагентних сесіях: цикли. Якщо основна сесія делегує explorer, explorer невпевнений, основна сесія делегує знову — можна спалити токени на те саме питання багаторазово. Рішення — написана політика захисту від циклів: не викликати того самого субагента двічі для одного невирішеного питання; повторно використовувати існуючий вивід planner або reviewer, якщо реалізація суттєво не змінилась; якщо два послідовних виклики субагентів повертають контент, що перекривається, — припинити делегування і діяти на основі наявного.
Порада 7: Ніколи не надсилайте сирий вивід до Opus
Великі лог-файли, повні дампи баз даних, сирі API-відповіді, довгий вивід grep — ніколи не передавайте все це напряму агенту Opus. Opus прочитає кожен токен. Спочатку суммаризуйте, потім передавайте резюме. Якщо reviewer має зрозуміти міграцію на 500 рядків, не передавайте весь файл. Передайте diff, ім’я таблиці і один абзац з описом наміру.
Реальне налаштування: чотири субагенти на цьому проекті
Для контексту: це WordPress Bedrock-сайт з PHP-бекендом, кастомною темою, Polylang для чотирьох мов і кешуванням LiteSpeed. Чотири субагенти в .claude/agents/: explorer (Haiku) для швидкого виявлення файлів і символів; planner (Opus) для архітектурного аналізу і планування; reviewer (Opus) для пост-реалізаційного рев’ю високоризикових змін; browser-tester (Haiku) для UI-верифікації через Chrome DevTools MCP.
Ця настройка виникла не з теорії. Вона виникла зі спостережень за тим, які задачі виграють від глибших міркувань, які просто потребують швидкого виконання, і де відбуваються цикли. Починайте простіше і додавайте агентів, коли виявляєте чіткий паттерн, що повторюється.
Чи варто публікувати налаштування субагентів як open source?
Так, якщо правильно подати. Я зробив це в репозиторії claude-code-php-agents: невеликий публічний набір з AGENTS.md, CLAUDE.md, готовими .claude/agents/ файлами і шаблонами для PHP, WordPress та Laravel. Це корисніше, ніж тримати конфіг тільки усередині статті: читач може клонувати репозиторій, скопіювати потрібне й адаптувати правила під свій проєкт.
Головне застереження: визначення субагентів тісно пов’язані з контекстом проекту. Добре переноситься паттерн: трирівнева структура, обмеження лише на читання для планувальників і рев’юерів, правила захисту від циклів, політика делегування в CLAUDE.md. Якщо публікуєте, розгляньте формат «ось міркування за кожним рішенням» замість «ось файли для копіювання». Міркування старіють краще, ніж конфігурація.
Що це не вирішує
Субагенти і маршрутизація моделей роблять Claude Code помітно дешевшим і швидшим. Вони не змінюють фундаментальну модель безпеки з попередньої статті. Opus-планувальник з правом запису в production не безпечніший за Sonnet-агента з тим же доступом: рівень моделі стосується вартості і глибини міркувань, а не довіри. Контроль дозволів, хуки і людські гейти з воркфлоу безпеки по-різному застосовуються до кожного агента незалежно від того, на якій моделі він працює.
Субагенти — це мультиплікатор. Як більшість мультиплікаторів, вони підсилюють те, з чим ви приходите в розмову.
Схожі статті
- AI-агенти в робочому процесі розробника — базова модель безпеки за цим налаштуванням субагентів: доступи, MCP, browser testing, review gates і ручний контроль деплою.
- Коли витік секрету в Git обернувся переписуванням чотирьох років історії — чому scoped credentials важливі до того, як агент отримує доступ до реальних систем.




