Как не упираться в лимиты ИИ-агентов

история чата

Не плоди мусорные сообщения

«Ты дурак, переделай», «нет, я имел в виду другое» — каждое такое сообщение навсегда в истории, и нейронка перечитывает его на каждом следующем шаге.

Что делать: вместо догоняющих правок — откати чат до проблемного сообщения или отредактируй исходный запрос (см. следующие два пункта).

история чата

Откат сообщений и форк чата

Вместо того чтобы поверх кривого ответа писать правки — откатись. Доступно везде.

Как: стрелка назад на сообщении → Fork conversation from here (откат диалога) или Fork & rewind code (откат вместе с файлами).

история чата

Редактируй своё сообщение

Если ты ошибся в формулировке — не пиши новое уточнение, отредактируй прошлое. Старый ответ исчезает, история остаётся чистой.

Как: наведи на своё сообщение → значок карандаша → правки → Save. Нейронка ответит заново на исправленный запрос.

история чата

Пиши несколько вопросов в одном сообщении

Если задачи небольшие и связанные — задавай их пачкой в одном сообщении. Нейронка прогонит контекст один раз, а не три.

Что делать: группируй мелочёвку. Большие задачи — всё ещё по одной на чат.

claude code

Команда `/btw` для побочных вопросов

В Claude Code можно задать сторонний вопрос, не прерывая и не загрязняя основную задачу. Идеально, когда нужно быстро что-то уточнить, а ломать контекст рабочей сессии не хочется.

Как: введи /btw, задай вопрос — модель ответит. После Esc и вопрос, и ответ полностью пропадают из истории чата, токены не «прилипают».

промтинг

Проси отвечать коротко

Выходные токены стоят примерно в 5 раз дороже входных, потому что модель пишет ответ по слову, прогоняя контекст перед каждым.

Как: один раз пропиши «отвечай коротко и по делу» в глобальном CLAUDE.md / AGENTS.md или в Personal Preferences.

структура

Один таск — один чат

Дизайн, вёрстка, бэкенд, интеграции в одном чате — путь к деградации. Каждая новая тема загрязняет контекст для остальных.

Что делать: закончил крупный таск — закрыл чат. Если контекст важен дальше — выноси в .md и ссылайся.

структура

Не превышай ~120 000 токенов

Контекстное окно у Claude — миллион, но реально модель работает чисто примерно до 120k. Дальше начинаются ошибки и забывания.

Как: следи за индикатором, используй /compact, делай откаты или переходи в новый чат.

Скилл-суммаризатор для перехода в новый чат

Готовый Claude Code skill, который превращает текущий разговор в один копируемый markdown-блок и вставляется первым сообщением в новый чат — новая сессия мгновенно получает полный рабочий контекст без переспросов. Универсален: код, ресёрч, креатив, решения.

Скачать summarize-master.md Открыть в браузере

делегирование

Используй субагентов

Крупная задача (например, SEO-аудит) у субагента живёт в его собственном контекстном окне. В основной чат возвращается только финальное резюме — десятки тысяч строк остаются «там».

Что делать: делегируй большие, изолируемые задачи субагентам. Доступно в Claude и Codex.

делегирование

Создавай скилы

Скилл — это .md с инструкцией под повторяющуюся задачу. Нейронка не думает заново — сразу применяет готовое решение. Подгружается только когда нужно.

Что делать: один раз решил сложную задачу хорошо — заверни в скилл, в следующий раз сэкономишь часы и токены.

файлы

Markdown вместо PDF и DOCX

PDF тащит метаданные шрифтов, координаты символов, разметку. На один и тот же текст PDF съест ~15k токенов, а Markdown — ~8k. Плюс .md — родной формат для нейросетей.

Что делать: любые ТЗ, инструкции, дизайн-системы и доки конвертируй в Markdown, прежде чем передавать модели.

файлы

CLAUDE.md / AGENTS.md до 200 строк

Эти файлы подгружаются в начале каждой сессии. Если в них тысяча строк — модель уже стартует с забитым контекстом и тупит с первого сообщения.

Как: держи только то, что важно для каждой задачи. Дизайн-систему, ТЗ и крупные блоки — в отдельные .md, и ссылайся на них одной строчкой.

отключение

Отключай ненужное

Каждая дополнительная функция жрёт токены просто фактом существования. MCP-серверы (особенно Playwright), Extended Thinking, коннекторы, работа в браузере — всё это нагружает контекст, даже если в текущей задаче не используется.

Как: /mcp → выбрать сервер → Disable. Расширенное мышление выключай для рутины. В промте можно писать прямо: «не используй Playwright MCP в этой задаче». Включай адресно — только когда реально нужно.

модели

Лёгкие задачи — лёгкая модель

Поменять цвет кнопки прекрасно делает Haiku. Гонять для этого Opus — переплата токенами и временем.

Как: /model в Claude Code. Haiku — рутина, Sonnet — типовая работа, Opus — сложная архитектура и критичные правки.

промтинг

Plan Mode перед реализацией

В режиме плана модель сначала составляет план задачи, ты его согласуешь — и только потом она пишет код. Меньше переделок → меньше сожжённых токенов.

Как: Shift+Tab в Claude Code и Codex — переключение режима в правом нижнем углу. Для крупных задач — плагин Superpowers: брейншторм → план → реализация → тесты.

claude code

Растягиваем 5-часовое окно

Окно лимитов в Claude Code стартует с твоего первого сообщения за день. Если первое сообщение в 6 утра — окно закроется в 11, и сразу откроется новое к моменту, когда ты реально садишься работать.

Как: создай Claude Routine — короткое сообщение, отправляемое на ранний час. Сжёг лимит — оно уже почти восстановилось.

Способы экономии токенов

Не плоди мусорные сообщения

Откат сообщений и форк чата

Редактируй своё сообщение

Пиши несколько вопросов в одном сообщении

Команда `/btw` для побочных вопросов

Проси отвечать коротко

Один таск — один чат

Не превышай ~120 000 токенов

Скилл-суммаризатор для перехода в новый чат

Используй субагентов

Создавай скилы

Markdown вместо PDF и DOCX

CLAUDE.md / AGENTS.md до 200 строк

Отключай ненужное

Лёгкие задачи — лёгкая модель

Plan Mode перед реализацией

Растягиваем 5-часовое окно

10 GitHub-репозиториев для экономии токенов

Способы экономии токенов

Не плоди мусорные сообщения

Откат сообщений и форк чата

Редактируй своё сообщение

Пиши несколько вопросов в одном сообщении

Команда /btw для побочных вопросов

Проси отвечать коротко

Один таск — один чат

Не превышай ~120 000 токенов

Скилл-суммаризатор для перехода в новый чат

Используй субагентов

Создавай скилы

Markdown вместо PDF и DOCX

CLAUDE.md / AGENTS.md до 200 строк

Отключай ненужное

Лёгкие задачи — лёгкая модель

Plan Mode перед реализацией

Растягиваем 5-часовое окно

10 GitHub-репозиториев для экономии токенов

Команда `/btw` для побочных вопросов