2026 OpenClaw MEMORY.md и управление контекстом сессии: аудируемый runbook для Mac cloud 7×24
Когда шлюз уже «зелёный», команды всё равно упираются в медленные ответы, растущие счета и повторные вопросы по уже принятым решениям. Чаще виноваты неограниченный контекст сессии и MEMORY, превратившийся в лишь дополняемый черновик, а не слабая модель. Статья описывает, кто страдает и что выигрывает дисциплина, даёт матрицу симптомов, не меньше пяти операционных шагов согласованных с логами gateway, пороги для цитирования и опоры для FAQ. Читайте вместе с руководством по observability и JSONL: там пробы и лестницы, здесь экономика памяти и контекста.
Содержание
1. Кратко: тихая инфляция контекста
В 2026 году успешный openclaw doctor и открытый порт доказывают оркестрацию, а не то, что каждый промпт остаётся лёгким. Каждый ход по-прежнему склеивает историю чата, выводы инструментов и долгосрочные вставки. Если MEMORY.md растёт без структуры, шум поиска побеждает факты, а задержка коррелирует с глубиной диалога сильнее, чем со страницами статуса провайдера. Управление здесь ближе к гигиене продукта, чем к классическому uptime-мониторингу: нужны правила владения долгосрочной истиной, ритм слияний и граница, что остаётся в JSONL, а не копируется обратно в память. Ниже — ложные тревоги, печатная матрица для дежурства и еженедельный чеклист в тех же временных окнах, что и разбор JSONL gateway.
Пропуск этой плоскости приводит к двум крайностям: либо агент голодает по полезной памяти и отвечает нестабильно, либо целые логи чата попадают в MEMORY и каждый вызов кажется дорогим. Устойчивая середина — короткие устойчивые факты, явные заголовки и агрессивная обрезка эфемерного болта — делает 7×24 ассистентов пригодными для бизнес-процессов.
Зафиксируйте письменно максимальную длину ответов инструментов до возврата в чат: суммирование JSON чаще режет задержку сильнее, чем смена модели. MEMORY.md — организационная долговременная память; контекст сессии — верстак, который каждый раз наполняется заново. Путаница между ними удваивает и токены, и хаос при инцидентах.
2. Боль: четыре ошибочных прочтения
Эти сюжеты повторяются, когда агент крутится семь дней в неделю на облачном Mac mini или малом VPS:
- Сначала винить модель Если десятый ответ в ветке медленный, а первый был быстрым, оцените размер инжектируемого контекста из логов до смены endpoint.
- Повторы за глупость Политики в километровом MEMORY без заголовков модель не вытащит стабильно; перестройте структуру раньше, чем трогать temperature.
- Никогда не уплотнять заметки Append-only MEMORY превращается в археологию — дыра в процессе, а не отсутствующий флаг.
- Путать OOM с долгом контекста Код 137 и перезапуски cgroup указывают на лимиты памяти; чистое раздувание контекста обычно оставляет процесс живым, а растёт латентность запроса. Неправильная плоскость съедает часы.
Запишите порядок в runbook рядом с пробами gateway: новички не покупают самую дорогую модель, когда раздулся только контекст.
Отдельно договоритесь, кто утверждает перенос заметок из сессии в устойчивый слой: без владельца такие решения откладываются, а MEMORY превращается в свалку.
3. Матрица: память vs ресурсы vs gateway
Повесьте рядом с таблицей проб из статьи observability, чтобы смены спорили данными, а не ощущениями.
| Симптом | Основная плоскость | Быстрое доказательство | Редко корневая причина |
|---|---|---|---|
| С каждым ходом медленнее, новая ветка нормальна | Контекст сессии | Латентность 1-го и 10-го хода; огромный JSON инструмента дословно | Случайный провал провайдера |
| Расход вырос, ответы короткие | Скрытый длинный контекст / дубликаты | Сопоставить биллинг и поля логов на запрос | Только повышение цен |
| Нарушены правила прошлой недели | Дрейф структуры MEMORY | Число строк, заголовки, устаревшие разделы | Регрессия семейства моделей |
| Процесс исчез, контейнер перезапускается | Ресурсы | Коды выхода, cgroup, свободный диск | Правки промпта |
| Канал молчит, проба падает | Gateway и плагины | gateway status, пробы каналов, лестница observability | Уборка MEMORY |
Базовые слои
Держите минимум два слоя: устойчивые факты (редко меняются, подлежат аудиту) и предпочтения сессии (можно выбросить за спринт). Устойчивое требует стабильных заголовков; не кладите пятьдесят решений в один абзац. Данные сессии не повышаются в устойчивое без человеческой или скриптовой ревью. Заложите фиксированное еженедельное окно для слияния устойчивого и обрезки сессии по границам итераций или порогам размера.
Короткий гайд по стилю в репозитории — какие заголовки разрешены, максимальная длина абзаца, какие выводы инструментов нельзя в сыром виде в MEMORY — сокращает время ревью сильнее ранней автоматизации. Команды, версионирующие это вместе с observability-runbook, избегают споров, кто виноват: модель или инфраструктура.
4. Пять шагов: недельный ритм и логи
Пройдите вручную до автоматизации через launchd или cron на Mac:
- Заморозить baseline Записать число строк
MEMORY.md, mtime и флаги длины контекста в тикет. - Еженедельное слияние Сложить факты в нужные разделы, убрать противоречия, запретить безымянные дампы.
- Промпт аудита дрейфа Попросить агента назвать три жёстких правила и сравнить с MEMORY; расхождение = дрейф.
- Выровнять JSONL gateway В том же окне хвостить структурные логи в порядке статьи observability. Если квоты и spawn тихи, а латентность высока, вернуться к размеру контекста.
- Бэкап до переписывания Снимок MEMORY и критичных файлов в датированную папку; откат = восстановление файла + перезагрузка gateway.
После крупного релиза или смены канала выполняйте шаг четыре строго параллельно с observability-статьёй: то же время, та же ротация, та же длина tail. Тогда видно, коррелирует ли задержка с событиями gateway или изолирована в контексте.
Минимальный снимок baseline:
5. Метрики, которые можно цитировать
Используйте в дизайн-ревью и инцидентах, затем калибруйте под масштаб. Логируйте медиану и p95 размеров ответов инструментов, разрешённых обратно в чат. Если несколько операторов правят MEMORY вручную, добавляйте строку changelog с датой и автором в начале каждого недельного слияния.
- Ограничение по строкам Примерно после восьмисот–тысячи двухсот неструктурированных строк люди ничего не находят; делите главы или выносите базу знаний.
- Календарное время Тридцать–сорок пять минут в неделю на гигиену MEMORY вместо квартального дня паники.
- Соотношение латентности При той же модели и канале: если p95 десятого хода примерно в 2–3 раза выше первого, сначала дублирующиеся payload инструментов, а не сеть.
- Запас диска JSONL, бэкапы и архивы MEMORY на одном томе хотят порядка 10–15 ГБ свободно на узлах Mac cloud, чтобы логи не дрожали.
- Сигнал 137 До опровержения считать cgroup-память; чисто контекстные проблемы редко заканчиваются на 137.
- Порядок эскалации Ресурсы, затем пробы gateway, затем управление памятью — наоборот получаются циклы.
- Журнал изменений Строка ответственный-дата в шапке слияния упрощает аудит и онбординг.
6. Почему Mac cloud подходит плоскости памяти
Шумные соседи по диску на VPS имитируют бури контекста: редкие всплески чтения ощущаются как гигантские промпты. Удалённые Windows-десктопы и потребительские ноутбуки добавляют сон и графические стеки, мешающие безнадзорным агентам. Docker добавляет слой, где монтирования и uid тихо рассинхронизируют путь MEMORY, который вы думаете, что редактируете. Выделенная машина Mac cloud ведёт себя как дисциплинированный SSH-сервер: предсказуемые пути для логов, заданий launchd и ночных архивов, рядом с Apple toolchain, на который вы уже опираетесь для OpenClaw. Контейнеры и обычные VPS годятся для экспериментов; когда управление памятью становится продакшеном, нужны ввод-вывод и владение, о которых можно рассуждать — это как раз арендуемые узлы VPSMAC до недели настройки промптов на шаткой инфраструктуре.
Управление MEMORY — часть управления затратами: та же еженедельная ревизия, что подчищает файлы, может включать пять минут дашборда токенов, чтобы финансы и инженерия говорили на одном языке. Общий набор метрик убирает качание между безлимитным контекстом и жёсткими сбросами посреди разговора.
Если на одном хосте смешаны контейнеры и bare-metal OpenClaw, запускайте openclaw doctor в обоих мирах и сравнивайте пути к MEMORY и JSONL. Половина конфигурации в контейнере и половина на хосте часто даёт пустые недельные слияния и растущий счёт за токены.