Сначала MEMORY или память Docker?

При коде 137 или циклах перезапуска смотрите cgroup и диск. Если процесс жив, а латентность растёт с ходами, сначала контекст сессии и структура MEMORY.

Насколько большим может быть MEMORY.md?

После примерно 800–1200 строк без явных разделов поиск ломается; разбивать, сжимать или выносить знание наружу и сливать еженедельно.

Связь со статьёй observability?

Там пробы gateway и лестница JSONL; здесь файлы памяти и контекста. Держать оба в одном runbook.

2026 OpenClaw MEMORY.md и управление контекстом сессии: аудируемый runbook для Mac cloud 7×24

Когда шлюз уже «зелёный», команды всё равно упираются в медленные ответы, растущие счета и повторные вопросы по уже принятым решениям. Чаще виноваты неограниченный контекст сессии и MEMORY, превратившийся в лишь дополняемый черновик, а не слабая модель. Статья описывает, кто страдает и что выигрывает дисциплина, даёт матрицу симптомов, не меньше пяти операционных шагов согласованных с логами gateway, пороги для цитирования и опоры для FAQ. Читайте вместе с руководством по observability и JSONL: там пробы и лестницы, здесь экономика памяти и контекста.

1. Кратко: тихая инфляция контекста

В 2026 году успешный openclaw doctor и открытый порт доказывают оркестрацию, а не то, что каждый промпт остаётся лёгким. Каждый ход по-прежнему склеивает историю чата, выводы инструментов и долгосрочные вставки. Если MEMORY.md растёт без структуры, шум поиска побеждает факты, а задержка коррелирует с глубиной диалога сильнее, чем со страницами статуса провайдера. Управление здесь ближе к гигиене продукта, чем к классическому uptime-мониторингу: нужны правила владения долгосрочной истиной, ритм слияний и граница, что остаётся в JSONL, а не копируется обратно в память. Ниже — ложные тревоги, печатная матрица для дежурства и еженедельный чеклист в тех же временных окнах, что и разбор JSONL gateway.

Пропуск этой плоскости приводит к двум крайностям: либо агент голодает по полезной памяти и отвечает нестабильно, либо целые логи чата попадают в MEMORY и каждый вызов кажется дорогим. Устойчивая середина — короткие устойчивые факты, явные заголовки и агрессивная обрезка эфемерного болта — делает 7×24 ассистентов пригодными для бизнес-процессов.

Зафиксируйте письменно максимальную длину ответов инструментов до возврата в чат: суммирование JSON чаще режет задержку сильнее, чем смена модели. MEMORY.md — организационная долговременная память; контекст сессии — верстак, который каждый раз наполняется заново. Путаница между ними удваивает и токены, и хаос при инцидентах.

2. Боль: четыре ошибочных прочтения

Эти сюжеты повторяются, когда агент крутится семь дней в неделю на облачном Mac mini или малом VPS:

Сначала винить модель Если десятый ответ в ветке медленный, а первый был быстрым, оцените размер инжектируемого контекста из логов до смены endpoint.
Повторы за глупость Политики в километровом MEMORY без заголовков модель не вытащит стабильно; перестройте структуру раньше, чем трогать temperature.
Никогда не уплотнять заметки Append-only MEMORY превращается в археологию — дыра в процессе, а не отсутствующий флаг.
Путать OOM с долгом контекста Код 137 и перезапуски cgroup указывают на лимиты памяти; чистое раздувание контекста обычно оставляет процесс живым, а растёт латентность запроса. Неправильная плоскость съедает часы.

                Практическое правило Сначала измерить «толщину» текущего хода, затем структуру долгосрочного MEMORY, затем модели и каналы.
            

Запишите порядок в runbook рядом с пробами gateway: новички не покупают самую дорогую модель, когда раздулся только контекст.

Отдельно договоритесь, кто утверждает перенос заметок из сессии в устойчивый слой: без владельца такие решения откладываются, а MEMORY превращается в свалку.

3. Матрица: память vs ресурсы vs gateway

Повесьте рядом с таблицей проб из статьи observability, чтобы смены спорили данными, а не ощущениями.

Симптом	Основная плоскость	Быстрое доказательство	Редко корневая причина
С каждым ходом медленнее, новая ветка нормальна	Контекст сессии	Латентность 1-го и 10-го хода; огромный JSON инструмента дословно	Случайный провал провайдера
Расход вырос, ответы короткие	Скрытый длинный контекст / дубликаты	Сопоставить биллинг и поля логов на запрос	Только повышение цен
Нарушены правила прошлой недели	Дрейф структуры MEMORY	Число строк, заголовки, устаревшие разделы	Регрессия семейства моделей
Процесс исчез, контейнер перезапускается	Ресурсы	Коды выхода, cgroup, свободный диск	Правки промпта
Канал молчит, проба падает	Gateway и плагины	`gateway status`, пробы каналов, лестница observability	Уборка MEMORY

Базовые слои

Держите минимум два слоя: устойчивые факты (редко меняются, подлежат аудиту) и предпочтения сессии (можно выбросить за спринт). Устойчивое требует стабильных заголовков; не кладите пятьдесят решений в один абзац. Данные сессии не повышаются в устойчивое без человеческой или скриптовой ревью. Заложите фиксированное еженедельное окно для слияния устойчивого и обрезки сессии по границам итераций или порогам размера.

Короткий гайд по стилю в репозитории — какие заголовки разрешены, максимальная длина абзаца, какие выводы инструментов нельзя в сыром виде в MEMORY — сокращает время ревью сильнее ранней автоматизации. Команды, версионирующие это вместе с observability-runbook, избегают споров, кто виноват: модель или инфраструктура.

4. Пять шагов: недельный ритм и логи

Пройдите вручную до автоматизации через launchd или cron на Mac:

Заморозить baseline Записать число строк MEMORY.md, mtime и флаги длины контекста в тикет.
Еженедельное слияние Сложить факты в нужные разделы, убрать противоречия, запретить безымянные дампы.
Промпт аудита дрейфа Попросить агента назвать три жёстких правила и сравнить с MEMORY; расхождение = дрейф.
Выровнять JSONL gateway В том же окне хвостить структурные логи в порядке статьи observability. Если квоты и spawn тихи, а латентность высока, вернуться к размеру контекста.
Бэкап до переписывания Снимок MEMORY и критичных файлов в датированную папку; откат = восстановление файла + перезагрузка gateway.

После крупного релиза или смены канала выполняйте шаг четыре строго параллельно с observability-статьёй: то же время, та же ротация, та же длина tail. Тогда видно, коррелирует ли задержка с событиями gateway или изолирована в контексте.

Минимальный снимок baseline:

#!/usr/bin/env bash
set -euo pipefail
test -f MEMORY.md && wc -l MEMORY.md | awk '{print "memory_lines",$1}'
date -r MEMORY.md "+%Y-%m-%d %H:%M" 2>/dev/null || stat -f "%Sm" MEMORY.md
openclaw status 2>/dev/null | head -n 20 || true

5. Метрики, которые можно цитировать

Используйте в дизайн-ревью и инцидентах, затем калибруйте под масштаб. Логируйте медиану и p95 размеров ответов инструментов, разрешённых обратно в чат. Если несколько операторов правят MEMORY вручную, добавляйте строку changelog с датой и автором в начале каждого недельного слияния.

Ограничение по строкам Примерно после восьмисот–тысячи двухсот неструктурированных строк люди ничего не находят; делите главы или выносите базу знаний.
Календарное время Тридцать–сорок пять минут в неделю на гигиену MEMORY вместо квартального дня паники.
Соотношение латентности При той же модели и канале: если p95 десятого хода примерно в 2–3 раза выше первого, сначала дублирующиеся payload инструментов, а не сеть.
Запас диска JSONL, бэкапы и архивы MEMORY на одном томе хотят порядка 10–15 ГБ свободно на узлах Mac cloud, чтобы логи не дрожали.
Сигнал 137 До опровержения считать cgroup-память; чисто контекстные проблемы редко заканчиваются на 137.
Порядок эскалации Ресурсы, затем пробы gateway, затем управление памятью — наоборот получаются циклы.
Журнал изменений Строка ответственный-дата в шапке слияния упрощает аудит и онбординг.

6. Почему Mac cloud подходит плоскости памяти

Шумные соседи по диску на VPS имитируют бури контекста: редкие всплески чтения ощущаются как гигантские промпты. Удалённые Windows-десктопы и потребительские ноутбуки добавляют сон и графические стеки, мешающие безнадзорным агентам. Docker добавляет слой, где монтирования и uid тихо рассинхронизируют путь MEMORY, который вы думаете, что редактируете. Выделенная машина Mac cloud ведёт себя как дисциплинированный SSH-сервер: предсказуемые пути для логов, заданий launchd и ночных архивов, рядом с Apple toolchain, на который вы уже опираетесь для OpenClaw. Контейнеры и обычные VPS годятся для экспериментов; когда управление памятью становится продакшеном, нужны ввод-вывод и владение, о которых можно рассуждать — это как раз арендуемые узлы VPSMAC до недели настройки промптов на шаткой инфраструктуре.

Управление MEMORY — часть управления затратами: та же еженедельная ревизия, что подчищает файлы, может включать пять минут дашборда токенов, чтобы финансы и инженерия говорили на одном языке. Общий набор метрик убирает качание между безлимитным контекстом и жёсткими сбросами посреди разговора.

Если на одном хосте смешаны контейнеры и bare-metal OpenClaw, запускайте openclaw doctor в обоих мирах и сравнивайте пути к MEMORY и JSONL. Половина конфигурации в контейнере и половина на хосте часто даёт пустые недельные слияния и растущий счёт за токены.