2026 OpenClaw 다섯 계층(Channel·Account·Agent·Session·Memory) 모델로 단계별 트러블슈팅: 증상 매트릭스와 Mac 클라우드 Gateway 로그 정렬
openclaw doctor 는 통과하지만 「가끔 무응답」「그룹만 이상」「컨텍스트가 무거워진다」가 남을 때는 채널 문제를 모델 탓으로, 세션 비대를 게이트웨이 다운으로 오인하는 경우가 많다. 다섯 계층으로 전형 증상·라우팅 표를 제시하고, JSONL·Gateway 상태와 맞추는 순서, 계층을 정한 뒤 doctor 실행, Mac 클라우드 7×24 로그 운용을 정리한다. 사이트 내 JSONL 가이드와 연결해 순수 명령 사다리 글과 중복을 줄인다.
목차
1. doctor 만으로 부족한 이유
- 타임아웃 다의성:IM 지연·첫 토큰 지연·JSONL 플러시 지연이 같은 「긴 Thinking」로 보일 수 있다.
- 문법 OK ≠ 동작 OK:페어링 만료·Account 키 교체는 doctor 이후에도 남는다.
- 세션·메모리 혼선:병렬 세션과 메모리 증가가 모두 토큰을 밀어 올린다. 게이트웨이 재시작만으로는 재발한다.
다섯 계층은 추측을 라우팅으로 바꾼다: 계층마다 증거와 최소 변경 집합이 있다.
티켓에 계층 이름을 필수로 넣으면 분기별로 어느 층을 자주 오판하는지 숫자로 남는다. 런북이 구두 전승이 되는 것을 막는다.
2. 다섯 계층 역할과 고장 패턴
- Channel:Webhook, 장시간 연결, 봇 권한, requireMention. 이벤트 미도착, DM/그룹 차이.
- Account:프로바이더 키, 워크스페이스 바인딩. 401/403 산발, 한 계정만 실패.
- Agent:도구 허용, 스킬, 시스템 프롬프트. 도구 미호출, 과도 거절.
- Session:다턴 컨텍스트, spawn, 병렬 대화. 주제 혼선, 스레드 점점 느려짐.
- Memory:장기 사실·선호 파일. 낡은 사실 재등장, 검색 노이즈.
Channel 과 Account 경계가 흐릴 때는 IM 콘솔에 이벤트가 없으면 Channel 우선, 이벤트는 있는데 서명 오류면 Account 우선으로 고정하면 빠르다.
3. 증상→계층 라우팅 표
| 증상 | 먼저 볼 계층 | 하지 말 것 |
|---|---|---|
| 그룹만 무응답 | Channel | temperature 만 조정 |
| 전 채널 401 계열 | Account | npm 재설치만 |
| 보수적·도구 미사용 | Agent | max_tokens 맹신 |
| 토픽 혼선 | Session | 캐시만 삭제 |
| 사실이 안 지워짐 | Memory | 무한 재부팅 |
표를 외우기보다 첫 응답에서 「어느 층을 먼저 볼지」만 고르도록 훈련하면 된다. 나머지는 로그 시간창으로 증명하면 된다. 음성으로 브리핑할 때도 층 이름을 먼저 말하면 회의가 짧아진다.
4. 다섯 단계: 증거→로그→doctor
- 시간창 고정:UTC·channel/conversation id 기록.
- Channel 바깥으로 확장:도달 여부 먼저, 이후 Account.
- Agent 변경 확인:스킬/정책 시각과 장애 시작 대조. 필요 시 최소 spawn.
- Session·Memory 분리:턴·도구 출력과 메모리 쓰기 빈도를 나누고 JSONL 토큰 힌트와 장문 가이드를 맞춘다.
- 마지막 doctor:가설 후
openclaw doctor. 로그 전 --fix 는 층을 섞는다.
티켓에는 status 스냅샷·타임스탬프가 있는 로그 발췌·doctor 요약 세트를 붙이면, SSH 권한 없는 동료도 층 가설을 검토할 수 있다.
Mac 클라우드에서는 로그 경로와 launchd 표준 출력을 고정해 비로그인 SSH 도 동일 JSONL 에 쓰게 한다. 게이트웨이 전용 볼륨에 디스크 임계를 두고 로테 산물은 객체 스토리지로 옮기면 장기 비교가 쉽다.
두 계층이 동시에 의심되면 채널 하나·메모리 파일 임시 이름 변경처럼 되돌리기 쉬운 실험으로 범위를 줄인다.
5. Gateway 필드와 Mac 클라우드
- 시간창:기본 5~15분 공존 로그. 날짜 넘김은 로테 경계 확인.
- 필드:channel·conversation·request 로 가로 연결. ERROR 줄만 믿지 않는다.
- Mac 클라우드:디스크 약 85% 이상 경고. 18789 SSH 터널 시 RTT 와 채널 전달을 분리 기록.
- doctor 경계:설정·헬스 중심. 증상 가설 뒤에 실행.
JSONL 을 jq 등으로 채널별 WARN 비율을 주간 집계하면 Channel 층 점검 티켓을 자동으로 열 수 있다. 토큰 필드는 사이트 가이드와 맞추면 대시보드를 공유하기 쉽다.
보안 감사 시에도 층 라벨이 유용하다. Channel 사건은 IM 벤더 감사 로그를, Account 사건은 키 로테 런북을 끌어와야 하므로 증거 유형이 다르다. 한 티켓에 섞으면 컴플라이언스 응답이 느려진다.
지원팀이 먼저 접수할 때 「Channel 쪽 같다」「Session 쪽 같다」라고 메모해 두면 엔지니어가 SSH 들어가기 전에 가설이 좁혀진다. 고객 대응 SLA 에도 직접 도움이 되고 반복 질문을 줄인다.
6. FAQ·JSONL 가이드 연결
다채널은 어디서? Channel→Account. 채널별 수집을 먼저 증명.
다계정 오탐 줄이기:전체 장애 vs 단일 계정만 구분.
세션 비대:Session vs Memory — 턴·도구 출력을 먼저 재고 동시 변경은 피한다.
알림에 계층 태그를? 템플릿에 다섯 계층 선택을 필수로 두고 분기별 오라우팅률을 본다.
노트북·단기 컨테이너만으로는 7×24 재현이 어렵고 재시작 의존은 운용이 아니다. 비 macOS 샌드박스는 프로덕션과 도구·파일 감시가 어긋나기 쉽다. Gateway·JSONL·채널을 같은 받침 위에 두려면 VPSMAC 전용 Mac 클라우드가 현실적이며, 사이트 JSONL 가이드의 토큰 경고·프로브로 다섯 단계를 이어 붙일 수 있다.