Cowork 마스터 백서 — Lv1 왕초보편 · 4편
Cowork를 한참 쓰다 보면 어느 순간 이런 일이 생긴다.
“어, 얘가 아까 알려준 걸 자꾸 까먹네?”
“왜 점점 답이 느려지지?”
“방금 전에 만든 파일 이름을 또 물어보네…”
대부분 토큰이라는 한 가지 개념으로 설명된다. 토큰이 뭐고, 왜 중요하고, 언제 대화창을 새로 열어야 하는지 정리해본다. 이 편(4편)과 다음 4-2편이 Cowork의 단기 기억 = 토큰을 다루는 시리즈다.
토큰이 뭐길래
쉽게 비유하면 토큰은 Cowork의 단기 기억 용량이다.
좀 더 정확히 말하면, 토큰은 AI가 글을 처리하는 최소 단위다. “안녕하세요”라는 한 마디는 한국어로 대략 5~6개 토큰으로 쪼개진다. 영어 “Hello”는 1개 토큰. 한국어가 영어보다 토큰을 2~3배 더 먹는다는 점은 한국 사용자가 알아두면 유리하다.
단기 기억 vs 장기 기억
사람과 비교하면 이해가 빠르다.
| 사람 | Cowork |
|---|---|
| 단기 기억 (방금 들은 얘기) | 현재 대화창의 토큰 윈도우 |
| 장기 기억 (오래 기억하는 것) | CLAUDE.md 파일·코워크 폴더의 파일들 |
현재 대화창에서 주고받은 메시지·읽은 파일·만든 결과물은 전부 토큰 윈도우 안에 쌓인다. 이 윈도우가 가득 차면 오래된 부분부터 흐려진다. 사람이 한 시간 전 대화는 또렷이 기억해도, 어제 점심 대화는 흐릿한 것과 같은 원리다.
핵심 비유
대화창 = 물잔. 토큰 = 물. 물을 계속 부으면 결국 넘친다. 넘치기 시작하면 아래쪽에 있던 물(=대화 초반 정보)부터 흘러나간다.
토큰은 어떻게 소모될까
대화창 한 번에 토큰이 쌓이는 경로는 크게 5가지다.
1) 사용자가 보낸 메시지 — 내가 친 글자 수만큼
2) Cowork가 답한 메시지 — Cowork가 쓴 글자 수만큼
3) 읽은 파일 내용 — 파일 통째로 토큰에 올라감
4) 본 사진·이미지 — 사진 1장이 보통 1,000~3,000 토큰
5) 시스템 규칙 — CLAUDE.md, 스킬 설명, 세션 설정 등 (대화 시작할 때 자동 로딩)
5번이 의외로 크다. 내 CLAUDE.md는 지금 약 1만 7천 자 정도 되는데, 대화창을 새로 열 때마다 이 내용이 통째로 토큰 윈도우에 들어간다. 이건 Cowork가 내 규칙을 매번 기억하기 위해 치르는 비용이다.
왜 길어지면 헤매는가
토큰 윈도우가 차오르면 두 가지 일이 생긴다.
① 오래된 정보가 흐려진다
대화 초반에 “이 작업은 워드프레스 기준으로 해줘”라고 말해도, 한참 뒤엔 그 지시가 흐릿해진다. 그래서 막판에 갑자기 티스토리 기준으로 답이 나오는 일이 생긴다.
② 처리 속도가 느려진다
토큰이 많아질수록 Cowork가 답할 때마다 모든 토큰을 다시 한 번 훑는다. 윈도우가 가득 찰수록 한 번 답하는 데 시간이 더 걸린다. 답이 점점 느려지는 게 느껴지면 토큰이 많이 쌓였다는 신호다.
새 대화창 열어야 할 타이밍 — 실용적 신호 5가지
이론보다 실전이다. 다음 신호 중 하나라도 보이면 새 대화창을 열 때다.
1) 같은 걸 두 번째로 묻는 질문이 나올 때
“방금 만든 파일 이름이 뭐였지?” 같은 질문을 Cowork가 하면, 그 정보가 흐려졌다는 뜻이다.
2) 답이 점점 느려질 때
첫 답은 5초였는데 지금은 30초가 걸리면, 토큰 윈도우가 거의 찼다.
3) 작업 주제가 바뀔 때
여행 블로그 초안 작업하다가 갑자기 한국사 분석집 메일을 발송하려는 순간 — 둘은 무관한 작업이다. 새 대화창에서 시작하는 게 깔끔하고 빠르다.
4) 큰 파일을 여러 개 읽힌 다음
사진 30장 분석시키고, 엑셀도 보여주고, 워드 초안도 보여줬다면 토큰이 폭발적으로 쌓인 상태다. 그 작업이 끝났으면 새 창으로 옮기는 게 안전하다.
5) “오늘 작업 정리해서 다음에 이어서 하자” 싶을 때
중요한 결정·결과만 따로 정리해서 파일에 적어두고, 새 대화창으로 옮기면 그 파일을 다시 읽는 것만으로 맥락이 살아난다.
긴 작업을 쪼개는 요령
12편 백서 작업처럼 며칠~몇 주 걸리는 일은 처음부터 여러 대화창에 나눠서 진행해야 한다. 한 대화창에서 다 하려고 하면 중간에 토큰 한계로 망한다.
원칙: 한 대화창 = 하나의 결과물
- 1편 작성 → 한 대화창에서 끝내고 닫기
- 2편 작성 → 새 대화창
- 3편 작성 → 새 대화창 (어느 편이든 동일 패턴)
각 대화창에서 만든 파일은 코워크 폴더에 남으니까, 새 창에서도 “기존 N편들 읽어서 같은 톤으로 다음 편 만들어줘” 한마디면 맥락이 복원된다. 파일이 곧 메모리 역할을 한다.
이게 다음 4-2편(토큰 절약 실전 시나리오)에서 더 깊게 다루고, 5편(CLAUDE.md)에서 영구화하는 도구로 이어진다.
CLAUDE.md로 “기억”을 영구화하기
지금까지의 얘기를 한 줄로 정리하면 이렇다.
대화창 안 토큰은 휘발성, 코워크 폴더의 파일은 영구.
이래서 내 CLAUDE.md가 강력한 거다. “한국사 메일 발송 시 본문은 이렇게 써줘” 같은 규칙을 한 번만 적어두면 100번째 대화창에서도 그대로 동작한다. 매번 토큰을 좀 더 먹기는 하지만, 반복 설명할 필요가 없다는 이득이 압도적으로 크다.
다만 CLAUDE.md가 너무 비대해지면 매 대화창마다 그만큼의 토큰을 먹는다는 비용이 생긴다. 가끔 한 번씩 정리해서 쓸모없어진 규칙은 지우는 게 좋다 (이걸 “메모리 압축”이라고 부르기도 한다 — Lv5에서 다룸).
토큰 절약 — 일상에서 쓸 수 있는 팁 5가지
1) 큰 파일은 통째로 던지지 말고, 필요한 부분만
“이 100페이지 PDF 통째로 봐줘”보다 “이 PDF의 3장만 봐줘”가 토큰을 1/30 쓴다.
2) 사진 분석할 때는 한 번에 5장 이내로
사진 30장을 한 번에 보여주면 토큰이 어마어마하게 쌓인다. 5장씩 끊어서 분석시키고 결과는 파일에 저장한 뒤, 새 대화창에서 그 파일을 읽는 게 효율적이다.
3) “정리해서 파일에 저장해줘”를 자주 시키기
한참 작업한 결과를 머리(=토큰 윈도우)에 두지 말고 파일에 옮겨두면, 새 대화창으로 안전하게 넘어갈 수 있다.
4) 결정 한 번 내릴 거면 짧게 묻기
“이거 어떻게 할까?” 같은 짧은 결정은 새 대화창에서 짧게 묻는 게 좋다. 진행 중인 큰 작업창의 토큰을 갉아먹지 말 것.
5) 같은 답을 다시 받을 거면 파일을 직접 읽으라고 하기
“네가 아까 만든 그 표 다시 보여줘”는 토큰을 쓴다. “그 파일 다시 열어봐”가 더 가볍다.
직접 확인해보고 싶다면
1) 토큰 차이 체감해보기
새 대화창을 열고 짧은 질문 하나 해본다 — “오늘 날씨 어때?” 같은. 답이 빠르게 나온다.
이번엔 같은 대화창에서 큰 파일 몇 개 읽혀보자. ROI 트래커, CLAUDE.md, 블로그 초안 등 5~6개. 그러고 나서 다시 짧은 질문을 던지면 답이 더 느리게 나온다. 토큰이 쌓였다는 증거다.
2) 새 대화창 효과 체감
답이 느려진 그 대화창을 닫고 새 대화창을 열어 같은 질문을 해보자. 다시 빨라진다. 이게 “대화창을 새로 여는” 효과다.
자주 묻는 질문
Q1. 새 대화창을 열면 Cowork가 나에 대한 정보를 다 잊나요?
A. 대화 내용은 잊는다. 하지만 코워크 폴더의 파일과 CLAUDE.md는 새 대화창에서도 그대로 읽으니까, 실질적인 “나에 대한 정보”는 안 잊는다. 이게 Cowork의 가장 똑똑한 설계다 — 휘발성(토큰)과 영구성(파일)을 분리해놨다.
Q2. 한 대화창에서 며칠 동안 계속 써도 되나요?
A. 짧은 작업이면 괜찮다. 하지만 큰 작업을 며칠 끌고 가면 토큰이 쌓이고 쌓여서 어느 순간 갑자기 답이 이상해진다. 하루 단위로 쪼개는 게 안전. 작업이 끝나면 그날의 결과·결정을 파일에 정리해두고 새 대화창을 여는 게 좋다.
Q3. 대화창이 너무 많이 쌓이면 정리해야 하나요?
A. Cowork 앱은 대화창 목록을 관리해주지만, 정말 중요한 건 결과물(파일)이지 대화창 자체가 아니다. 대화는 작업 흔적, 결과는 파일. 파일만 잘 정리되어 있으면 대화창은 정리 안 해도 큰 문제 없다.
Q4. 토큰 사용량을 실시간으로 볼 수 있나요?
A. Cowork 앱 자체에서 실시간 토큰 게이지를 보여주진 않는다. API 사용자는 Anthropic 사용량 페이지(console.anthropic.com/settings/usage)에서 누적 사용량을 볼 수 있다. 일반 사용자는 본인 감각(답 속도·답 정확도)이 가장 빠른 지표다 — 답이 느려지거나 같은 정보를 다시 묻기 시작하면 토큰이 많이 쌓였다는 신호.
Q5. CLAUDE.md를 줄여야 토큰이 절약되나요?
A. 이론적으로는 그렇지만, 반복 작업 규칙이 많은 경우 CLAUDE.md를 짧게 줄이는 것보다 매번 설명하는 비용이 더 크다. 무리해서 줄이지 말고, 6개월에 한 번 검토해서 안 쓰는 규칙만 정리하는 정도가 적당. “CLAUDE.md 정리해줘” 같은 요청은 가능하지만 결과를 본인이 한 번 검토하고 적용하는 게 안전.
정리
이 편에서 챙길 핵심 3가지.
- 토큰 = Cowork의 단기 기억. 대화창에 쌓이고, 가득 차면 오래된 것부터 흐려진다
- 새 대화창 신호 5가지 — 같은 거 두 번 묻기, 답 느려짐, 주제 바뀜, 큰 파일 다 읽힌 후, 작업 분기점
- 휘발성은 토큰, 영구성은 파일. 중요한 건 항상 파일에 저장 → 새 대화창에서 다시 읽기
이걸로 토큰 일반론이 끝났다. 다음 4-2편에서 토큰 절약 실전 시나리오를, 5편에서 본격적으로 CLAUDE.md를 어떻게 설계할지 다룬다. 이 백서를 읽는 사람이라면 이미 CLAUDE.md를 무의식적으로 쓰고 있을 텐데, 그걸 의식적으로 강력한 도구로 만드는 방법이 5편의 핵심이다.
📌 2026년 5월 현재 상태
- Claude Opus 4.6 컨텍스트 윈도우: 약 20만 토큰 (한국어 기준 한 권 분량의 책 정도)
- Sonnet 4.6 / Haiku 4.5도 유사하거나 동급 컨텍스트
- 한국어 토큰 효율: 영어 대비 약 2~3배 토큰 소비 (GPT 계열도 비슷)
- Cowork 앱은 자체 토큰 게이지 미표시 (체감으로 판단)
- Free 플랜 사용자는 일일 메시지 한도가 별도 적용 — 토큰 윈도우와는 다른 개념
- 새 대화창 단축키: Cowork 앱 메뉴 또는 좌측 상단 새 대화 버튼 (앱 버전마다 위치 차이 있음)
- 플러그인 시스템 활성화로 시스템 토큰 증가 — skills·MCP가 새 대화창마다 자동 로딩되므로 CLAUDE.md 외 시스템 토큰이 추가 소비됨. CLAUDE.md 비대화 + 안 쓰는 skills 정리 필요성 ↑
- Haiku 4.5 활용 권장 — 단순 분류·요약·짧은 질의응답은 Haiku 4.5로 처리하면 토큰 비용·속도 모두 우위. Cowork도 작업 성격에 맞춰 모델을 자동 선택
- 장기 세션 컨텍스트 관리 도구 강화 —
consolidate-memory같은 스킬이 등장해서 CLAUDE.md 자동 정리 가능
undefined