[4편] 토큰 관리 — 새 대화창 열어야 할 5가지 신호

Cowork 마스터 백서 — Lv1 왕초보편 · 4편


Cowork를 한참 쓰다 보면 어느 순간 이런 일이 생긴다.

“어, 얘가 아까 알려준 걸 자꾸 까먹네?”
“왜 점점 답이 느려지지?”
“방금 전에 만든 파일 이름을 또 물어보네…”

대부분 토큰이라는 한 가지 개념으로 설명된다. 토큰이 뭐고, 왜 중요하고, 언제 대화창을 새로 열어야 하는지 정리해본다. 이 편(4편)과 다음 4-2편이 Cowork의 단기 기억 = 토큰을 다루는 시리즈다.


토큰이 뭐길래

쉽게 비유하면 토큰은 Cowork의 단기 기억 용량이다.

좀 더 정확히 말하면, 토큰은 AI가 글을 처리하는 최소 단위다. “안녕하세요”라는 한 마디는 한국어로 대략 5~6개 토큰으로 쪼개진다. 영어 “Hello”는 1개 토큰. 한국어가 영어보다 토큰을 2~3배 더 먹는다는 점은 한국 사용자가 알아두면 유리하다.

단기 기억 vs 장기 기억

사람과 비교하면 이해가 빠르다.

사람 Cowork
단기 기억 (방금 들은 얘기) 현재 대화창의 토큰 윈도우
장기 기억 (오래 기억하는 것) CLAUDE.md 파일·코워크 폴더의 파일들

현재 대화창에서 주고받은 메시지·읽은 파일·만든 결과물은 전부 토큰 윈도우 안에 쌓인다. 이 윈도우가 가득 차면 오래된 부분부터 흐려진다. 사람이 한 시간 전 대화는 또렷이 기억해도, 어제 점심 대화는 흐릿한 것과 같은 원리다.

핵심 비유
대화창 = 물잔. 토큰 = 물. 물을 계속 부으면 결국 넘친다. 넘치기 시작하면 아래쪽에 있던 물(=대화 초반 정보)부터 흘러나간다.


토큰은 어떻게 소모될까

대화창 한 번에 토큰이 쌓이는 경로는 크게 5가지다.

1) 사용자가 보낸 메시지 — 내가 친 글자 수만큼
2) Cowork가 답한 메시지 — Cowork가 쓴 글자 수만큼
3) 읽은 파일 내용 — 파일 통째로 토큰에 올라감
4) 본 사진·이미지 — 사진 1장이 보통 1,000~3,000 토큰
5) 시스템 규칙 — CLAUDE.md, 스킬 설명, 세션 설정 등 (대화 시작할 때 자동 로딩)

5번이 의외로 크다. 내 CLAUDE.md는 지금 약 1만 7천 자 정도 되는데, 대화창을 새로 열 때마다 이 내용이 통째로 토큰 윈도우에 들어간다. 이건 Cowork가 내 규칙을 매번 기억하기 위해 치르는 비용이다.


왜 길어지면 헤매는가

토큰 윈도우가 차오르면 두 가지 일이 생긴다.

① 오래된 정보가 흐려진다
대화 초반에 “이 작업은 워드프레스 기준으로 해줘”라고 말해도, 한참 뒤엔 그 지시가 흐릿해진다. 그래서 막판에 갑자기 티스토리 기준으로 답이 나오는 일이 생긴다.

② 처리 속도가 느려진다
토큰이 많아질수록 Cowork가 답할 때마다 모든 토큰을 다시 한 번 훑는다. 윈도우가 가득 찰수록 한 번 답하는 데 시간이 더 걸린다. 답이 점점 느려지는 게 느껴지면 토큰이 많이 쌓였다는 신호다.


새 대화창 열어야 할 타이밍 — 실용적 신호 5가지

이론보다 실전이다. 다음 신호 중 하나라도 보이면 새 대화창을 열 때다.

1) 같은 걸 두 번째로 묻는 질문이 나올 때
“방금 만든 파일 이름이 뭐였지?” 같은 질문을 Cowork가 하면, 그 정보가 흐려졌다는 뜻이다.

2) 답이 점점 느려질 때
첫 답은 5초였는데 지금은 30초가 걸리면, 토큰 윈도우가 거의 찼다.

3) 작업 주제가 바뀔 때
여행 블로그 초안 작업하다가 갑자기 한국사 분석집 메일을 발송하려는 순간 — 둘은 무관한 작업이다. 새 대화창에서 시작하는 게 깔끔하고 빠르다.

4) 큰 파일을 여러 개 읽힌 다음
사진 30장 분석시키고, 엑셀도 보여주고, 워드 초안도 보여줬다면 토큰이 폭발적으로 쌓인 상태다. 그 작업이 끝났으면 새 창으로 옮기는 게 안전하다.

5) “오늘 작업 정리해서 다음에 이어서 하자” 싶을 때
중요한 결정·결과만 따로 정리해서 파일에 적어두고, 새 대화창으로 옮기면 그 파일을 다시 읽는 것만으로 맥락이 살아난다.


긴 작업을 쪼개는 요령

12편 백서 작업처럼 며칠~몇 주 걸리는 일은 처음부터 여러 대화창에 나눠서 진행해야 한다. 한 대화창에서 다 하려고 하면 중간에 토큰 한계로 망한다.

원칙: 한 대화창 = 하나의 결과물

  • 1편 작성 → 한 대화창에서 끝내고 닫기
  • 2편 작성 → 새 대화창
  • 3편 작성 → 새 대화창 (어느 편이든 동일 패턴)

각 대화창에서 만든 파일은 코워크 폴더에 남으니까, 새 창에서도 “기존 N편들 읽어서 같은 톤으로 다음 편 만들어줘” 한마디면 맥락이 복원된다. 파일이 곧 메모리 역할을 한다.

이게 다음 4-2편(토큰 절약 실전 시나리오)에서 더 깊게 다루고, 5편(CLAUDE.md)에서 영구화하는 도구로 이어진다.


CLAUDE.md로 “기억”을 영구화하기

지금까지의 얘기를 한 줄로 정리하면 이렇다.

대화창 안 토큰은 휘발성, 코워크 폴더의 파일은 영구.

이래서 내 CLAUDE.md가 강력한 거다. “한국사 메일 발송 시 본문은 이렇게 써줘” 같은 규칙을 한 번만 적어두면 100번째 대화창에서도 그대로 동작한다. 매번 토큰을 좀 더 먹기는 하지만, 반복 설명할 필요가 없다는 이득이 압도적으로 크다.

다만 CLAUDE.md가 너무 비대해지면 매 대화창마다 그만큼의 토큰을 먹는다는 비용이 생긴다. 가끔 한 번씩 정리해서 쓸모없어진 규칙은 지우는 게 좋다 (이걸 “메모리 압축”이라고 부르기도 한다 — Lv5에서 다룸).


토큰 절약 — 일상에서 쓸 수 있는 팁 5가지

1) 큰 파일은 통째로 던지지 말고, 필요한 부분만
“이 100페이지 PDF 통째로 봐줘”보다 “이 PDF의 3장만 봐줘”가 토큰을 1/30 쓴다.

2) 사진 분석할 때는 한 번에 5장 이내로
사진 30장을 한 번에 보여주면 토큰이 어마어마하게 쌓인다. 5장씩 끊어서 분석시키고 결과는 파일에 저장한 뒤, 새 대화창에서 그 파일을 읽는 게 효율적이다.

3) “정리해서 파일에 저장해줘”를 자주 시키기
한참 작업한 결과를 머리(=토큰 윈도우)에 두지 말고 파일에 옮겨두면, 새 대화창으로 안전하게 넘어갈 수 있다.

4) 결정 한 번 내릴 거면 짧게 묻기
“이거 어떻게 할까?” 같은 짧은 결정은 새 대화창에서 짧게 묻는 게 좋다. 진행 중인 큰 작업창의 토큰을 갉아먹지 말 것.

5) 같은 답을 다시 받을 거면 파일을 직접 읽으라고 하기
“네가 아까 만든 그 표 다시 보여줘”는 토큰을 쓴다. “그 파일 다시 열어봐”가 더 가볍다.


직접 확인해보고 싶다면

1) 토큰 차이 체감해보기

새 대화창을 열고 짧은 질문 하나 해본다 — “오늘 날씨 어때?” 같은. 답이 빠르게 나온다.

이번엔 같은 대화창에서 큰 파일 몇 개 읽혀보자. ROI 트래커, CLAUDE.md, 블로그 초안 등 5~6개. 그러고 나서 다시 짧은 질문을 던지면 답이 더 느리게 나온다. 토큰이 쌓였다는 증거다.

2) 새 대화창 효과 체감

답이 느려진 그 대화창을 닫고 새 대화창을 열어 같은 질문을 해보자. 다시 빨라진다. 이게 “대화창을 새로 여는” 효과다.


자주 묻는 질문

Q1. 새 대화창을 열면 Cowork가 나에 대한 정보를 다 잊나요?
A. 대화 내용은 잊는다. 하지만 코워크 폴더의 파일과 CLAUDE.md는 새 대화창에서도 그대로 읽으니까, 실질적인 “나에 대한 정보”는 안 잊는다. 이게 Cowork의 가장 똑똑한 설계다 — 휘발성(토큰)과 영구성(파일)을 분리해놨다.

Q2. 한 대화창에서 며칠 동안 계속 써도 되나요?
A. 짧은 작업이면 괜찮다. 하지만 큰 작업을 며칠 끌고 가면 토큰이 쌓이고 쌓여서 어느 순간 갑자기 답이 이상해진다. 하루 단위로 쪼개는 게 안전. 작업이 끝나면 그날의 결과·결정을 파일에 정리해두고 새 대화창을 여는 게 좋다.

Q3. 대화창이 너무 많이 쌓이면 정리해야 하나요?
A. Cowork 앱은 대화창 목록을 관리해주지만, 정말 중요한 건 결과물(파일)이지 대화창 자체가 아니다. 대화는 작업 흔적, 결과는 파일. 파일만 잘 정리되어 있으면 대화창은 정리 안 해도 큰 문제 없다.

Q4. 토큰 사용량을 실시간으로 볼 수 있나요?
A. Cowork 앱 자체에서 실시간 토큰 게이지를 보여주진 않는다. API 사용자는 Anthropic 사용량 페이지(console.anthropic.com/settings/usage)에서 누적 사용량을 볼 수 있다. 일반 사용자는 본인 감각(답 속도·답 정확도)이 가장 빠른 지표다 — 답이 느려지거나 같은 정보를 다시 묻기 시작하면 토큰이 많이 쌓였다는 신호.

Q5. CLAUDE.md를 줄여야 토큰이 절약되나요?
A. 이론적으로는 그렇지만, 반복 작업 규칙이 많은 경우 CLAUDE.md를 짧게 줄이는 것보다 매번 설명하는 비용이 더 크다. 무리해서 줄이지 말고, 6개월에 한 번 검토해서 안 쓰는 규칙만 정리하는 정도가 적당. “CLAUDE.md 정리해줘” 같은 요청은 가능하지만 결과를 본인이 한 번 검토하고 적용하는 게 안전.


정리

이 편에서 챙길 핵심 3가지.

  • 토큰 = Cowork의 단기 기억. 대화창에 쌓이고, 가득 차면 오래된 것부터 흐려진다
  • 새 대화창 신호 5가지 — 같은 거 두 번 묻기, 답 느려짐, 주제 바뀜, 큰 파일 다 읽힌 후, 작업 분기점
  • 휘발성은 토큰, 영구성은 파일. 중요한 건 항상 파일에 저장 → 새 대화창에서 다시 읽기

이걸로 토큰 일반론이 끝났다. 다음 4-2편에서 토큰 절약 실전 시나리오를, 5편에서 본격적으로 CLAUDE.md를 어떻게 설계할지 다룬다. 이 백서를 읽는 사람이라면 이미 CLAUDE.md를 무의식적으로 쓰고 있을 텐데, 그걸 의식적으로 강력한 도구로 만드는 방법이 5편의 핵심이다.


📌 2026년 5월 현재 상태

  • Claude Opus 4.6 컨텍스트 윈도우: 약 20만 토큰 (한국어 기준 한 권 분량의 책 정도)
  • Sonnet 4.6 / Haiku 4.5도 유사하거나 동급 컨텍스트
  • 한국어 토큰 효율: 영어 대비 약 2~3배 토큰 소비 (GPT 계열도 비슷)
  • Cowork 앱은 자체 토큰 게이지 미표시 (체감으로 판단)
  • Free 플랜 사용자는 일일 메시지 한도가 별도 적용 — 토큰 윈도우와는 다른 개념
  • 새 대화창 단축키: Cowork 앱 메뉴 또는 좌측 상단 새 대화 버튼 (앱 버전마다 위치 차이 있음)
  • 플러그인 시스템 활성화로 시스템 토큰 증가 — skills·MCP가 새 대화창마다 자동 로딩되므로 CLAUDE.md 외 시스템 토큰이 추가 소비됨. CLAUDE.md 비대화 + 안 쓰는 skills 정리 필요성 ↑
  • Haiku 4.5 활용 권장 — 단순 분류·요약·짧은 질의응답은 Haiku 4.5로 처리하면 토큰 비용·속도 모두 우위. Cowork도 작업 성격에 맞춰 모델을 자동 선택
  • 장기 세션 컨텍스트 관리 도구 강화consolidate-memory 같은 스킬이 등장해서 CLAUDE.md 자동 정리 가능

undefined

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤