노트북을 꺼도 계속 일하는 AI 개발자, Claude Code Routines
TL;DR Anthropic이 2024년 말 연구 미리보기로 출시한 Claude Code Routines는 클라우드에서 독립적으로 실행되는 자동화 도구로, 하나의 프롬프트에 스케줄·API·GitHub 이벤트 트리거를 자유롭게 조합해 PR 리뷰, 오류 수정 PR 생성, 이슈 그루밍 등을 24시간 처리한다. Claude 3.5 Sonnet(49.0% SWE-Bench Verified)을 기반으로 하며 Pro 이상 플랜에서만 사용할 수 있다.
- 연구 미리보기 단계로 동작·제한·API가 언제든 바뀔 수 있음
- .claude 디렉토리로 메모리와 지침을 영구 저장
- 인간 검토를 전제로 설계된 human-in-the-loop 구조
2024년 10월 Anthropic이 Computer Use(컴퓨터 제어) 기능을 공개한 지 불과 몇 달 만에, 개발자들이 가장 원하던 기능이 나왔다. 노트북을 닫아도 계속 돌아가는 AI 코딩 에이전트다. 과거 GitHub Copilot이 실시간 자동완성으로 개발자를 도왔다면, 이제 Claude Code Routines는 밤새 이슈를 분류하고, 배포 후 오류를 PR로 만들어주며, SDK 변경사항을 다른 언어로 자동 포팅한다. 이는 AI 코딩 도구가 단순 보조에서 ‘항상 켜져 있는 팀원’으로 진화하는 결정적 순간이다.
하나의 루틴으로 다섯 가지 반복 업무를 동시에 해결하는 구조
루틴의 핵심은 저장된 프롬프트, 연결된 저장소, 그리고 트리거 조합이다. Anthropic 공식 문서에 따르면 한 루틴에 스케줄(매일 밤 9시), API(모니터링 시스템 호출), GitHub 이벤트(PR 생성 시)를 동시에 붙일 수 있다. [1] 예를 들어 ‘매주 밤 새로 열린 이슈를 읽고 코드 영역에 따라 담당자를 지정하고 Slack에 요약을 올리는’ 루틴을 만들면, 아침에 팀은 이미 정리된 백로그를 보게 된다. 또 다른 루틴은 프로덕션 오류 발생 시 API를 통해 호출되어 스택 트레이스를 최근 커밋과 대조한 뒤 수정안을 담은 Draft PR을 자동 생성한다. [2] 2024년 10월 기준 Claude 3.5 Sonnet이 SWE-Bench Verified에서 49.0%를 기록한 성능이 이 모든 작업의 기반이다. 모든 실행은 Anthropic 클라우드에서 이뤄지기 때문에 개발자 노트북이 꺼져 있어도 상관없다.
GitHub Actions와 비교하면 드러나는 결정적 트레이드오프
기존 GitHub Actions는 규칙 기반으로 동작하지만 Claude Routines는 자연어로 ‘우리 팀의 보안·성능·스타일 체크리스트를 모두 적용해줘’라고 지시할 수 있다. 이는 규칙으로는 표현하기 어려운 맥락적 판단을 가능하게 한다. 다만 이는 양날의 검이다. LLM의 비결정적 특성 때문에 같은 PR에 대해 하루는 다르게 코멘트할 수 있고, Simon Willison을 비롯한 실무자들은 hallucinated fix(환각 수정)에 대한 우려를 꾸준히 제기한다. [3] 이에 Anthropic은 모든 예시에서 ‘on-call 엔지니어가 PR을 최종 검토한다’는 human-in-the-loop 구조를 강조한다. .claude 디렉토리를 활용해 이전 실행의 기억을 유지하는 점은 LangGraph나 CrewAI 같은 자체 구축 에이전트와 비교해도 차별점이다. 결국 개발자는 ‘완전 자동화’가 아니라 ‘강력한 보조 에이전트’를 얻는 셈이다.
기업이 실제 도입할 때 마주하는 보안과 비용의 현실
이미 일부 Series B·C 스타트업은 온콜 로테이션 일부와 PR triage를 Routines로 대체했다고 공개적으로 밝혔지만, 보안 팀의 반응은 엇갈린다. Claude GitHub App을 설치하고 repository push 권한을 주면 Anthropic이 아닌 ‘나’의 계정으로 커밋과 PR이 생성되기 때문이다. 연구 미리보기라는 점도 부담이다. 정확한 토큰 제한과 비용 구조가 공개되지 않았고, 대형 모노레포에서는 200k 컨텍스트 창조차 실질적 한계로 작용한다. [4] 따라서 도입할 때는 가장 먼저 ‘이 루틴이 실수했을 때 피해 범위’를 명확히 그려야 한다. unrestricted branch push를 허용할지, 특정 환경 변수만 노출할지, 어느 커넥터(Slack, Linear)만 연결할지 하나씩 제한하는 것이 필수적이다.
Claude Code Routines가 더 성숙해진다면 개발자의 하루는 반복적인 검토 작업에서 벗어나 설계와 전략에 집중할 수 있을까. 아니면 새로운 형태의 ‘AI 감독 업무’가 생겨나는 걸까. 결국 중요한 것은 기술이 아니라, 우리가 AI에게 어디까지 맡기고 어디까지 직접 확인할 것인지에 대한 명확한 기준이다.
참고문헌
[1] Automate work with routines - https://code.claude.com/docs/en/routines
[2] Claude 3.5 Sonnet (new) SWE-Bench Announcement - https://www.anthropic.com/news/claude-3-5-sonnet
[3] Simon Willison on AI Coding Agents - https://simonwillison.net/
[4] Anthropic Claude Code Documentation - https://claude.ai/code