AI 에이전트 한 명으론 부족하다: 멀티 에이전트 아키텍처 완전 정복

AI 에이전트 한 명으론 부족하다: 멀티 에이전트 아키텍처 완전 정복

혼자서 기획, 디자인, 개발, 테스트, 배포까지 전부 하는 1인 개발자를 상상해보자. 작은 프로젝트는 가능하겠지만, 규모가 커지면 반드시 무너진다. AI 에이전트도 마찬가지다. 이 글에서는 왜 여러 AI가 팀을 이루어야 하는지, 그리고 그 팀을 어떻게 설계하고 운영하는지를 실전 사례와 함께 정리한다.

1. Claude Code 'Agent Teams': 하청이 아니라 협업이다

복잡한 코딩 문제를 AI 하나에게 통째로 맡기면 어떻게 될까? 컨텍스트(문맥)가 길어지면서 앞에서 했던 약속을 잊어버리고, 엉뚱한 방향으로 코드를 짜기 시작한다. 이른바 컨텍스트 부패(Context Rot) 현상이다.

Claude Code v2.1에서 등장한 Agent Teams 기능은 이 문제를 근본적으로 해결한다.

서브에이전트 vs 에이전트 팀

이전에도 '서브에이전트(Subagent)' 라는 개념은 있었다. 하지만 에이전트 팀과는 근본적으로 다르다.

구분 서브에이전트 (Subagent) 에이전트 팀 (Agent Team)
구조 수직적 하청 구조 수평적 협업 구조
비유 사장이 하청에게 일을 시키고 결과물만 받음 팀 리드가 업무를 분배하고, 팀원끼리 직접 소통
컨텍스트 메인 에이전트의 컨텍스트 일부를 공유 각 팀원이 독립된 컨텍스트 윈도우 보유
소통 상→하 단방향 지시 팀원 간 Direct Messaging 가능
적합한 작업 단순 하위 작업 위임 복잡한 병렬 작업, 코드 리뷰, 멀티 관점 분석

서브에이전트가 "이거 해와"라고 시키고 결과만 받는 하청 구조라면, 에이전트 팀은 팀원들이 서로 의견을 교환하며 작업하는 진짜 팀이다.

실시간으로 지켜보기: Tmux 분할 화면

에이전트 팀의 매력적인 점 중 하나는 작업 과정을 눈으로 볼 수 있다는 것이다. Tmux나 iTerm2의 화면 분할(Split Panes) 기능을 사용하면, 여러 AI 팀원이 각자의 터미널 창에서 동시에 코드를 작성하고 검토하는 모습을 실시간으로 관찰할 수 있다.

마치 사무실에서 팀원들의 모니터를 동시에 엿보는 것과 같은 경험이다.

활용 사례: 병렬 코드 리뷰 & 과학적 디버깅

병렬 코드 리뷰:

하나의 Pull Request를 세 명의 AI 팀원에게 동시에 맡긴다.

  • 팀원 A: 보안 관점에서 취약점 검토
  • 팀원 B: 성능 병목 및 최적화 포인트 분석
  • 팀원 C: 테스트 커버리지 확인 및 누락 테스트 작성

세 명이 동시에 작업하므로 순차 리뷰 대비 시간이 1/3로 줄어들고, 팀 리드가 세 관점의 결과를 종합하여 최종 판단을 내린다.

과학적 디버깅 (가설 반박 방식):

버그의 원인을 모를 때, 여러 AI에게 각기 다른 가설을 부여한다.

  1. 팀원 A: "Race condition이 원인이다" → 증거 수집
  2. 팀원 B: "메모리 누수가 원인이다" → 증거 수집
  3. 팀원 C: "API 응답 타이밍 이슈다" → 증거 수집

각 팀원이 증거를 모으고 서로의 가설을 반박하게 하면, 소거법으로 진짜 원인을 훨씬 빠르게 좁힐 수 있다.


2. AI 에이전트 오케스트레이션 5가지 패턴

Microsoft가 정리한 멀티 에이전트 협업의 5가지 조직 구조 패턴이다. 회사의 업무 방식에 비유하면 쉽게 이해할 수 있다.

패턴 1: 순차 (Sequential) — "공장 컨베이어 벨트"

한 에이전트가 작업을 끝내면, 그 결과물을 다음 에이전트가 이어받는다.

[초안 작성 AI] ──→ [코드 리뷰 AI] ──→ [문법 교정 AI] ──→ 최종 결과물
  • 적합한 작업: 각 단계가 명확하게 분리되고, 순서가 중요한 파이프라인
  • 현실 비유: 자동차 조립 라인. 차체 → 도장 → 엔진 장착 → 검수

패턴 2: 동시 (Concurrent) — "각자도생 후 취합"

여러 에이전트가 같은 문제를 동시에 각자의 관점으로 분석하고, 나중에 결과를 하나로 합친다.

           ┌─ [재무제표 분석 AI] ─┐
[주식 종목] ├─ [차트 분석 AI]     ├─→ [종합 리포트]
           └─ [뉴스 감정 분석 AI] ─┘
  • 적합한 작업: 독립적으로 수행 가능한 여러 분석을 빠르게 병렬 처리
  • 현실 비유: 듀 딜리전스(Due Diligence). 법률팀, 재무팀, 기술팀이 동시에 검토 후 합산

패턴 3: 그룹 채팅 (Group Chat) — "원탁 회의"

에이전트들이 하나의 채팅방에 모여 자유롭게 의견을 교환하며 합의를 이끌어낸다.

     ┌──────────────────────┐
     │    💬 Group Chat     │
     │  환경 전문가 AI      │
     │  예산 담당 AI        │
     │  법률 자문 AI        │
     │  시민 대표 AI        │
     └──────────────────────┘
            ↓ 합의 도출
  • 적합한 작업: 정답이 없는 문제, 다양한 이해관계자의 의견 조율이 필요한 기획
  • 현실 비유: 신제품 출시 회의. 마케팅, 개발, 디자인, 법무 부서가 한 자리에 모여 토론

패턴 4: 핸드오프 (Handoff) — "고객센터 돌리기"

작업을 수행하다가 자신의 전문 분야가 아닌 영역을 만나면, 해당 전문가 에이전트에게 권한과 맥락을 함께 넘긴다.

[일반 상담 AI] ──"이건 기술 문제네요"──→ [기술 지원 AI]
                                           │
                           "결제 관련이군요" ──→ [결제 전문 AI]
  • 적합한 작업: 사용자 요청의 종류에 따라 전문 영역이 달라지는 상황
  • 현실 비유: 114 전화 안내. 일반 안내 → 기술 지원 → 청구 담당으로 전환

패턴 5: 자력 (Magnetic) — "애자일 태스크포스"

정해진 워크플로우 없이, 관리자 에이전트가 상황에 따라 동적으로 작업 목록(Ledger)을 만들고 수정하며 전문 에이전트들을 지휘한다.

[관리자 AI] ── 상황 판단 ──→ 동적 작업 목록 생성
     │                           │
     ├─ [에이전트 A] 투입        │ ← 작업 목록 실시간 수정
     ├─ [에이전트 B] 투입        │
     └─ [에이전트 C] 대기 → 투입 │
  • 적합한 작업: 사전에 단계를 예측하기 어려운 복잡한 문제 해결
  • 현실 비유: 스타트업 위기 대응. CEO가 상황을 보며 인력을 유동적으로 배치

5가지 패턴 비교 요약

패턴 핵심 키워드 에이전트 간 관계 적합한 상황
순차 파이프라인 A → B → C (일방향) 단계가 명확한 처리 흐름
동시 병렬 처리 A ∥ B ∥ C → 취합 독립 분석 후 종합
그룹 채팅 자유 토론 A ↔ B ↔ C (다방향) 합의/브레인스토밍
핸드오프 전문가 전환 A → B (조건부) 분야별 전문 처리
자력 동적 지휘 관리자 ↔ 동적 배치 예측 불가능한 복잡 문제

3. 실전 사례: 잡코리아의 불량 공고 탐지 시스템 (FJDS)

이론은 이론이고, 실제로 돈을 벌고 문제를 푸는 데 쓰여야 의미가 있다. 국내 채용 플랫폼 잡코리아(JobKorea) 가 멀티 에이전트로 불법·가짜 채용 공고를 탐지한 실전 사례를 살펴보자.

문제: 단일 AI로는 불가능한 법률 판단

잡코리아에는 매일 수천 건의 채용 공고가 올라온다. 이 중 일부는 불법이다.

  • 캄보디아 취업 사기 공고
  • 최저임금 위반 조건
  • 불법 알선 수수료 요구
  • 도박업 관련 위장 공고

문제는 이런 공고의 합법/불법 여부를 판단하려면 노동법, 직업안정법, 형법 등 수십 개의 법률 조항을 교차 검토해야 한다는 것이다. 단일 AI에게 이 모든 법률을 컨텍스트에 넣으면 윈도우가 터지고, 법 조항 사이의 모순이나 예외를 놓치게 된다.

해결: 중앙 계획 & 분산 실행 (SoM 구조)

잡코리아는 3단계 계층 구조의 멀티 에이전트 시스템을 구축했다.

                    [리드 에이전트]
                   계획 수립 + 최종 판결
                         │
          ┌──────────────┼──────────────┐
          │              │              │
   [최저임금 관리자]  [도박업 관리자]  [알선수수료 관리자]
   조항 단위 분배     조항 단위 분배    조항 단위 분배
     │    │            │    │           │    │
   [W1] [W2]         [W3] [W4]        [W5] [W6]
   팩트체크          팩트체크          팩트체크
계층 역할 비유
리드 에이전트 공고를 훑어보고 검토 분야를 결정, 최종 판결 검찰 총장
관리자 에이전트 담당 법률 내에서 조항별 업무 배분 부서장
작업 에이전트 실제 법 조항을 찾아 합법/불법 팩트 체크 실무 검사

인프라: Celery 기반 분산 처리

수십 개의 에이전트가 동시에 LLM API를 호출하면 병목이 생긴다. 잡코리아는 Python의 Celery를 도입하여 이 문제를 해결했다.

  • 작업 큐(Task Queue): 각 에이전트의 작업을 큐에 넣고 순서대로 처리
  • 병렬 워커(Workers): 여러 워커가 큐에서 작업을 꺼내 동시에 실행
  • 재시도 로직: API 호출 실패 시 자동 재시도 + 예외 처리

이를 통해 수천 건의 공고를 빠르고 정확하게 심사할 수 있었고, 사람이 수동으로 검토할 때보다 속도와 일관성 모두 크게 향상되었다.


4. 멀티 에이전트 시대의 통신 프로토콜

여러 AI 에이전트가 원활하게 소통하려면 공통 언어(프로토콜) 가 필요하다. 현재 웹의 표준인 REST만으로는 한계가 있다.

REST의 치명적 한계: "기억을 못 한다"

REST는 Stateless(무상태) 를 원칙으로 한다. 매 요청이 독립적이어서, 에이전트가 이전 대화의 맥락을 이어가려면 전체 대화 기록을 매번 다시 보내야 한다. 이는 토큰 낭비이자 속도 저하의 원인이다.

RPC/gRPC의 부상

에이전트 간 통신에는 REST보다 RPC(Remote Procedure Call) 가 적합하다.

항목 REST gRPC
데이터 형식 JSON (텍스트) Protobuf (바이너리)
연결 방식 요청마다 새 연결 연결 유지 (Persistent)
스트리밍 제한적 양방향 스트리밍 지원
속도 보통 최대 10배 빠름
적합한 용도 웹 API, 외부 공개 내부 마이크로서비스, 에이전트 통신

gRPC는 데이터를 바이너리로 압축하고, 연결을 유지하며, 양방향 스트리밍을 지원하므로 에이전트 간 실시간 대화에 훨씬 유리하다.

에이전트 세계의 3대 통신 규약

멀티 에이전트 생태계에서 주목해야 할 세 가지 프로토콜이 있다.

MCP (Model Context Protocol) — "AI의 USB-C 포트"

AI가 세상의 다양한 도구(DB, GitHub, 외부 API 등) 와 연결하기 위한 표준 인터페이스다. USB-C 포트 하나로 충전기, 모니터, 외장 하드까지 연결할 수 있듯, MCP 하나로 어떤 도구든 AI에 꽂을 수 있다.

  • 통신 방식: JSON-RPC + SSE (Server-Sent Events)
  • 핵심 역할: 도구 연결, 알림, 상태 확인
  • 비유: AI 세계의 USB-C 허브

A2A (Agent-to-Agent) — "에이전트 간 메신저"

에이전트끼리 서로 대화할 때 쓰는 규약이다. MCP가 중앙 집중형(AI ↔ 도구) 이라면, A2A는 탈중앙화된 에이전트 간 소통에 초점이 맞춰져 있다.

  • 핵심 역할: 에이전트 간 직접 메시지 교환, 작업 위임
  • 비유: 사내 메신저 (Slack). 팀원끼리 직접 DM을 보내며 협업

AG-UI (Agent-User Interaction) — "AI의 리모컨"

AI 에이전트가 최종적으로 사람(사용자)과 어떻게 소통할지를 정의하는 규약이다. 화면, 터미널, 음성 등 다양한 인터페이스를 표준화한다.

  • 핵심 역할: 사용자 인터페이스 표준화, 피드백 루프
  • 비유: TV 리모컨. 어떤 제조사 TV든 동일한 방식으로 조작

3대 프로토콜 관계도

[사용자] ←── AG-UI ──→ [에이전트 A]
                            │
                           A2A
                            │
                       [에이전트 B] ←── MCP ──→ [도구/DB/API]
  • AG-UI: 사람 ↔ AI
  • A2A: AI ↔ AI
  • MCP: AI ↔ 도구

이 세 가지가 맞물려야 멀티 에이전트 시스템이 완전한 생태계로 작동한다.


📝 요약 (치트시트)

주제 핵심 포인트
Agent Teams 서브에이전트(하청)가 아닌 독립 컨텍스트 + DM 기반의 진짜 팀 협업
5가지 패턴 순차(파이프라인), 동시(병렬), 그룹 채팅(토론), 핸드오프(전환), 자력(동적 지휘)
잡코리아 사례 리드 → 관리자 → 작업자 3단계 구조 + Celery 분산 처리로 불법 공고 탐지
통신 프로토콜 MCP(AI↔도구), A2A(AI↔AI), AG-UI(AI↔사람) — REST의 한계를 넘는 새 표준

한 줄 요약: 복잡한 문제는 혼자 풀지 말고 팀을 만들어라. 에이전트의 세계도 인간 조직과 같다 — 올바른 구조, 명확한 역할 분담, 원활한 소통이 성패를 가른다.