
📋 오늘의 3줄 요약
- Google DeepMind가 여러 AI 에이전트가 함께 움직일 때의 안전 문제에 최대 1,000만 달러를 지원해요.
- 이제 평가는 모델 하나가 답을 잘하는지보다, 에이전트 무리가 서로 부딪힐 때 안정적인지가 중요해졌어요.
- 이번 주에는 제품 안의 에이전트가 외부 도구·다른 에이전트·결제 흐름과 만나는 지점을 먼저 적어보세요.
안녕하세요, 오늘은 “좋은 에이전트 하나”를 넘어 “에이전트끼리 연결된 시스템”을 어떻게 다뤄야 하는지 이야기해볼게요.
📌 오늘의 딥다이브 — Google DeepMind가 다중 에이전트 안전 연구에 돈을 거는 이유
무슨 일이 있었나
Google DeepMind가 Schmidt Sciences, Cooperative AI Foundation, ARIA, Google.org와 함께 다중 에이전트 안전 연구에 최대 1,000만 달러를 지원하는 공모를 열었어요. 여기서 다중 에이전트는 여러 AI 에이전트가 같은 디지털 환경에서 서로 말하고, 협상하고, 거래하는 상황을 뜻해요. DeepMind는 앞으로 서로 다른 조직이 만든 수백만 개의 에이전트가 함께 움직일 수 있다고 봅니다. 그래서 모델 하나의 안전성만 볼 게 아니라, 에이전트 집단이 어떤 행동을 만들어내는지 연구하겠다는 거예요. 신청 마감은 2026년 8월 8일이고, 선정자는 2026년 가을 발표될 예정입니다. 출처
왜 지금인가
이 흐름이 갑자기 나온 건 아니에요. 요즘 에이전트 제품은 이미 단일 챗봇을 넘어섰잖아요. 코드를 고치고, 브라우저를 열고, 문서를 읽고, 다른 서비스 API를 호출합니다. OpenAI도 Ona를 인수해 Codex에 안전하고 지속적인 클라우드 환경을 더하려 한다고 밝혔어요. 긴 시간 돌아가는 기업 업무용 에이전트를 염두에 둔 움직임입니다. 출처
Vercel도 비슷한 방향을 보여줬어요. AI SDK 7의 `HarnessAgent`는 Claude Code, Codex, Pi 같은 에이전트 하네스(모델 위에서 도구·샌드박스·세션·권한을 관리하는 실행 껍데기)를 하나의 API로 다루게 합니다. 모델 교체처럼 에이전트 실행 환경도 교체하는 쪽으로 가는 거죠. 출처
디테일
DeepMind가 제시한 연구 우선순위는 네 가지예요. 첫째, 샌드박스와 테스트베드입니다. 가상 시장, 시뮬레이션 생태계, 여러 조직이 함께 쓰는 업무 흐름처럼 재현 가능한 실험장을 만들자는 뜻이에요. 둘째, 에이전트 네트워크의 과학입니다. 에이전트 집단에서 갑자기 생기는 능력, 실패, 변동성을 측정하자는 겁니다. 셋째, 에이전트 인프라 강화예요. 신원, 평판, 약속 같은 프로토콜이 플랫폼을 넘어 안전하게 작동하는지 스트레스 테스트해야 합니다. 넷째, 감독과 통제입니다. 이미 배포된 에이전트 집단을 어떻게 감시하고, 피해가 커지기 전에 막을지 보는 영역이에요. 출처
여기서 중요한 표현은 “보이지 않는 안전 위험”이에요. 에이전트 하나는 정상이어도, 서로 연결되면 다른 일이 생깁니다. 예를 들어 구매 에이전트 여러 개가 같은 재고를 두고 경쟁하면 가격이 출렁일 수 있어요. 고객 지원 에이전트와 환불 에이전트가 서로 다른 정책을 참고하면 이상한 결정을 반복할 수도 있고요. DeepMind가 걱정하는 건 바로 이런 집단 수준의 행동입니다.
왜 중요한가
한국 빌더 입장에서는 꽤 현실적인 문제예요. 아직 우리 제품이 “수백만 에이전트 네트워크”까지 가진 건 아니어도, 작은 버전은 이미 있습니다. 고객의 메일을 읽는 에이전트, CRM을 수정하는 에이전트, 결제 상태를 확인하는 에이전트, 사내 문서에 답하는 에이전트가 따로 붙기 시작했거든요.
이때 안전장치를 프롬프트 한 줄로 끝내면 약합니다. 마침 arXiv에 올라온 WebDecept 연구도 비슷한 경고를 해요. 전자상거래 환경에 광고, 도메인 리디렉션, 쇼핑 조작 같은 속임수 인터페이스를 넣어 여러 웹 에이전트를 평가했더니, 현재 에이전트들이 여러 유형의 기만적 UI에 취약했고 프롬프트 제약만으로는 충분하지 않았다고 합니다. 출처
정리하면, 에이전트 안전은 “나쁜 답변을 줄이자”에서 “나쁜 상호작용을 줄이자”로 넘어가고 있어요. 제품 설계의 단위가 모델이 아니라 흐름이 됐다.
다음 전개
앞으로 볼 포인트는 세 가지예요. 첫째, 에이전트 신원과 권한 표준입니다. 어떤 에이전트가 누구를 대신해 어떤 권한으로 행동하는지 증명해야 하거든요. 둘째, 장시간 실행 환경입니다. Vercel Functions도 Pro와 Enterprise에서 Node.js·Python 런타임 실행 시간을 최대 30분까지 늘렸고, 긴 LLM 추론과 도구 호출을 사용 사례로 들었습니다. 출처
셋째, 평가 방식입니다. 앞으로는 “이 에이전트가 태스크 하나를 성공했나”보다 “다른 에이전트와 함께 있을 때 정책을 지키나”를 봐야 해요. 이건 귀찮은 일이지만, 기업 고객에게 팔 제품이라면 피하기 어렵습니다. 보안 검토표에 곧 “에이전트 간 상호작용 테스트 결과”가 들어갈 가능성이 커요.
⚡ 빠른 소식
- OpenAI가 파트너 네트워크를 공개했어요 — 전 세계 파트너와 기업 AI 도입·배포·전환을 가속하기 위해 1억 5,000만 달러를 투자한다고 밝혔습니다. 출처
- OpenAI Academy에 업무용 AI 과정 3개가 추가됐어요 — 반복 가능한 워크플로와 일상 업무 속 에이전트 활용을 가르치는 과정입니다. 출처
- Vercel AI Gateway에 Kimi K2.7 Code가 들어왔어요 — 긴 프로그래밍 작업, 프론트엔드, DevOps, 성능 최적화를 겨냥한 코딩 모델이고 이미지 입력도 지원합니다. 출처
- Claude Fable 5의 Vercel AI Gateway 접근이 중단됐어요 — 미국 정부 지침 준수에 따른 조치이며, 복구 시점은 알려지지 않았습니다. 출처
- AI타임스가 첨단 모델 접근권 논쟁을 짚었어요 — 최신 모델 접근 제한이 소버린 AI와 오픈소스 논의를 다시 키우고 있다는 내용입니다. 출처
- 데이터브릭스가 에이전트 통합 플랫폼 Omnigent를 공개했어요 — Claude Code와 Codex 같은 여러 에이전트 도구를 상위 계층에서 조합·통제하는 오픈소스 플랫폼입니다. 출처
🇰🇷 빌더 포인트 — 그래서 오늘 뭘 해야 하나
- 이번 주에 제품 안의 에이전트 지도를 그려보세요. “읽기”, “쓰기”, “결제”, “외부 웹”, “다른 에이전트 호출”을 나눠 표시하면 됩니다. 쓰기 권한과 결제 권한이 있는 경로는 빨간색으로 따로 관리하세요.
- 프롬프트 규칙만 믿지 말고 테스트베드를 만드세요. 실제 고객 질문 30개보다 한 단계 더 가야 합니다. 잘못된 버튼, 리디렉션된 도메인, 할인 문구, 중복 결제 같은 속임수 화면을 넣고 에이전트가 멈추는지 확인하세요.
- 장시간 실행 에이전트에는 예산과 중단 조건을 넣으세요. 30분 실행이 가능해지는 건 좋지만, 비용과 권한도 30분 동안 열려 있다는 뜻이에요. 토큰 한도, 도구 호출 횟수, 외부 요청 도메인, 승인 대기 조건을 코드로 고정하세요.
오늘의 한 줄: 에이전트 제품의 품질은 답변보다 상호작용에서 드러난다.
—
Korean AI Builder Brief · 매일 아침 한국 AI 빌더에게
매일 아침 이런 브리프를 받아보세요
한국 AI 빌더를 위한 일간 브리핑. 무료, 월~금 발행.