등록 후 테스트와 모니터링
Gemini Enterprise에 등록한 에이전트를 검증하고, Trace/로그/품질을 지속 관리하는 방법
에이전트 등록이 끝났다고 운영이 시작된 것은 아닙니다. 테스트, 모니터링, 평가, 회귀 방지까지 묶어서 운영 단계에 진입해야 합니다.
목차
- 등록 직후 스모크 테스트
- Trace로 호출 흐름 확인
- 세션과 메모리 점검
- 품질 평가 루프
- 운영 모니터링 지표
- 점진적 롤아웃 전략
1. 등록 직후 스모크 테스트
| 케이스 |
기대 결과 |
| 일반 질의 |
정상 응답 + 출처 표시 |
| 권한 없는 자료 질의 |
응답에 포함되지 않음 |
| 도구가 외부 API를 호출하는 질의 |
OAuth 동의 화면 → 정상 결과 |
| 의도적으로 모호한 질의 |
명료화 질문(follow-up) |
| 정책 위반 입력 |
안전장치(거부/경고) 동작 |
샘플 시나리오를 체크리스트 문서로 만들어 등록자/리뷰어가 함께 확인합니다.
2. Trace로 호출 흐름 확인
Agent Engine은 호출별로 Trace를 자동 수집합니다.
확인 위치
Vertex AI 콘솔 → Agent Engine → 대상 Reasoning Engine → Traces
Trace에서 보는 항목
| 항목 |
의미 |
| 모델 호출 횟수 |
비용/지연의 주요 원인 |
| Tool 호출 시퀀스 |
잘못된 Tool 선택, 무한 루프 감지 |
| 토큰 사용량 |
컨텍스트 길이 초과 여부 |
| 오류 스택 |
도구 자체의 실패 |
자주 발견되는 문제
- Tool 선택 실수: 비슷한 이름의 Tool이 여러 개 → 설명(description) 문구 정리
- 컨텍스트 폭발: 검색 결과를 그대로 프롬프트에 주입 → 요약/가지치기
- Authorization 오류: 사용자가 동의하지 않은 Scope 호출 → 등록 시 Scope 일치 확인
3. 세션과 메모리 점검
Session
- 사용자 단위 대화 컨텍스트가 보존됩니다.
- 너무 긴 세션은 응답 품질을 떨어뜨릴 수 있어 세션 만료 정책을 검토합니다.
Memory Bank
- 사용자 선호·장기 정보를 저장하는 영역(에이전트가 활용 시)
- 민감 정보가 메모리에 쌓이지 않도록 TTL/Allowlist 정책을 설정합니다.
4. 품질 평가 루프
[Evalset 작성] → [에이전트 추론 실행] → [LLM-as-judge 평가]
↑ ↓
└────────── 회귀 발견 시 데이터셋 보강 ──┘
평가 지표 예시
| 지표 |
설명 |
| Response Quality |
답변의 정확성·유용성 |
| Tool Trajectory |
적절한 Tool을 적절한 순서로 호출했는가 |
| Hallucination |
출처 없는 사실 진술 비율 |
| Safety |
정책 위반 응답 비율 |
평가 도구
- Vertex AI Evaluation (Gen AI Evaluation Service)
- ADK 자체 evalset (
agents-cli eval)
- 자체 LLM-as-judge 스크립트
5. 운영 모니터링 지표
| 카테고리 |
지표 |
임계치 예시 |
| 사용량 |
DAU, MAU, 세션 수 |
주간 추이 |
| 비용 |
모델 토큰, 검색 쿼리 수 |
월 예산 80% 알람 |
| 지연 |
p50 / p95 응답 시간 |
p95 < 6s |
| 품질 |
부정 피드백 비율 |
< 5% |
| 오류 |
Tool 실패율 |
< 1% |
| 보안 |
정책 위반 요청 차단 수 |
일일 리포트 |
대시보드 구성 예시
- Cloud Logging 기반 BigQuery sink → Looker Studio
- Cloud Trace → 지연 분석
- Vertex AI Evaluation 결과 → 품질 추이
6. 점진적 롤아웃 전략
| 단계 |
대상 |
기간(예시) |
| 1. 내부 알파 |
개발팀 5~10명 |
1주 |
| 2. 부서 베타 |
1~2개 부서 |
2~4주 |
| 3. 전사 GA |
라이선스 보유 전체 |
이후 상시 |
단계 전환 기준
- 부정 피드백 비율 < 5%
- p95 지연 < 임계치
- 보안/감사팀 사인오프
- 관리자용 운영 런북 작성 완료
7. 사고 대응 체크리스트
8. 참고 자료