목차 열기
Grafana 운영 체계
Playball은 메트릭, 로그, 트레이스를 Grafana 기준으로 연결해 확인합니다. 운영 목적에 따라 화면을 분리해 사용하고, 동일한 로그인 체계 안에서 조회 권한과 관리 권한을 구분합니다.
대시보드 구성 기준
| 구분 | 주요 화면 | 목적 |
|---|---|---|
| 인프라 관측 | EKS 클러스터 개요, K8s 운영 현황판 | 클러스터 상태와 자원 사용량 확인 |
| 서비스 관측 | 애플리케이션 모니터링, RDS PostgreSQL, Kafka, Loki, Tempo | 서비스 상태와 병목 구간 확인 |
| 보안 관측 | CloudTrail 감사 로그, AI 텔레메트리 및 봇 탐지, ClickHouse Monitoring | 보안 이벤트와 방어 동작 확인 |
| 부하 테스트 관측 | k6 Combined, Nodes, Webs Resources, Diagnostics, Logs, Istio Routing | Staging 부하 테스트 구간 검증 |
접근 권한 기준
| 항목 | 기준 |
|---|---|
| 로그인 방식 | Google OAuth 기반 로그인만 허용 |
| 기본 권한 | 로그인 사용자는 기본 Editor 권한으로 접근 |
| 운영 관리 권한 | 지정 계정은 Admin 권한으로 폴더와 대시보드 관리 |
| 권한 분리 목적 | 조회는 넓게 열고, 수정과 폴더 관리는 제한 |
| 폴더 구조 | 운영 목적에 따라 인프라, 서비스, 보안, AI, 알림 화면을 분리 |
팀별 권한 구성
Grafana는 운영 목적별 폴더 구성과 함께 팀 단위 접근 권한을 나눠 사용합니다. 조회 권한은 넓게 열고, 관리 대상 화면은 필요한 팀만 수정할 수 있도록 분리합니다.

| 구분 | 기준 |
|---|---|
| 팀 구성 | AI, DEV, INFR, MAN, SECU 기준으로 대시보드 접근 범위 분리 |
| 기본 권한 | 로그인 사용자는 기본 Editor 권한으로 조회 가능 |
| 관리 권한 | 지정 계정은 Admin 권한으로 폴더와 대시보드 관리 |
| 운영 목적 | 필요한 화면만 빠르게 접근하고, 수정 권한은 제한 |
운영 기준
| 구분 | 확인 경로 | 목적 |
|---|---|---|
| 인프라 상태 확인 | 인프라 관측 | Node, Pod, 리소스 사용량, 메쉬 상태 확인 |
| 서비스 상태 확인 | 서비스 관측 | 응답 시간, 오류율, 로그, Trace, 데이터베이스 상태 확인 |
| 보안 이벤트 확인 | 보안 관측 | 감사 이벤트, 봇 탐지, 보안 이벤트 추적 |
| 부하 테스트 확인 | 부하 테스트 관측 | 테스트 구간별 병목과 확장 동작 확인 |