인프라 관측

Playball의 인프라 관측 화면은 클러스터 상태, 노드 자원, Pod 분포, 서비스 메쉬 동작을 한 화면에서 확인하는 기준입니다. 배포 직후 상태 확인과 장애 징후 탐지는 이 화면들을 기준으로 진행합니다.

주요 대시보드

대시보드	주요 지표	목적
EKS 클러스터 개요	Ready 노드, 실행 중 Pod, 네임스페이스 수, 리소스 사용률	클러스터 전체 상태 확인
K8s 운영 현황판	대기 Pod, CrashLoop, 이미지 풀 실패, Node/Pod 목록	운영 징후와 즉시 조치 필요 항목 확인
Kubernetes Pod 모니터링	Pod 상태, 재시작, CPU·메모리, 네트워크 트래픽	워크로드 단위 이상 징후 확인

클러스터 전반의 Pod 수, 네임스페이스 수, 리소스 사용률, 노드 상태를 한 화면에서 확인합니다.

Ready 상태, 대기 중 Pod, CrashLoop, 리소스 사용량, Pod/Node 목록을 기준으로 배포 직후 상태와 장애 징후를 확인합니다.

Pod 상태, 재시작 횟수, CPU·메모리 사용량, 네트워크 트래픽을 기준으로 워크로드 단위 상태를 확인합니다.

노드 단위 CPU·메모리·디스크·네트워크 사용량을 시계열로 확인해 리소스 포화 구간과 특정 노드 쏠림을 판단합니다. Pod 단위 이상 징후가 노드 자원 제약에서 기인한 것인지 구분할 때 함께 사용합니다.

구분	확인 지표	목적
클러스터 상태	Ready 노드, 실행 Pod, 대기 Pod, CrashLoop	자원 부족 또는 배포 이상 확인
노드 상태	CPU, 메모리, 스토리지, 역할별 노드 분포	스케일링 또는 노드 교체 판단
메쉬 상태	요청량, 오류율, 지연시간, TCP 연결	Gateway 이후 트래픽 상태 확인