Playball Logo

Command Palette

Search for a command to run...

목차 열기

운영 보완 및 트러블슈팅

성능 테스트·장애 대응 과정에서 발견한 병목과 해결 이력 모음집입니다. 각 항목을 클릭하면 상세 페이지로 이동합니다.


📋 트러블슈팅 인덱스

제목분류환경
ArgoCD·Grafana 접속 복구접근 경로·복구Prod EKS
Policy Reporter UI 복구보안 관측·접근Staging EKS
Auth-Guard 500 복구인증·데이터베이스Staging EKS
Chrome QUIC / HTTP3 — Cloudflare Proxy 전환네트워크Dev (On-Prem)
[Spot 안정성 작업 스토리] Staging Spot 다양화 — Karpenter NodePool 분산비용·가용성Staging EKS
[Spot 안정성 작업 스토리] Thanos·S3 기반 장기 저장 — PVC(EBS)에서 S3로 전환스토리지 아키텍처Staging EKS

트러블슈팅 작성 포맷

새 이슈 추가 시 operational-troubleshooting/{slug}.md 파일로 생성하고, 다음 항목을 포함:

  1. 증상 — 언제, 어떤 현상이 발생했는지
  2. 원인 — 근본 원인 분석
  3. 해결 — 적용한 조치와 근거
  4. 관측 결과 — 조치 후 정량 지표 (해당 시)
  5. 향후 모니터링 — 재발 감지·추가 조치 트리거
  6. 참조 — 관련 커밋·문서·내부 메모