결제 게이트웨이 연동 설정 변경으로 pg-gateway 서비스의 커넥션 풀 크기가
64에서 8로 줄었습니다. 오후 피크 트래픽에서 커넥션이 소진되어 주문 API가 47분간
21%의 502 오류를 반환했습니다. 설정 롤백 및 서비스 재시작으로 복구했으며
데이터 손실은 없습니다.
cfg-gateway-v3가 프로덕션에 자동 배포됨.payment_5xx_rate > 2%.
cfg-gateway-v3 롤백 및 게이트웨이 서비스 재시작.
3분 내 5xx 비율 0.1% 미만으로 감소.
PR #1204는 게이트웨이별 커넥션 풀 크기를 설정 가능하게 만들었습니다.
pg-gateway 키의 기본값은 전역값(64)을 상속받도록 의도했으나,
로컬 테스트 중 8로 하드코딩된 값이 그대로 커밋됐습니다.
설정 린터가 타입만 검사하고 범위는 검사하지 않아 CI를 통과했습니다.
설정 배포와 코드 배포 파이프라인이 분리되어 있어 온콜이 코드 배포를 먼저 롤백하는 데 13분을 소비했습니다.
| 502 오류 요청 수 | ~38,400건 |
|---|---|
| 최고 오류율 | 21.3% |
| 영향 사용자 | 약 1,900개 사업자 |
| 데이터 손실 | 없음 — 클라이언트 재시도 |
| SLA 위반 | 없음 (월간 예산 내) |
| 매출 영향 | 추정 ~480만 원 (재시도 성공 기준) |
max_connections 범위 검사 추가 (경고: < 32)
4월 28일