- 인프라 기반의 대시보드를 초반엔 주로 사용
- 24년에는 NGINX를 통해서 외부 공격도 모니터링
- Netfunnel 은 만일을 위해 유지
- log 기준의 대시보드 구현으로 높은 자유도를 가지고 사용 중
- 어떤 카드를 사용했는지
- 결제 전 오류 관련 로그도 취합
- 리소스 중심이 아닌 로그 기반의 알림 시스템 구축
- 오프라인 매장의 매출 대시보드
- ESL (전자라벨) 솔루션 대시보드 구현
- 보안 대시보드
- fargate 방식의 EC2, 기본적인 EC2를 사용 중
- 로그 agent 구성은 ECS 기반으로 사내 구성과 동일함
- Cloudwatch 로그는 Lambda를 통해서 전달
- 15일간 데이터도그에서 로그를 보관하고 기간이 지난 중요 log들은 S3에 저장해서 관리 중
- AWS Athena를 통해서 지난 로그를 다시 올려서 데이터 도그에서 재확인도 가능
Tip!
- 모바일 앱을 활용해서 대시보드 확인 및 앱 자체의 알람까지 설정해서 사용하기를 추천
- Notebook 기능을 활용해서 여러 장애분석을 진행하고 현업에서는 매출 변화, 라이브 등 유입량 분석에 활용 중
- 그래프의 스냅샷을 뜨면 기간이 지난 로그라도 데이터가 남게 됩니다 (디테일 확인은 힘듦)
- Monitors
- Slack 알림
- SNS → Lambda → 리소스 증설 (장애에 대한 DB 또는 Application 대응 자동화)
- Cusom Metric
- 장기간 보관 또는 로그비용을 줄이는 방법으로 활용
- Oracle DB 를 쓰는 경우 필요에 따라 CPU를 유용하게 활용하고 있는데 이를 모니터링하기 위해서 사용 중 (기존의 log 방식으로는 확인이 힘들기 때문에)
- 로그를 모두 저장하지 않고 필요한 값만 가져와서 활용
- 서로 다른 뷰를 가진 담당자가 만든 각기 다른 그래프와 화면을 그대로 모으는 것만으로도 새로운 뷰를 가져갈 수 있다