CRM 애플리케이션과 EC2 장애 시 영향
2025. 3. 22. 10:32ㆍaws.cloud
반응형
1. 장애가 발생하면 어떤 일이 일어나는가?
- 여러 가용 영역에 분산된 EC2 인스턴스 중 하나에서 장애가 발생하면, 해당 인스턴스는 더 이상 요청을 처리할 수 없다.
- 하지만, Application Load Balancer(ALB) 가 자동으로 해당 인스턴스를 대상 그룹(Target Group)에서 제외하고, 정상적으로 동작하는 다른 인스턴스로 트래픽을 분배한다.
- 결과적으로 사용자는 서비스 중단 없이 애플리케이션을 계속 사용할 수 있다.
2. 장애 감지와 복구 프로세스
✅ Application Load Balancer(ALB)의 상태 확인(Health Check)
- ALB는 일정 간격으로 Health Check(상태 점검) 을 실행하여 EC2 인스턴스의 정상 여부를 판별한다.
- 특정 임계값(예: 연속 3번 응답 실패)을 초과하면, 해당 인스턴스를 비정상으로 판단하고 트래픽을 전달하지 않는다.
✅ Auto Scaling을 통한 복구 (선택 사항)
- Auto Scaling이 설정되어 있다면, 장애가 발생한 인스턴스를 자동으로 종료하고 새로운 인스턴스를 생성하여 가용성을 유지할 수 있다.
- 최소 인스턴스 개수를 3개로 설정한 경우, 하나가 장애를 일으키면 새로운 EC2 인스턴스가 자동으로 추가된다.
✅ CloudWatch 알람을 활용한 장애 감지
- Amazon CloudWatch는 EC2 인스턴스의 상태를 모니터링하며, 장애가 감지되면 관리자에게 알림을 보낼 수 있다.
- 이를 통해 운영팀이 장애 상황을 신속하게 파악하고 추가적인 조치를 취할 수 있다.
3. 가용성을 높이기 위한 추가적인 고려 사항
- 멀티 AZ 배포: 모든 인스턴스를 하나의 가용 영역(AZ)에 배치하면 해당 AZ가 장애를 겪을 경우 서비스가 중단될 수 있다. 따라서 다중 가용 영역에 인스턴스를 배포하는 것이 중요하다.
- Auto Scaling과 Load Balancer 연동: Auto Scaling 그룹을 설정하여 EC2 인스턴스를 자동으로 추가 및 제거하면, 트래픽 증가 및 장애 상황에서도 안정적인 운영이 가능한다.
- RDS의 Multi-AZ 배포(데이터베이스 고려): CRM 애플리케이션이 데이터베이스를 사용한다면, Amazon RDS의 Multi-AZ 배포를 설정하여 데이터베이스 장애에도 대비해야 한다.
반응형
'aws.cloud' 카테고리의 다른 글
비동기 처리 수행에서 폴링 요청의 빈 응답(null response)을 최소화 (0) | 2025.03.22 |
---|---|
Express.js | Single Page Application (SPA) (1) | 2024.10.20 |
HTTP 서버를 만드는 코드 (0) | 2024.09.05 |
클라우드 컴퓨팅의 5계층 모델 (0) | 2024.07.29 |
클라우드 컴퓨팅의 구성 요소 (0) | 2024.07.29 |