반응형
AWS의 재해 복구
재해 복구
- 재해란 회사의 사업 지속이나 재정에 부정적인 영향을 미치는 일을 뜻함
- 재해 복구(Disaster recovery, DR)는 재해에 대비하고 재해 발생 시 복구하는 작업을 의미
- 재해 복구 유형
- 온프레미스 → 온프레미스 - 전형적인 재해 복구 유형, 비용이 많이 듦
- 온프레미스 → 클라우드 - 하이브리드 복구
- AWS Cloud 리전 A → AWS Cloub 리전 B
- 복구 시점 목표를 의미하는 RPO (Recovery Point Objective)
- 복구 시간 목표를 의미하는 RTO (Recovery Time Objective)
RPO & RTO
- 복구 시점 목표, RPO
- RPO는 얼마나 자주 백업을 실행할지, 시간상 어느 정도 과거로 되돌릴 수 있는지를 결정
- 재해가 발생하면 RPO와 재해 발생 시점 사이에 데이터 손실이 발생하는데 재해 발생 시점 이전으로 복구
- RPO는 1시간, 1분 등 원하는 대로 설정 가능
- 재해 발생 시 데이터 손실을 얼마만큼 감수할지 설정
- 복구 시간 목표, RTO
- 재해 발생 후 복구할 때 사용됨
- 재해 발생 시점과 RTO의 시간 차는 애플리케이션의 다운 타임
- RPO와 RTO 최적화는 솔루션 아키텍처를 결정하는 요인이 되고, 시간 간격이 짧을수록 비용은 높아짐
재해 복구 전략
- Backup & Restore는 아주 쉽고 비용이 저렴하지만 RPO와 RTO가 높음
- Pilot Light
- 애플리케이션 축소 버전이 클라우드에서 항상 실행되고 보통 크리티컬 코어가 되는데 이를 Pilot Light라고 함
- Backup & Restore와 아주 유사
- 크리티컬 시스템이 한창 작동하고 있기 때문에 복구할 때 여타 시스템만 더해주면 되기 때문에 속도가 더 빠름
- 크리티컬 코어 보조에 사용함
- Warm Stanby
- 시스템 전체를 실행하되 최소한의 규모로 가동해서 대기하는 방법
- 재해 발생 시 프로덕션 로드로 확장 가능
- Multi Site / Hot Site Approach
- 몇 분, 몇 초 정도로 RTO가 낮지만 비용이 굉장히 비쌈
- AWS와 온프레미스에서 완전 프로덕션 스케일을 얻을 수 있음
- 온프레미스 데이터 센터에서 완전 프로덕션 스케일과 데이터 복제를 진행하는 동시에
AWS 데이터 센터에 완전 프로덕션 스케일이 가능 - 이미 실행 중인 핫 사이트가 있기 때문에 Route 53이 기업 데이터 센터와 AWS Cloud에 요청을
라우팅 할 수 있는데 액티브 - 액티브 유형 설정이라고 함
- All AWS Multi Region
재해 복구 Tip
- 백업, Backup
- EBS 스냅샷, RDS로 자동화된 스냅샷과 백업 등을 사용
- S3, S3 IA, Glacier 등에 스냅샷을 수명 주기 정책을 통해 규칙적으로 푸시할 수 있고 리전 간 복제 가능
- 온프레미스에서 클라우드로 데이터 공유 시 Snowball과 Storage Gateway가 유용
- 고가용성, High Availability
- Route 53을 사용해 DNS를 다른 리전으로 옮겨서 고가용성 확보
- RDS 다중 AZ, ElastiCache 다중 AZ, EFS, S3 등 다중 AZ 기능
- 기업 데이터 센터에서 AWS로 연결할 때 Direct Connect와 Site-to-Site VPN으로 네트워크 고가용성 확보
- 복제, Replication
- RDS 리전 간 복제, Aurora + 글로벌 데이터베이스로 복제 가능
- 온프레미스 데이터베이스를 RDS로 복제할 때 데이터베이스 복제 소프트웨어 쓸 수 있음
- Storage Gateway
- 자동화, Automation
- CloudFormation과 Elastic Beanstalk가 클라우드에 새로운 환경을 빠르게 재생산하도록 지원
- CloudWatch를 사용하면 CloudWatch Alarm이 실패했을 때 EC2 인스턴스를 복구하거나 재시작
- AWS Lambda는 사용자 맞춤 자동화에 유용
- 카오스, Chaos
- 재해를 만들어서 대처해 보는 방법
- 자주 인용되는 사례로는 넷플릭스인데,
모든 걸 AWS에서 실행하고 Simian Army를 만들어 EC2 인스턴스 무작위 종료하여
장애가 발생해도 인프라가 무사하도록 카오스 몽키를 실행해 무작위로 종료하는 것
AWS DMS - Database Migration Service
- 온프레미스 시스템에서 AWS 클라우드로 데이터베이스를 이주(Migration) 하고 싶을 때 사용
- 빠르고 안전한 데이터베이스 서비스로 복원성이 좋고 자가 복구가 된다는 장점이 있음
- 마이그레이션을 하는 과정에서 소스 데이터베이스도 여전히 사용 가능
- 동종 마이그레이션 등 다양한 유형의 엔진을 지원하고 Oracle 또는 PostgreSQL 간에도 지원
- 이종 마이그레이션은 MS SQL 서버를 Aurora로 마이그레이션 할 때 CDC를 사용한 지속적 데이터 복제 지원
- CDC는 변경 데이터 캡처를 의미
- DMS를 사용하려면 EC2 인스턴스를 생성해서 복제를 처리하도록 해야 함
DMS 소스와 대상
- 소스, Sources
- 온프레미스와 EC2 데이터베이스 인스턴스 - Oracle, MySQL, MariaDB, PostgreSQL, MongoDB, DB2 등
- Azure - Azure SQL 데이터베이스
- Amazon RDS - 오로라를 포함한 모든 데이터베이스
- Amazon S3
- 대상, Targets
- 온프레미스와 EC2 데이터베이스 인스턴스 - Oracle, MS SQL Server, MariaDB, PostgreSQL, SAP 등
- Amazon RDS, Amazon Redshift, Amazon DynamoDB, Amazon S3, ElastiSearch Service 등
- 온프레미스에서 대상으로 하는 소스를 변환할 수 있고 이 대상은 보통 AWS에 해당되는데 주로 데이터베이스
- 해당 Document의 소스, 대상 참고
AWS Schema Conversion Tool (SCT)
- 소스 데이터베이스와 대상 데이터베이스가 같은 엔진을 갖고 있지 않을 때 사용
- 데이터베이스의 스키마를 다른 엔진으로 변환
- OLTP를 사용한다면 SQL 서버나 Oracle을 MySQL, PostgreSQL, Aurora로 변환 가능
- OLAP를 사용한다면 Teradata나 Oracle 등의 분석적 과정에서 Amazon Redshift로 변환 가능
- 핵심은 소스 데이터베이스가 대상 데이터베이스와 다른 엔진을 쓴다는 것
- 같은 엔진을 쓰는 데이터베이스의 마이그레이션에는 SCT 필요 없음
On-Premise strategy with AWS
- Amazon Linux 2 AMI를 가상 머신으로 다운로드할 수 있음
- iso 형식으로 이 이미지를 흔한 VM을 생성하는 소프트웨어로 로드할 수 있음
- Oracle VM, VMWare, VirtualBox, KVM, Microsoft Hyper-V 등
- 직접 VM을 통해 온프레미스 인프라에서 Amazon Linux 2를 실행할 수 있음
- VM Import / Export
- VM 가져오기와 내보내기 기능이 있는데 기존의 VM과 애플리케이션을 EC2로 마이그레이션 가능
- 재해 복구 리포지토리 전략 생성 가능
- 해당 기능을 통해 VM을 EC2에서 온프레미스 환경으로 다시 보낼 수 있음
- AWS Application Discovery Service
- 온프레미스의 정보를 모아주고 마이그레이션을 계획할 수 있게 해주는 서비스
- 서버 사용량 정보와 종속성 맵핑에 대한 정보를 제공
- 온프레미스에서 클라우드로 대량의 마이그레이션 시 유용
- AWS Migration Hub를 사용해서 모든 마이그레이션을 추적할 수 있음
- AWS Database Migration Service (DMS)
- 온프레미스에서 AWS, AWS에서 AWS, AWS에서 온프레미스로 복제를 허용
- 다양한 데이터베이스들과 함께 작동해서 사용하기 편리
- AWS Server Migration Service (SMS)
- 온프레미스의 라이브 서버들을 AWS로 증분 복제할 때 사용
- AWS로 볼륨을 직접 복제 가능
- 지속적인 복제 유형에 적용되는 증분 복제
AWS Backup
- 완전 관리형 서비스
- AWS 서비스 간의 백업을 중점적으로 관리하고 자동화할 수 있게 지원
- 실제 중앙 시스템이 없고 사용자 지정 스크립트 메뉴나 매뉴얼을 만들 필요 없음
- 다양한 서비스 지원
- 리전 간 백업을 지원, 한 곳의 재해 복구 전략을 다른 리전에 푸시 가능
- 계정 간 백업 지원, AWS에서 여러 계정을 사용할 경우 유용
- Aurora와 같은 지정 시간 복구(PITR)를 지원
- 온디맨드와 함께 예약된 백업 지원
- 태그 기반 정책이 있어서 특정 태그가 지정된 리소스만 백업 가능
- 백업 정책에서 백업 플랜 생성 가능
- 백업의 빈도를 정의 (매 12시간, 매일, 매주, 매달, cron 표현식으로 정함)
- 백업을 콜드 스토리지로 이전할지 여부 결정 (보내지 않거나 일정 기간 후에 보내거나)
- 백업 보유 기간 설정
AWS Backup Vault Lock
- WORM (Write Once Read Many) 정책을 시행하면 백업 볼트에 저장한 백업을 삭제할 수 없음
- 볼트 잠금 정책 덕분에 백업을 삭제할 수 없으며 백업에 대한 추가 방어막을 제공
- 의도치 않거나 악의적인 삭제 작업을 막고 백업 유지 기간 축소 또는 변경 작업을 방지
- 백업의 안정성을 강력하게 보장하는 기능
AWS ADS
- AWS Application Discovery Service
- 온프레미스의 정보를 모아주고 마이그레이션을 계획할 수 있게 해주는 서비스
- 서버를 스캔하고 마이그레이션에 중요한 서버 설치 데이터 및 종속성 맵핑에 대한 정보를 수집
- Agentless Discovery
- AWS Agentless Discovery Connector를 사용하는 방법
- 가상 머신, 구성, CPU와 메모리 및 디스크 사용량과 같은 성능 기록에 대한 정보를 제공
- Agent-based Discovery
- AWS Application Discovery Agent를 사용하는 방법
- 시스템 구성, 성능, 실행 중인 프로세스, 시스템 사이의 네트워크 연결에 대한 세부 정보를 얻을 수 있음
- 종속성 맵핑에 대한 정보를 얻을 때 유용
- 모든 결과 데이터를 AWS Migration Hub 서비스에서 확인 가능
- AWS ADS는 이동해야 할 항목과 이 항목들이 내부적으로 어떻게 상호 연결되어 있는지 파악하기에 유용
AWS MGN
- AWS Application Migration Service
- MGN을 사용하여 리호스팅이 가능
- Lift-and-Shift 솔루션이라고도 함
- 물리적, 가상 또는 클라우드에 있는 다른 서버를 AWS 클라우드 네이티브로 실행
- 광범위한 플랫폼, 운영 체제, 데이터베이스 지원
- 다운타임이 최소로 걸리고 자동으로 수행하기 때문에 비용 절감도 가능
반응형
'자격증 > SAA-C03' 카테고리의 다른 글
[SAA-C03] 기타 서비스 (1) | 2023.09.26 |
---|---|
[SAA-C03] Route 53 (0) | 2023.09.21 |
[SAA-C03] 네트워킹 - VPC (0) | 2023.09.20 |
[SAA-C03] AWS 보안 및 암호화 (0) | 2023.09.19 |
[SAA-C03] IAM (Identity and Access Management) - 고급 (0) | 2023.09.18 |