AWS RDS

RDS : Relational Database Service
SQL을 쿼리 언어로 사용하는 DB를 위한 관리형 DB 서비스
AWS를 통해 관리되는 클라우드에 데이터베이스를 생성할 수 있도록 해줌
- Postgres
- MySql
- MariaDB
- Oracle
- Microsoft SQL Server
- Aurora (AWS Proprietary database)

Advantage over using RDS versus deploying DB on EC2

RDS는 관리형 서비스
- 자동화된 프로비저닝(provisioning), OS 패칭(patching)
- 지속적인 백업과 구체적인 타임스탬프로 복구 (Point in Time Restore)
- 대쉬보드 모니터링
- Read replica -> 읽기 성능 향상
- Multi AZ setup for DR (Disaster Recovery)
- Maintenance windows for upgrades
- Scaling capability (vertical and horizontal)
- 저장소를 EBS로 백업 (gp2 or io1)
인스턴스로 SSH 접속을 할 수는 없음

RDS - Storage Auto Scaling

RDS DB 인스턴스의 가용량(storage)를 동적으로 상승시킬 수 있도록 도와줌
RDS가 남은 데이터베이스의 가용량이 고갈됨을 확인할 때, 자동으로 스케일을 확장
DB 스토리지를 수동으로 확장하지 않아도 됨
Maximum Storage Threshold (DB 스토리지의 최대 한계값)을 설정해야 함
다음의 경우들에 스토리지는 자동으로 수정됨
- 할당된 스토리지의 10%보다 남은 가용량이 적은 경우
- 낮은 가용량이 최소 5분 동안 지속되는 경우
- 최근의 수정으로부터 6시간이 지난 이후
예측 불가능한 워크로드(unpredictable workloads) 를 가진 애플리케이션에 유용함.
모든 RDS DB 엔진에 대해 지원 (MariaDB, MySQL, PostgreSQL, SQL Server, Oracle)

RDS Read Replicas for read scalability

5개의 Read Replicas 까지 지원
Within AZ, Cross AZ 또는 Cross Region (세가지 옵션)
Replication은 비동기적(ASYNC), 따라서 읽기 작업이 결국 일관적(consistent)이다.
Replica는 그들 자신의 DB로 승격(promote)될 수 있다.
애플리케이션들은 read replica들을 사용하고자 하는 경우 connection string을 업데이트해야만 한다.

RDS Read Replicas - Use Cases

일반적인 load를 처리하는 프로덕션 DB를 보유한 경우
분석을 위해 리포팅을 하는 애플리케이션을 실행하고 싶다면
새로운 workload를 처리하는 Read Replica를 만듬
이 때, 프로덕션 애플리케이션에는 영향이 가지 않음
Read Replica는 오직 SELECT(=read) 관련문만 처리할 수 있음 (not INSERT, UPDATE, DELETE)

RDS Read Replicas - Network Cost

AWS에서는 하나의 AZ에서 다른 곳으로 전달되는 데이터의 경우에는 network cost가 발생함
동일한 region 내에 있는 RDS Read Replica의 경우에는 비용이 부과되지 않음

RDS Multi AZ (Disaster Recovery)

SYNC replication
하나의 DNS 네임 -> automatic app failover 대비
availability 향상
AZ의 손실, Network 손실, 인스턴스 또는 스토리지의 실패에 대한 장애조치
앱에 대한 어떤 수동적인 개입(intervention)을 하지 않음
확장을 위해 사용되지 않음
중요: Read Replica는 Disaster Recovery(DR)을 위해 Multi AZ로 셋업될 수 있다.

RDS - From Single-AZ to Multi-AZ

Zero downtime operation (DB를 멈출 필요 없음)
단순히 DB에 대한 "수정(modify)" 버튼을 클릭하기만 하면 됨
그러면 아래와 같은 작업들이 내부적으로 일어남
- 스냅샷이 찍힘
- 새 DB가 새로운 AZ에서 앞서 찍은 스냅샷을 통해 복구됨.
- 두 DB 사이에 동기화(synchronization) 작업이 이루어짐.

RDS Custom

OS와 DB에 대한 커스터마이징이 가능한 관리형 Oracle 또는 Microsoft SQL Server 데이터베이스
RDS: AWS 내 DB의 설정, 작업, 스케일링의 자동화
Custom: 그 아래 놓인 DB와 OS에 대한 접근으로, 다음과 같은 일들을 할 수 있음.
- Configure settings
- Install patches
- Enable native features
- SSH 또는 SSM Session Manager를 통해 RDS 아래의 EC2 인스턴스에 접근
커스터마이징을 하려면 Automation Mode를 비활성화 해야함 -> 그 전에 DB 스냅샷을 찍어두는 것을 권장
RDS vs. RDS Custom
- RDS: AWS로부터 관리되는 DB와 OS 전체
- RDS Custom: 그 아래 놓인 OS와 DB에 대해 완전한 어드민 접근

Amazon Aurora

Aurora는 AWS가 소유한(proprietary) 자체적인 기술 (오픈 소스가 아님)
Postgres와 MySQL 모두 Aurora DB와 호환됨 (= Aurora를 Postgres나 MySQL DB처럼 사용할 수 있음)
Aurora는 AWS 클라우드에 최적화되어 있어, RDS의 MySQL보다 5배, RDS의 Postgres보다 3배 더 높은 성능 향상을 기대할 수 있음
Aurora 스토리지는 자동으로 10GB까지 증가될 수 있으며, 최대 128TB까지.
Aurora는 15개의 replica를 가질 수 있음. (MySQL은 5개까지) 또한 이러한 replication 과정이 빠름 (10ms 미만의 replica lag)
Aurora의 장애조치(Failover)는 즉각적(instantaneous)이며, High-Availity(HA) native임.
Aurora는 RDS보다 높은 가격(20% 이상)이지만, 더 효율적임.

Aurora High Availability and Read Scaling

3개의 AZ에 걸쳐 6개의 데이터 사본이 생성됨
- 쓰기 시 6개 중 4개 필요
- 읽기 시 6개 중 3개 필요
- peer-to-peer 복제를 통한 자가 복구
- 스토리지가 100개의 볼륨에 걸쳐 스트라이프 처리
하나의 Aurora 인스턴스가 쓰기 작업을 처리 (master)
마스터에 대한 장애조치는 30초 이내로 처리됨
master에 더해, 최대 15개의 Aurora Read Replicas가 읽기 작업을 처리
Cross Region Replication을 지원함

Aurora DB Cluster

Aurora Cluster

Features of Aurora

자동 장애조치
백업 및 복구
격리(isolation) 및 보안
산업 규정 준수 (industry compliance)
Push-button scaling
Zero downtime으로 자동화된 패칭(Patching)
고급 모니터링(Advanced Monitoring)
Routine maintenace
백트래킹(Backtrack): 백업 없이 특정한 시점으로 데이터를 복구

Aurora Replicas - Auto Scaling

Aurora auto scaling

Aurora - Custom Endpoints

Aurora custom endpoint

Aurora Instance의 부분 집합을 커스텀 엔드포인트로 정의
Ex. 특정 replica(사본)들에서만 분석 쿼리를 실행
Custom Endpoint의 정의 이후에 일반적으로 Reader Endpoint는 사용되지 않음.

Aurora Serverless

실제 사용에 기반한 자동화된 데이터베이스 인스턴스화(Instantiation)와 오토 스케일링
비주기적(infrequent)이고, 간헐적(intermittent)이며, 예측 불가능한(unpredictable) 워크로드의 경우에 유용함
capacity planning(특정 capacity를 선택해야 할 필요)가없음
매초마다 비용을 지불하며, 더 비용 효율적임(cost-effective).

Aurora Multi-Master

write node 에 대한 즉각적인 failover를 원할 때 (high availability)
모든 노드가 R/W를 수행 - vs. 하나의 Read replica를 새로운 master로 승격

Global Aurora

Aurora Cross Region Read Replicas:
- disaster recovery(장애 조치)에 유용
- 설치가 간편함
Aurora Global Database (recommended):
- 하나의 주요 리전 (Read / Write)
- 5개 까지의 보조 리전(Read 전용), 복제에 걸리는 지연 시간이 1초 미만임
- 각 보조 리전 당 16개까지의 Read Replica
- latency 감소에 도움
- 또다른 리전 승격(장애 조치 목적)은 RTO(= Recovery Time Objective)가 1분 미만
- 일반적인 cross-region 복제는 1초 미만이 소요됨

Aurora Machine Learning

Aurora Machin Learning

SQL을 통해 애플리케이션에 대한 ML 기반 예측 활성화
간단하고, 최적화되어 있으며, 안전하게 통합된 Aurora와 AWS ML 서비스
지원되는 서비스
- Amazon SageMaker (어떤 ML 모델도 사용 가능)
- Amazon Comprehend (감성 분석 용도)
굳이 ML 경험을 필요로 하지 않음
이용 사례: 사기 감지(fraud detection), 광고 타겟팅(ads targeting), 감성 분석(sentiment analysis), 제품 추천(product recommendation)

Backups

RDS Backups

Automated backups:
- 매일 데이터베이스 전체를 백업 (window 백업 도중)
- 매 5분마다 Transaction log가 RDS에 의해 백업됨
  - 백업된 시점의 어디로든 복구가 가능함 (가장 오래된 백업부터, 최소 5분 전까지)
- 1일에서 35일까지 보존(retention), 0으로 설정하면 automated backup을 비활성화
Manual DB Snapshots
- 말 그대로 수동으로 백업
- 원하는 기간만큼 백업 보존
요령: RDS 데이터베이스를 중지하더라도, 여전히 storage에 대한 비용은 청구됨. 따라서, DB를 오랜기간 동안 중지하고자 한다면, 중지하는 대신에 스냅샷을 찍어놓고, 복구를 시키는 편이 더 좋음.

Aurora Backups (RDS와 유사)

Automated backups:
- 1일에서 35일까지 (비활성화 불가능)
- 위 해당 기간의 특정 시점으로 복구 가능
Manual DB Snapshots
- 수동으로 백업
- 원하는 기간만큼 백업 보존

RDS & Aurora Restore Options

RDS / Aurora 백업 또는 스냅샷의 복구는 새로운 DB를 생성함
S3로부터 MySQL RDS DB를 복구
- 온-프로미스 DB의 백업을 생성
- AWS S3에 이를 저장
- MySQL을 실행하는 새로운 RDS 인스턴스로 백업 파일을 복구
S3로부터 MySQL Aurora cluster를 복구
- Percona XtraBackup을 사용하는 온-프로미스 DB의 백업 생성
- AWS S3에 이를 저장
- MySQL을 실행하는 새로운 Aurora cluster로 백업 파일을 복구

Aurora Database Cloning

기존에 갖고있던 Aurora DB 클러스터를 새로 복제하여 생성
스냅샷을 찍고 이를 복구하는 것보다 빠름
copy-on-write 프로토콜을 사용
- 최초에 새로 생성된 DB 클러스터는 기존의 DB클러스터와 동일한 데이터 볼륨을 사용함 (빠르고 효율적임 -> 데이터를 따로 복제할 필요가 없음)
- 새로운 DB 클러스터 데이터에 업데이트가 이루어지면, 그제서야 새로운 스토리지가 할당되고, 데이터가 복제 및 분리됨
매우 빠르고 비용 효율적
프로덕션 DB에는 영향을 주지 않으면서 프로덕션 DB로부터 staging DB를 새로 생성하기에 유용함

RDS & Aurora Security

At-rest encryption
- DB master & replica는 AWS KMS를 통해 암호화됨 -> 실행 시점에 정의되어야 함
- master가 암호화되지 않았다면, read replica도 암호화될 수 없음
- 암호화되지 않은 DB를 암호화하려면, DB 스냅샷을 찍은 후, 암호화된 형태로 복구해야 함
In-flight encryption
- 기본적으로 TLS-ready, 클라이언트 측에서는 AWS TLS 루트 인증서를 사용
IAM Authentication
- DB에 접속하기 위한 IAM role (username/pw 대신)
Security Groups
- RDS / Aurora DB에 대한 네트워크 접근을 통제
RDS Custom이 아니라면 SSH 접근은 허용하지 않음
Audit Logs를 활성화한다면 더 장기적인 보관을 위해 Cloudwatch Log로 전송할 수 있음

RDS Proxy

RDS를 위한 완전 관리형(Fully managed) DB 프록시
앱들이 pooling 하거나, DB에 연결된 DB 커넥션들을 공유할 수 있도록 해줌
DB 리소스들에 대한 부하를 줄이고, open connection들을 최소화(+ timeout 추가) 함으로써 DB 효율성을 높임
서버리스, 오토스케일링, High available (multi-AZ)
RDS & Aurora의 failover 시간을 최대 66%까지 단축
RDS(MySQL, PostgreSQL, MariaDB)와 Aurora(MySQL, PostgreSQL)에 대해 지원
대부분 앱의 경우, 별도로 요구되는 코드 변경이 없음
DB에 대한 IAM 인증을 강화하며, AWS Secrets Manager 내에 안전하게 credential들을 저장
RDS Proxy는 절대 공개적으로 접근할 수 없음 (반드시 VPC를 통해 접근되어야 함)

ElastiCache

ElastiCache Overview

ElastiCache는 관리형 Redis 또는 Memcached라고 할 수 있다.
Cache는 인-메모리(in-memory) DB로, 매우 높은 성능과 낮은 레이턴시를 보유한다.
읽기 집약적인 워크로드에 대한 데이터베이스 부하를 줄이는 데에 도움을 준다.
애플리케이션을 무상태성(stateless)으로 만드는데에 도움을 준다.
AWS는 OS 유지 보수 / 패칭(patch), 최적화, 설정, 구성, 모니터링, 장애 조치 및 백업을 관리해준다.
ElastiCache의 사용은 애플리케이션에 많은 코드 변경을 요구한다.
과정
- 애플리케이션이 ElastiCache에 쿼리를 보내고, 그것이 처리가 불가능하다면, 그 결과를 RDS로부터 가져와 ElastiCache에 저장
- 이로부터 RDS에 대한 부하를 완화할 수 있음
- 가장 최신의 데이터가 사용될 수 있도록, 캐시는 반드시 비활성화 전략을 갖추어야 함

ElastiCache - User Session Store

과정
- 이용자가 애플리케이션의 어디로든 로그인
- 애플리케이션이 ElastiCache에 세션 데이터를 작성
- 이용자가 애플리케이션의 다른 인스턴스로 접근
- 해당 인스턴스는 앞서 작성한 세션 데이터를 검색하여 사용하고, 이에 따라 이용자는 로그인 상태를 유지할 수 있음

ElastiCache - Redis vs Memcached

Redis
- Auto-failover와 함께 Multi AZ
- 읽기 확장(scale read)를 위한 Read Replica와 함께, High availability를 보유
- AOF persistence를 통한 Data Durability(데이터 내구성)
- 백업과 복구 기능
- Sets와 Sorted Sets 기능 지원
Memcached
- 데이터의 파티셔닝을 위한 멀티 노드 (sharding)
- High availability (replication) 없음
- 비영구적 (Non persistent)
- 백업 및 복구 기능 없음
- 멀티 쓰레드 기반의 아키텍처

ElastiCache - Cache Security

ElastiCache는 Redis에 대한 IAM 인증을 지원
ElastiCache에 대한 IAM 정책은 오직 AWS API 레벨의 보안을 위해서만 사용됨
Redis AUTH
- Redis 클러스터 생성 시 "password/token"을 설정할 수 있음
- 이는 캐시에 대한 추가 보안 수준에 해당함 (보안 그룹에 더해서)
- flight encryption 내 SSL 지원
Memcached
- SASL 기반의 인증 지원

Patterns for ElastiCache

Lazy Loading: 모든 읽기 데이터가 캐시되며, 이에 따라 데이터가 캐시 내에서 stale한 상태가 될 수 있음
Write Through: DB 내에 쓰기 작업이 이루어 질때, 캐시에 데이터를 추가하거나 업데이트 (stale data가 없음)
Session Store: 캐시 내에 일시적인 세션 데이터를 저장 (TTL 기능을 사용)

There are only two hard things in Computer Science: cache invalidation and naming things

ElastiCache - Redis Use Case

게임 리더보드 -> 계산하기 복잡함
Redis Sorted Sets는 요소의 고유함(uniqueness)와 순서를 보장함
새로운 요소가 추가될 때마다, 랭킹이 실시간으로 반영되고, 이에 따라 올바른 순서로 추가됨

List of Ports to be familiar with

아래는 최소한 한번쯤 봤을 법한, 일반적인 포트 번호의 목록이며, 이를 외울 필요는 없지만, 주요한 포트 번호들과 DB 포트를 각각 구분할 줄은 아는 것이 좋다.
Important ports:
- FTP: 21
- SSH: 22
- SFTP: 22 (SSH와 동일)
- HTTP: 80
- HTTPS: 443
RDS Databases ports:
- PostgreSQL: 5432
- MySQL: 3306
- Oracle RDS: 1521
- MSSQL Server: 1433
- MariaDB: 3306 (MySQL과 동일)
- Aurora: 5432(postgreSQL 호환의 경우) 또는 3306 (MySQL 호환의 경우)

Shubi Docs