Storage Extras
AWS Snow Family
-
엣지에서 데이터를 수집, 처리하며 AWS의 안팎으로 데이터를 마이그레이션하게 해주는 높은 보안성을 지니고 휴대가능한 디바이스
-
Data migration: Snowcone, Snowball Edge, Snowmobile
-
Edge computing: Snowcone, Snowball Edge
Data Migrations with AWS Snow Family
-
각 데이터 크기 별 전송에 걸리는 시간
-
온라인 데이터 전송에서의 문제점
- 제한된 연결성
- 제한된 대역폭(bandwidth)
- 높은 네트워크 비용
- 공유되는 대역폭(회선을 최대화 할 수 없음)
- 연결 안정성
-
AWS Snow Family: 데이터 마이그레이션을 수행하기 위한 오프라인 디바이스
- 만약, 네트워크를 통한 데이터 전송에 1주 이상 걸린다면, Snowball 디바이스를 사용하자!
Snow Family - Snowball Edge
- 물리적인 데이터 전송 솔루션: AWS에서의 TB, PB 단위의 데이터를 안팎으로 이동
- 네트워크를 통한 데이터 이동(+ 네트워크 요금 지불)에 대한 대안
- 각 데이터 전송 작업에 대해 요금 지불
- 블록 스토리지와 S3 호환 가능한 오브젝트 스토리지를 제공
- Snowball Edge Storage Optimized
- 80TB HDD 저장소로, 블록 볼륨과 S3 호환 가능한 오브젝트 스토리지
- Snowball Edge Compute Optimized
- 42TB HDD 또는 28TB NVMe 저장소로, 블록 볼륨과 S3 호환 가능한 오브젝트 스토리지
- 사례: 큰 데이터에 대한 클라우드 마이그레이션, 데이터센터(DC) 폐기, 장애 복구
Snow Family - AWS Snowcone & Snowcone SSD
- 견고하고 안전한, 열악한 환경도 견뎌낼 수 있는 작고 휴대 가능한 컴퓨터
- 가벼움 (4.5파운드, 2.1kg)
- Snowcone - 8TB HDD 저장소
- Snowcone SSD - 14TB SSD 저장소
- Snowball을 쓰기 적합하지 않은 경우라면 Snowcone을 사용 (공간 제약적인 환경)
- 자체적인 배터리 / 케이블을 준비해야함
- 오프라인으로 AWS에 재전송할 수 있고, 데이터 전송을 위해 인터넷에 연결하여 AWS DataSync를 사용할 수도 있음
Snow Family - AWS Snowmobile
- EB(엑사바이트) 단위의 데이터를 전송 (1EB = 1,000PB = 1,000,000TBs)
- 각 Snowmobile은 100PB의 용량을 가짐 (병렬로 여러개 사용)
- 높은 보안: 온도 관리, GPS, 24/7 비디오 감시
- 10PB 이상의 데이터 전송이 필요할때 Snowball보다 유용
Snow Family - Usage Process
- AWS 콘솔로부터 Snowball 기기 배송을 요청
- 서버에서 Snowball 클라이언트 / AWS OpsHub를 설치
- Snowball을 서버에 연결하고 클라이언트를 사용하여 파일을 복사
- 완료된 이후에는 기기를 반납 (적절한 AWS 시설로 배송)
- S3 버킷으로 데이터가 로드
- Snowball은 완전히 지워짐.
Snow Family - What is Edge Computing?
- 엣지 로케이션에서 생성되는 데이터를 처리
- 엣지 로케이션: 클라우드 환경으로부터 멀리 떨어지거나, 인터넷 환경이 갖추어지지 않은 어디든
- 이러한 로케이션들은 다음과 같은 문제로 제약을 가짐
- 인터넷 액세스가 존재하지 않거나
- 컴퓨팅 파워(computing power)에 액세스하기 쉽지 않음
- 엣지 컴퓨팅을 수행하기 위해 Snowball Edge / Snowcone 디바이스를 설치
- 엣지 컴퓨팅 사례:
- 데이터 전처리
- 엣지에서의 머신러닝
- 미디어 스트림 트랜스코딩
- 결국 (필요한 경우) AWS에 디바이스를 반송할 수 있음 (ex. 데이터 전송 목적)
Snow Family - Edge Computing
- Snowcone & Snowcone SSD (smaller)
- 2 CPUs, 4GB 메모리, 유선 또는 무선 액세스
- 코드를 통한 USB-C 파워 또는 배터리 옵션
- Snowball Edge - Compute Optimized
- 104 vCPUs, 416GB 램
- GPU 옵션 (비디오 프로세싱 또는 머신 러닝에 유용)
- 28TB NVMe 또는 42TB HDD usable storage
- Snowball Edge - Storage Optimized
- 최대 40 vCPUs, 80GB 램, 80TB 저장소
- 객체 스토리지 클러스터링 이용 가능
- All: EC2 인스턴스 & AWS 람다 함수 실행 가능 (AWS IoT Greengrass 사용)
- 장기 배포 옵션: 1-3년 할인된 가격
Snow Family - AWS OpsHub
- 역사적으로, Snow Family 디바이스들을 사용하기 위해서는 CLI를 다루어야 했음
- 오늘날에는, AWS OpsHub(컴퓨터/랩탑에 설치하는 소프트웨어)로 Snow Family 디바이스를 관리할 수 있음
- 단일 또는 클러스터링된 디바이스들을 잠금해제 및 설정
- Snow Family 디바이스들에서 인스턴스들을 실행하거나 관리
- 디바이스 지표(metrics)를 모니터링 (스토리지 용량, 디바이스 내 활성된 인스턴스)
- 디바이스에서 호환가능한 AWS 서비스 실행 (ex. EC2 인스턴스, AWS DataSync, Network File System(NFS))
Snow Family - Snowball into Glacier
- Snowball 그 자체만으로는 Glacier에 직접 임포트할 수 없음
- 반드시 S3를 먼저 사용하고, S3 라이프사이클 정책을 조합해야함
Amazon FSx
Amazon FSx - Overview
- AWS에서 높은 성능의 써드파티 파일 시스템을 실행
- 완전 관리형 서비스
- FSx for Lustre
- FSx for Windows File Server
- FSx for NetApp ONTAP
- FSx for OpenZFS
Amazon FSx - for Windows (File Server)
- FSx for Windows는 완전관리형 Windows 파일 시스템 공유 드라이브
- SMB 프로토콜 & Windows NTFS 지원
- Microsoft Active Directory Integration, ACLs(접근 제어 목록), user quotas
- 리눅스 EC2 인스턴스에 마운트
- **Microsoft의 Distrubted File System (DFS) 네임스페이스 지원 (여러 FS 간에 파일들을 그룹화)
- 최대 10GB/s, 수백만의 IOPS, 100PB 규모의 데이터까지 확장
- 스토리지 옵션
- SSD - 레이턴시 중점의 워크로드 (데이터베이스, 미디어 프로세싱, 데이터 분석, ...)
- HDD - 넓은 스펙트럼의 워크로드 (홈 디렉토리, CMS, ...)
- 온-프리미스 인프라에 액세스 가능 (VPN or Direct Connect)
- Multi-AZ로 설정 가능 (High availability)
- 매일 S3로 데이터 백업 - 재해 복구
Amazon FSx - for Lustre
- Lustre는 병렬 분산형 파일 시스템의 한 종류로, 대규모 컴퓨팅에 사용됨
- Lustre = linux + cluster
- 머신러닝, 고성능 컴퓨팅 (HPC - High Performance Computing)
- 비디오 프로세싱, 재무 모델링(Financial Modeling), 전자 설계 자동화(Electronic Design Automation)
- 최대 100GB/s, 수백만의 IOPS, ms 미만의 레이턴시
- 스토리지 옵션
- SSD - 낮은 레이턴시, IOPS 중점의 워크로드, 작고 무작위성인 파일 작업
- HDD - 처리량에 집중적인(throughput-intensive) 워크로드, 크고 순차적인 파일 작업
- S3와의 원활한 통합
- 파일 시스템으로서 S3를 읽을 수 있음 (FSx를 통해서)
- 컴퓨팅 결과를 S3에 다시 작성할 수 있음 (FSx를 통해서)
- 온-프리미스 서버로부터 사용될 수 있음 (VPN or Direct Connect)
Amazon FSx - File System Deployment Options
- Scratch File System
- 임시 저장소
- 데이터가 복제되지 않음 (파일 서버가 디운되면 사라짐)
- High burst (6배 빠름, 200MBps per TiB)
- 사례: 단기간 프로세싱, 비용 최적화
- Persistent File System
- 장기간 스토리지
- 동일 AZ 내에 데이터가 복제됨
- 몇분 안에 failed file들을 교체
- 사례: 장기간 프로세싱, 민감 데이터
Amazon FSx - for NetApp ONTAP
- AWS에서 관리되는 NetApp ONTAP
- NFS, SMB, iSCSI 프로토콜과 호환되는 파일 시스템
- ONTAP 또는 NAS에서 실행되는 워크로드를 AWS로 이동
- 다음과 호환
- Linux
- Windows
- MacOS
- VMware Cloud on AWS
- Amazon Workspaces & AppStream 2.0
- Amazon EC2, ECS and EKS
- 스토리지 자동 축소/확장
- 스냅샷, 복제, 저비용, 압축 및 데이터 중복 제거
- 특정 시점 순간 복제(새로운 워크로드에 대한 테스트에 유용함)
Amazon FSx - for OpenZFS
- AWS에서 관리되는 OpenZFS 파일 시스템
- 오직 NFS와 호환되는 파일 시스템 (v3, v4, v4.1, v4.2)
- ZFS에서 실행중인 워크로드를 AWS로 이동
- 다음과 호환
- Linux
- Windows
- MacOS
- VMware Cloud on AWS
- Amazon Workspaces & AppStream 2.0
- Amazon EC2, ECS and EKS
- 0.5ms 미만의 레이턴시로 최대 1,000,000 IOPS
- 스냅샷, 압축, 저비용
- 특정 시점 순간 복제(새로운 워크로드에 대한 테스트에 유용함)
Storage Gateway
Storage Gateway - Hybrid Cloud for Storage
- AWS는 "하이브리드 클라우드"를 추진함
- 인프라의 일부는 클라우드로
- 인프라의 일부는 온-프레미스로
- 이렇게 하는 이유는
- 장기적인 클라우드 마이그레이션
- 보안 요구사항 준수
- 규정 준수
- IT 전략
- S3는 (EFS/NFS와 다르게) 독점적인 스토리지 기술인데, 어떻게 S3 데이터를 온-프레미스로 내보낼 수 있을까?
- 그 역할을 해주는 것이 바로 AWS Storage Gateway
Storage Gateway - AWS Storage Cloud Native Options
- Block - AWS EBS, EC2 Instance Store
- File - AWS EFS, AWS FSx
- Object - AWS S3, AWS Glacier
Storage Gateway - Overview
-
온-프레미스 데이터와 클라우드 데이터 간의 브릿지
-
사례:
- 재해 복구
- 백업 & 복원
- 계층형 스토리지 (tiered storage)
- 온-프레미스 캐시 & 낮은 레이턴시의 파일 액세스
-
Storage Gateway 종류:
- S3 File Gateway
- FSx File Gateway
- Volume Gateway
- Tape Gateway
Storage Gateway - S3 File Gateway
- NFS와 SMB 프로토콜을 사용하여 접근 가능한 설정된 S3 버킷
- 가장 최근에 사용된 데이터는 file gateway 내에 캐시됨
- S3 Standard, S3 Standard IA, S3 One Zone A, S3 Intelligent Tiering 지원 (Glacier 제외)
- 라이프사이클 정책을 통해 S3 Glacier로 전환 가능
- 각각의 File Gateway에 IAM 역할을 정의하여 버킷에 액세스
- 이용자 인증을 위해 SMB 프로토콜은 Active Directory(AD)와 연동됨
Storage Gateway - FSx File Gateway
- FSx for Window File Server에 대한 네이티브 액세스
- 자주 액세스되는 데이터에 대한 로컬 캐시 (사실 상 이를 사용하는 주된 이유)
- Windows 네이티브 호환성 (SMB, NTFS, Active Directory, ...)
- 그룹 파일 공유와 홈 디렉토리에 유용함
Storage Gateway - Volume Gateway
- iSCSI 프로토콜을 사용하는 S3 지원 블록 스토리지
- EBS 스냅샷을 지원하여 온-프레미스 볼륨을 복원하는데 도움을 줌
- Cached volumes: 가장 최근에 액세스된 데이터에 대해 낮은 레이턴시를 보장
- Stored volumes: 전체 데이터셋이 온-프레미스이며, S3로 스케줄된 백업(scheduled backup)
Storage Gateway - Tape Gateway
- 일부 회사는 놀랍게도(?) 실물 테이프를 사용하는 백업 프로세스를 보유함
- Tape Gateway는 동일한 프로세스를 클라우드에서 수행할 수 있도록 함
- S3와 Glacier가 지원되는 Virtual Tape Library(VTL)
- 기존에 존재하는 tape-based 프로세스를 사용하여 데이터를 백업 (+ iSCSI 인터페이스)
- 주요 백업 소프트웨어 업체와 협력
Storage Gateway - Hardware appliance
- Storage Gateway를 사용한다는 것은 온-프레미스 가상화가 필요하다는 것을 의미함
- 그렇지 않은 경우, Storage Gateway Hardware Appliance를 사용할 수도 있음
- amazon.com에서 구매
- File Gateway, Volume Gateway, Tape Gateway와 함께 사용
- 요구되는 CPU, 메모리, 네트워크, SSD 캐시 리소스를 보유하고 있음
- 소규모 데이터 센터를 두고 매일 NFS 백업을 하기에 유용함
Storage Gateway - Summary
AWS Transfer Family
- S3 또는 FTP 프로토콜을 사용하는 EFS 안팎으로 데이터를 전송할 수 있는 완전 관리형 서비스
- 지원 프로토콜
- **AWS Transfer for FTP (File Transfer Protocol (FTP))
- **AWS Transfer for FTPS (File Transfer Protocol over SSL (FTPS))
- **AWS Transfer for SFTP (Secure File Transfer Protocol (SFTP))
- 관리형 인프라, 확장 가능, 신뢰 가능, 고가용성 ~ High Available (multi-AZ)
- 시간 별 프로비전된 엔드포인트마다 + 데이터 전송 GB 단위에 따라 비용 지불
- 기존에 존재하는 인증 시스템과 호환됨 (Microsoft Active Directory, LDAP, Okta, Amazon Cognito, custom)
- 사례: 파일 공유, 공용 데이터셋, CRM, ERP, ...
AWS DataSync
- 많은 양의 데이터를 넘기거나, 받는 경우
- 온-프레미스 또는 다른 클라우드로부터 AWS로 이동 (NFS, SMB, HDFS, S3 API...) - 연결을 수행하기 위한 에이전트 필요
- AWS에서 AWS (다른 스토리지 서비스로) - 에이전트 필요 없음
- 다음과 동기화 가능
- S3 (어떤 storage class든 - Glacier 포함)
- EFS
- FSx (Windows, Lustre, NetApp, OpenZFS...)
- 복제 작업을 시간마다/일마다/주마다 수행할 수 있음
- 파일 권한과 메타데이터가 보존됨 (NFS POSIX, SMB...)
- 하나의 에이전트 작업은 10Gbps를 사용할 수 있으며, 대역폭 한계(bandwidth limit)를 설정할 수 있음
AWS DataSync - NFS / SMB to AWS (S3, EFS, FSx...)
AWS DataSync - Transfer between AWS storage services
Storage Comparison
- S3: 객체 스토리지
- S3 Glacier: 객체 아카이빙
- EBS volumes: 한번에 하나의 EC2 인스턴스에만 존재하는 네트워크 스토리지
- Instance Storge: EC2 인스턴스에 대한 실물 스토리지 (High IOPS)
- EFS: 리눅스 인스턴스, POSIX 파일시스템을 위한 네트워크 파일 시스템
- FSx for Windows: Windows servers를 위한 네트워크 파일 시스템
- FSx for Lustre: 고성능 컴퓨팅 리눅스 파일 시스템
- FSx for NetApp ONTAP: 높은 OS 호환성
- FSx for OpenZFS: 관리형 ZFS 파일 시스템
- Storage Gateway: S3 & FSx File Gateway, Volume Gateway (캐시 & 보관), Tape Gateway
- Transfer Family: S3 또는 EFS 상위의 FTP, FTPS, SFTP 인터페이스
- DataSync: 온-프레미스 to AWS 또는 AWS to AWS 데이터 싱크를 스케줄
- Snowcone / Snowball / Snowmobile: 거대한 양의 물리적인 데이터를 클라우드로 이동
- Database: 구체적인 워크로드 수행을 위함, 인덱싱 또는 쿼링