Data-Engineer-Associate-KR 문제 56

소매업체는 Amazon Aurora PostgreSQL을 사용하여 라이브 거래 데이터를 처리하고 저장합니다. 이 회사는 데이터 웨어하우스에 Amazon Redshift 클러스터를 사용합니다.
추출, 변환 및 로드(ETL) 작업은 매일 아침 실행되어 PostgreSQL 데이터베이스의 새 데이터로 Redshift 클러스터를 업데이트합니다. 회사는 빠르게 성장했으며 Redshift 클러스터의 비용을 최적화해야 합니다.
데이터 엔지니어는 과거 데이터를 보관하기 위한 솔루션을 만들어야 합니다. 데이터 엔지니어는 PostgreSQL의 라이브 트랜잭션 데이터, Redshift의 현재 데이터, 보관된 과거 데이터의 데이터를 효과적으로 결합하는 분석 쿼리를 실행할 수 있어야 합니다. 솔루션은 비용을 줄이기 위해 Amazon Redshift에서 가장 최근 15개월 분의 데이터만 보관해야 합니다.
이러한 요구 사항을 충족하려면 어떤 단계 조합이 필요합니까? (두 가지를 선택하세요.)

Data-Engineer-Associate-KR 문제 57

한 회사가 Amazon 53 버킷에 서버 로그를 저장합니다. 회사는 1년 동안 로그를 보관해야 합니다. 1년 후에는 로그가 필요하지 않습니다.
데이터 엔지니어는 1년 이상된 로그를 자동으로 삭제하는 솔루션이 필요합니다.
어떤 솔루션이 운영 비용을 최소화하면서 이러한 요구 사항을 충족할 수 있을까요?

Data-Engineer-Associate-KR 문제 58

데이터 엔지니어가 AWS에서 머신러닝(ML) 워크플로에 대한 모델 거버넌스를 구현하고 있습니다. 데이터 엔지니어는 데이터 준비, 모델 학습, 배포 단계를 포함하여 ML 모델의 전체 수명 주기를 추적할 수 있는 솔루션이 필요합니다. 이 솔루션은 재현성과 감사 규정 준수를 보장해야 합니다.

Data-Engineer-Associate-KR 문제 59

어떤 회사는 가변적인 속성을 가진 제품 데이터를 저장하고 조회할 수 있는 솔루션이 필요합니다. 이 솔루션은 갑작스러운 트래픽 급증 상황에서도 예측 불가능하고 대용량의 쿼리를 밀리초 단위의 단일 지연 시간으로 처리해야 합니다. 또한, 제품 ID라는 기본 식별자를 사용하여 제품을 검색할 수 있어야 하며, 카테고리와 브랜드라는 보조 속성을 이용한 유연한 쿼리도 지원해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

Data-Engineer-Associate-KR 문제 60

데이터 엔지니어는 Amazon S3 버킷에 저장된 데이터에 대해 AWS Glue Data Catalog를 구성했습니다. 데이터 엔지니어는 증분 업데이트를 수신하도록 Data Catalog를 구성해야 합니다.
데이터 엔지니어는 S3 버킷에 대한 이벤트 알림을 설정하고 S3 이벤트를 수신하기 위한 Amazon Simple Queue Service(Amazon SQS) 대기열을 생성합니다.
이러한 요구 사항을 충족하고 운영 비용을 최소화하기 위해 데이터 엔지니어는 어떤 단계 조합을 취해야 할까요? (2가지를 선택하세요.)