Data-Engineer-Associate-KR 문제 61

데이터 엔지니어는 10개의 소스 시스템에서 Amazon Redshift 데이터베이스에 있는 10개의 테이블로 데이터를 처리하고 로드하기 위해 ETL(추출, 변환 및 로드) 파이프라인을 구축해야 합니다. 모든 소스 시스템은 15분마다 .csv, JSON 또는 Apache Parquet 파일을 생성합니다. 소스 시스템은 모두 파일을 하나의 Amazon S3 버킷으로 전달합니다. 파일 크기는 10MB에서 20GB까지입니다. ETL 파이프라인은 데이터 스키마 변경에도 불구하고 올바르게 작동해야 합니다.
이러한 요구 사항을 충족하는 데이터 파이프라인 솔루션은 무엇인가요? (2개를 선택하세요.)

Data-Engineer-Associate-KR 문제 62

데이터 엔지니어는 회사의 Amazon S3 버킷과 Amazon RDS 데이터베이스를 기반으로 엔터프라이즈 데이터 카탈로그를 구축해야 합니다. 데이터 카탈로그에는 카탈로그의 데이터에 대한 스토리지 형식 메타데이터가 포함되어야 합니다.
가장 적은 노력으로 이러한 요구 사항을 충족할 수 있는 솔루션은 무엇일까요?

Data-Engineer-Associate-KR 문제 63

회사에는 Amazon API Gateway를 사용하여 REST API를 호출하는 프런트엔드 ReactJS 웹 사이트가 있습니다. API는 웹사이트의 기능을 수행합니다. 데이터 엔지니어는 API 게이트웨이를 통해 가끔 호출될 수 있는 Python 스크립트를 작성해야 합니다. 코드는 API Gateway에 결과를 반환해야 합니다.
최소한의 운영 오버헤드로 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 64

회사의 데이터 엔지니어는 테이블 SQL 쿼리의 성능을 최적화해야 합니다. 회사는 Amazon Redshift 클러스터에 데이터를 저장합니다. 데이터 엔지니어는 예산 제약으로 인해 클러스터 크기를 늘릴 수 없습니다.
회사는 데이터를 여러 테이블에 저장하고 EVEN 배포 스타일을 사용하여 데이터를 로드합니다. 일부 테이블의 크기는 수백 기가바이트입니다. 다른 테이블의 크기는 10MB 미만입니다.
어떤 솔루션이 이러한 요구 사항을 충족합니까?

Data-Engineer-Associate-KR 문제 65

한 회사가 Amazon Redshift를 사용하여 데이터 웨어하우스 솔루션을 구축하고 있습니다. 이 회사는 Redshift 클러스터에 있는 택트 테이블에 수백 개의 타일을 로드하고 있습니다.
회사는 데이터웨어하우스 솔루션이 가능한 최대 처리량을 달성하기를 원합니다. 솔루션은 회사가 데이터를 tact 테이블에 로드할 때 클러스터 리소스를 최적으로 사용해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족시킬까요?