Data-Engineer-Associate-KR 문제 71

한 회사는 Amazon Athena를 사용하여 CTAS(Create Table As Select)를 사용하여 추출, 변환 및 로드(ETL) 작업에 대한 SQL 쿼리를 실행합니다. 회사는 분석을 생성하기 위해 SQL 대신 Apache Spark를 사용해야 합니다.
회사가 Spark를 사용하여 Athena에 액세스할 수 있는 기능을 제공하는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 72

한 회사의 애플리케이션은 거의 실시간으로 데이터를 검색하고 분석해야 합니다. 이 애플리케이션은 초당 최대 1,000건의 요청을 처리해야 하며, 쿼리 지연 시간도 최소화해야 합니다. 또한, 각 데이터 팀이 자체적으로 소유하고 구성하여 비용 및 성능 최적화 요구 사항을 충족할 수 있는 솔루션을 원합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

Data-Engineer-Associate-KR 문제 73

데이터 엔지니어는 많은 AWS Lambda 함수가 사용하는 데이터 형식 지정 프로세스를 수행하는 사용자 지정 Python 스크립트를 유지 관리합니다. 데이터 엔지니어가 Python 스크립트를 수정해야 하는 경우 데이터 엔지니어는 모든 Lambda 함수를 수동으로 업데이트해야 합니다.
데이터 엔지니어는 Lambda 함수를 업데이트하는 데 덜 수동적인 방법이 필요합니다.
이 요구 사항을 충족하는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 74

데이터 엔지니어는 AWS Glue Apache Spark ETL 작업을 개발하여 데이터 세트에 대한 변환을 수행합니다.
데이터 엔지니어가 작업을 실행하면 "기기에 남은 공간이 없습니다."라는 오류가 반환됩니다. 데이터 엔지니어는 오류의 원인을 파악하고 해결책을 제시해야 합니다.
어떤 단계 조합이 이 요구 사항을 가장 비용 효율적으로 충족할 수 있을까요? (두 가지를 선택하세요.)

Data-Engineer-Associate-KR 문제 75

한 회사는 SAP HANA, Microsoft SQL Server, MongoDB, Apache Kafka 및 Amazon DynamoDB와 같은 데이터 소스에서 매일 약 1TB의 데이터를 추출합니다. 일부 데이터 소스에는 정의되지 않은 데이터 스키마 또는 변경되는 데이터 스키마가 있습니다.
데이터 엔지니어는 이러한 데이터 소스에 대한 스키마를 감지할 수 있는 솔루션을 구현해야 합니다. 솔루션은 데이터를 추출, 변환하고 Amazon S3 버킷에 로드해야 합니다. 회사는 데이터 생성 후 15분 이내에 S3 버킷에 데이터를 로드하는 서비스 수준 계약(SLA)을 보유하고 있습니다.
최소한의 운영 오버헤드로 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?