DEA-C01 문제 151
한 회사가 AWS Glue PySpark 작업을 사용하여 Amazon DynamoDB 테이블에서 특정 데이터를 읽어야 합니다. 회사는 필요한 레코드의 파티션 키 값을 알고 있습니다. 기존 AWS Glue PySpark 작업의 처리 로직은 데이터가 DynamicFrame 형식이어야 합니다. 회사는 작업이 지정된 데이터만 읽도록 보장하는 솔루션이 필요합니다. 최소한의 읽기 용량 단위(RCU)로 이 요구 사항을 충족하는 솔루션은 무엇일까요?
DEA-C01 문제 152
데이터 엔지니어가 서버리스 기반의 다단계 ETL(추출, 변환, 로드) 파이프라인을 구축하고 있습니다.
이 파이프라인은 Amazon S3 데이터 레이크에서 데이터를 추출하고 AWS Glue ETL 작업을 사용하여 데이터를 변환합니다. 그런 다음 변환된 결과를 Amazon Redshift 데이터베이스에 로드합니다. 데이터 엔지니어는 서버리스 ETL 워크플로우를 오케스트레이션해야 합니다. 이러한 요구 사항을 충족하는 솔루션은 무엇입니까? (두 가지를 선택하십시오.)
이 파이프라인은 Amazon S3 데이터 레이크에서 데이터를 추출하고 AWS Glue ETL 작업을 사용하여 데이터를 변환합니다. 그런 다음 변환된 결과를 Amazon Redshift 데이터베이스에 로드합니다. 데이터 엔지니어는 서버리스 ETL 워크플로우를 오케스트레이션해야 합니다. 이러한 요구 사항을 충족하는 솔루션은 무엇입니까? (두 가지를 선택하십시오.)
DEA-C01 문제 153
한 회사가 Amazon Redshift에 레이크하우스 아키텍처를 구현했습니다. 이 회사는 타사 ID 공급자(IdP)를 사용하여 사용자가 Redshift 쿼리 편집기에 인증할 수 있도록 해야 합니다.
데이터 엔지니어는 인증 메커니즘을 설정해야 합니다.
데이터 엔지니어가 이 요구 사항을 충족하기 위해 가장 먼저 해야 할 일은 무엇일까요?
데이터 엔지니어는 인증 메커니즘을 설정해야 합니다.
데이터 엔지니어가 이 요구 사항을 충족하기 위해 가장 먼저 해야 할 일은 무엇일까요?
DEA-C01 문제 154
한 회사의 애플리케이션은 Amazon API Gateway REST API와 AWS Lambda 함수를 사용하여 Amazon DynamoDB 인스턴스에서 데이터를 가져옵니다. 최근 사용자들이 애플리케이션 응답 시간에서 간헐적으로 높은 지연 시간을 보고했습니다. 데이터 엔지니어는 회사의 다른 Lambda 함수 호출량이 증가할 때 해당 Lambda 함수에서 빈번한 스로틀링이 발생하는 것을 발견했습니다.
해당 회사는 API의 람다 함수가 다른 람다 함수의 영향을 받지 않고 작동하도록 보장하고자 합니다.
어떤 솔루션이 이 요구사항을 가장 비용 효율적으로 충족할까요?
해당 회사는 API의 람다 함수가 다른 람다 함수의 영향을 받지 않고 작동하도록 보장하고자 합니다.
어떤 솔루션이 이 요구사항을 가장 비용 효율적으로 충족할까요?
DEA-C01 문제 155
한 회사가 구독자 정보를 아마존 S3 버킷에 저장합니다. 구독자가 구독을 해지할 때마다 분석을 실행합니다. 이 회사는 AWS Lambda 함수를 사용하여 S3 버킷에서 발생하는 이벤트에 대응하고 분석을 수행합니다.
Lambda 함수는 S3 버킷에서 데이터를 정리하고 AWS Glue 워크플로를 시작합니다. Lambda 함수는 128MB의 메모리와 512MB의 임시 스토리지를 사용합니다. Lambda 함수의 타임아웃은 15초입니다.
세 가지 함수 모두 성공적으로 실행되었지만, CPU 사용률이 100%에 육박하는 경우가 많아 성능 저하를 초래합니다. 회사는 이러한 함수들의 성능을 개선하고 파이프라인의 전체 실행 시간을 단축하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
Lambda 함수는 S3 버킷에서 데이터를 정리하고 AWS Glue 워크플로를 시작합니다. Lambda 함수는 128MB의 메모리와 512MB의 임시 스토리지를 사용합니다. Lambda 함수의 타임아웃은 15초입니다.
세 가지 함수 모두 성공적으로 실행되었지만, CPU 사용률이 100%에 육박하는 경우가 많아 성능 저하를 초래합니다. 회사는 이러한 함수들의 성능을 개선하고 파이프라인의 전체 실행 시간을 단축하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
