Data-Engineer-Associate-KR 문제 66

한 미디어 회사에서는 사용자 행동과 선호도에 따라 고객에게 미디어 콘텐츠를 추천하는 시스템을 개선하려고 합니다. 추천 시스템을 개선하려면 회사는 타사 데이터 세트의 통찰력을 회사의 기존 분석 플랫폼에 통합해야 합니다.
회사는 타사 데이터 세트를 통합하는 데 필요한 노력과 시간을 최소화하려고 합니다.
최소한의 운영 오버헤드로 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 67

한 회사에서는 AWS Glue 작업을 사용하여 여러 데이터 파이프라인을 구현합니다. 이 파이프라인은 회사에 매우 중요합니다.
회사는 파이프라인에 문제가 생기면 이해관계자에게 경고하는 모니터링 메커니즘을 구현해야 합니다.
어떤 솔루션이 운영 비용을 최소화하면서 이러한 요구 사항을 충족할 수 있을까요?

Data-Engineer-Associate-KR 문제 68

데이터 엔지니어는 AWS 서비스를 사용하여 데이터 세트를 Amazon S3 데이터 레이크로 수집해야 합니다. 데이터 엔지니어는 데이터 세트를 프로파일링하고 데이터 세트에 개인 식별 정보(PII)가 포함되어 있음을 발견합니다. 데이터 엔지니어는 데이터 세트를 프로파일링하고 PII를 난독화하는 솔루션을 구현해야 합니다.
최소한의 운영 노력으로 이 요구 사항을 충족할 수 있는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 69

보안 회사는 JSON 형식의 IoT 데이터를 Amazon S3 버킷에 저장합니다. 회사가 IoT 장치를 업그레이드하면 데이터 구조가 변경될 수 있습니다. 회사는 IoT 데이터가 포함된 데이터 카탈로그를 생성하려고 합니다. 회사의 분석 부서는 데이터 카탈로그를 사용하여 데이터를 색인화합니다.
이러한 요구 사항을 가장 비용 효율적으로 충족하는 솔루션은 무엇입니까?

Data-Engineer-Associate-KR 문제 70

회사는 회사 운영 데이터베이스의 데이터를 Amazon S3 기반 데이터 레이크로 수집하는 여러 추출, 변환 및 로드(ETL) 워크플로를 유지 관리합니다. ETL 워크플로는 AWS Glue 및 Amazon EMR을 사용하여 데이터를 처리합니다.
회사는 자동화된 조정을 제공하고 수동 작업을 최소화하기 위해 기존 아키텍처를 개선하려고 합니다.
최소한의 운영 오버헤드로 이러한 요구 사항을 충족하는 솔루션은 무엇입니까?