DEA-C01 문제 146
한 회사는 핵심 분석 작업을 지원하기 위해 ETL(추출, 변환 및 로드) 작업을 수행하는 데 사용하는 Amazon Redshift 프로비저닝 클러스터를 유지 관리합니다. 또한 회사 내 영업팀은 비즈니스 인텔리전스(BI) 작업을 위해 Redshift 클러스터를 유지 관리합니다.
최근 영업팀에서 주간 요약 분석 작업을 수행하기 위해 ETL Redshift 클러스터에 있는 데이터에 대한 접근 권한을 요청했습니다. 영업팀은 ETL 클러스터의 데이터와 영업팀의 BI 클러스터에 있는 데이터를 결합해야 합니다.
이 회사는 핵심 분석 작업을 중단하지 않고 영업팀과 ETL 클러스터 데이터를 공유할 수 있는 솔루션이 필요합니다. 또한, 이 솔루션은 ETL 클러스터의 컴퓨팅 리소스 사용량을 최소화해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
최근 영업팀에서 주간 요약 분석 작업을 수행하기 위해 ETL Redshift 클러스터에 있는 데이터에 대한 접근 권한을 요청했습니다. 영업팀은 ETL 클러스터의 데이터와 영업팀의 BI 클러스터에 있는 데이터를 결합해야 합니다.
이 회사는 핵심 분석 작업을 중단하지 않고 영업팀과 ETL 클러스터 데이터를 공유할 수 있는 솔루션이 필요합니다. 또한, 이 솔루션은 ETL 클러스터의 컴퓨팅 리소스 사용량을 최소화해야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
DEA-C01 문제 147
한 회사가 아마존 EC2 인스턴스에서 실행되는 애플리케이션을 개발 중입니다. 현재 이 애플리케이션에서 생성되는 데이터는 임시 데이터입니다. 하지만 회사는 EC2 인스턴스가 종료되더라도 데이터를 영구적으로 저장해야 합니다.
데이터 엔지니어는 Amazon Machine Image(AMI)에서 새 EC2 인스턴스를 시작하고 데이터를 보존하도록 인스턴스를 구성해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?
데이터 엔지니어는 Amazon Machine Image(AMI)에서 새 EC2 인스턴스를 시작하고 데이터를 보존하도록 인스턴스를 구성해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?
DEA-C01 문제 148
Snowpark에서 DataFrame 객체를 생성하는 데 사용할 수 있는 메서드는 무엇입니까? (세 가지를 선택하세요)
DEA-C01 문제 149
데이터 엔지니어가 간헐적으로 실패하는 AWS Glue 워크플로를 문제 해결하고 있습니다. 엔지니어는 실패의 원인이 데이터 품질 문제임을 파악했습니다. 향후 비즈니스 보고 팀은 워크플로가 실패할 때마다 이메일 알림을 받아야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?
어떤 솔루션이 이 요구 사항을 충족할까요?
DEA-C01 문제 150
현재 한 회사가 범용 Amazon EC2 인스턴스를 포함하는 프로비저닝된 Amazon EMR 클러스터를 사용하고 있습니다. 이 EMR 클러스터는 회사의 장시간 실행되는 Apache Spark ETL(추출, 변환 및 로드) 작업을 위해 1개에서 5개 사이의 태스크 노드로 EMR 관리형 스케일링을 사용합니다. 이 회사는 매일 ETL 작업을 실행합니다.
회사에서 ETL 작업을 실행하면 EMR 클러스터는 빠르게 5개 노드로 확장됩니다. EMR 클러스터는 종종 CPU 사용률이 최대치에 도달하지만 메모리 사용률은 30% 미만으로 유지됩니다.
해당 회사는 일일 ETL 작업 실행 비용을 줄이기 위해 EMR 클러스터 구성을 변경하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족할까요?
회사에서 ETL 작업을 실행하면 EMR 클러스터는 빠르게 5개 노드로 확장됩니다. EMR 클러스터는 종종 CPU 사용률이 최대치에 도달하지만 메모리 사용률은 30% 미만으로 유지됩니다.
해당 회사는 일일 ETL 작업 실행 비용을 줄이기 위해 EMR 클러스터 구성을 변경하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적으로 충족할까요?
