DEA-C01 문제 86

한 회사는 자사 운영 데이터베이스에서 데이터를 추출, 변환 및 로드(ETL)하여 Amazon S3 기반 데이터 레이크로 전송하는 여러 ETL 워크플로우를 운영하고 있습니다. 이러한 ETL 워크플로우는 AWS Glue와 Amazon EMR을 사용하여 데이터를 처리합니다.
이 회사는 자동화된 오케스트레이션을 제공하고 수동 작업을 최소화하기 위해 기존 아키텍처를 개선하고자 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?

DEA-C01 문제 87

한 회사가 AWS Glue Apache Spark 작업을 사용하여 ETL(추출, 변환 및 로드) 워크로드를 처리합니다. 이 회사는 모든 AWS Glue 작업에 대해 로깅 및 모니터링을 활성화했습니다.
AWS Glue 작업 중 하나가 실패하기 시작했습니다. 데이터 엔지니어는 오류를 조사하고 작업 내 모든 개별 단계에 대한 지표를 검토하려고 합니다.
데이터 엔지니어는 어떻게 스테이지 메트릭에 접근할 수 있나요?

DEA-C01 문제 88

한 소매업체가 고객 주문 정보가 포함된 데이터 세트에 대한 ETL(추출, 변환 및 로드) 작업을 위해 AWS Glue를 사용하고 있습니다. 이 회사는 데이터의 정확성과 일관성을 보장하기 위해 특정 유효성 검사 규칙을 구현하고자 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?

DEA-C01 문제 89

연합 인증/SSO 사용과 관련하여 올바른 설명을 선택하십시오.

DEA-C01 문제 90

데이터 분석 조직 중 한 곳의 데이터 엔지니어인 알렉스는 데이터 보고 경험을 개선하기 위해 외부 테이블에 대한 구체화된 뷰를 만들었습니다.
1단계: 그는 DataReportMV라는 이름의 구체화된 뷰를 생성했습니다.
1. 구체화된 뷰 DataReportMV를 생성 또는 교체합니다.
2.Item_id,Item_price를 Items 테이블에서 선택합니다.
2단계: 그는 구체화된 뷰를 판매 테이블과 결합했습니다.
1. 수익 보기 생성 또는 교체
2.select m.item_id, sum(ifnull(s.quantity, 0)) as quantity,
3.sum(ifnull(quantity * (s.price - m.item_price), 0)) as profit
4.DataReportMV 테이블에서 m을 선택하고 sales 테이블과 s 테이블을 s.item_id = m.item_id로 왼쪽 외부 조인합니다.
5. m.item_id로 그룹화;
3단계: 1시간 후, 그는 비용 절감을 위해 DataRe-portMV 구체화된 뷰의 사용(및 유지 관리)을 일시적으로 중단하기로 결정했습니다.
구체화된 뷰 DataReportMV 일시 중지 변경;
알렉스가 여기서 잘못하고 있는 부분을 선택해 주세요.