DEA-C01 문제 46
데이터 엔지니어는 Amazon S3 버킷에 Apache Parquet 형식으로 저장된 객체에서 데이터를 읽어오는 일회성 작업을 수행해야 합니다. 데이터 엔지니어는 데이터의 특정 열 하나만 쿼리하면 됩니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?
DEA-C01 문제 47
데이터 엔지니어인 제프는 JSON 객체의 3개 데이터 로딩 스크립트에서 요소에 접근하는 과정에서 자신도 모르게 대문자를 사용했습니다. 예를 들어,
스크립트 1 --> fruits:apple.sweet
스크립트 2 --> 과일:사과.달콤한
스크립트 3 --> 과일:사과.달콤한
다음 중 옳은 설명은 무엇입니까?
스크립트 1 --> fruits:apple.sweet
스크립트 2 --> 과일:사과.달콤한
스크립트 3 --> 과일:사과.달콤한
다음 중 옳은 설명은 무엇입니까?
DEA-C01 문제 48
데이터 엔지니어로서 제품 관련 정보가 포함된 신제품 파일 세트를 Snowflake 내부 테이블에 로드해야 하는 요구 사항이 있습니다. 나중에 분석해 보니 일부 소스 파일이 이미 히스토리 배치에 로드된 것을 확인했습니다. 이를 확인하기 위해 스테이징된 데이터 파일의 메타데이터 열 'LAST_MODIFIED' 날짜를 확인했는데, 일부 파일의 LAST_MODIFIED 날짜가 64일보다 오래되었고, 초기 데이터 세트도 64일 전에 테이블에 로드된 것을 발견했습니다. 데이터 중복을 방지하기 위해 메타데이터가 만료된 소스 데이터 파일과 메타데이터를 사용할 수 있는 파일 세트를 함께 로드하는 가장 좋은 방법은 무엇일까요?
DEA-C01 문제 49
다음 중 옳은 문장을 고르시오:
ALTER DATABASE ... ENABLE FAILOVER TO ACCOUNTS 문을 사용하여 기본 데이터베이스에 대한 장애 조치를 조직 내 하나 이상의 계정으로 활성화하십시오.
설명 2. 기본 데이터베이스에 대한 장애 조치를 활성화하는 작업은 데이터 엔지니어가 지정된 계정에 기본 데이터베이스의 복제본을 생성하기 전이나 후에 수행할 수 있습니다.
ALTER DATABASE ... ENABLE FAILOVER TO ACCOUNTS 문을 사용하여 기본 데이터베이스에 대한 장애 조치를 조직 내 하나 이상의 계정으로 활성화하십시오.
설명 2. 기본 데이터베이스에 대한 장애 조치를 활성화하는 작업은 데이터 엔지니어가 지정된 계정에 기본 데이터베이스의 복제본을 생성하기 전이나 후에 수행할 수 있습니다.
DEA-C01 문제 50
한 회사가 Amazon Kinesis Data Streams의 데이터 스트림을 사용하여 여러 소스에서 트랜잭션 데이터를 수집합니다. 이 회사는 AWS Glue ETL(추출, 변환 및 로드) 파이프라인을 사용하여 스트림 데이터에서 이상치를 찾습니다. 워크플로가 이상치를 감지하면 Amazon SNS(Amazon Simple Notification Service) 토픽으로 알림을 보냅니다. SNS 토픽은 이상치에 대한 로그를 검색하고 Amazon S3 버킷에 저장하는 두 번째 워크플로를 시작합니다.
데이터 스트림 처리량이 많은 기간 동안 SNS 토픽으로의 알림 전송에 지연이 발생합니다. Amazon CloudWatch 로그를 분석한 결과, 트래픽이 많을 때 glue.driver.BlockManager.disk.diskSpaceUsed_MB 메트릭 값이 높게 나타나는 것을 확인했습니다. 이 문제를 해결해야 합니다.
어떤 솔루션이 최소한의 운영 노력으로 이 요구 사항을 충족할까요?
데이터 스트림 처리량이 많은 기간 동안 SNS 토픽으로의 알림 전송에 지연이 발생합니다. Amazon CloudWatch 로그를 분석한 결과, 트래픽이 많을 때 glue.driver.BlockManager.disk.diskSpaceUsed_MB 메트릭 값이 높게 나타나는 것을 확인했습니다. 이 문제를 해결해야 합니다.
어떤 솔루션이 최소한의 운영 노력으로 이 요구 사항을 충족할까요?
