DEA-C01 문제 136
Snowflake 내부 스테이지에 로드해야 하는 소스 파일 목록이 50개 있다고 가정해 보겠습니다. 이 소스 시스템 파일들은 모두 Brotli로 압축된 파일입니다. 스테이지 파일 압축과 관련하여 다음 중 어떤 설명이 맞습니까?
DEA-C01 문제 137
한 소매 회사가 거래 내역, 매장 위치 및 고객 정보 테이블을 예약된 ra3.4xlarge Amazon Redshift 클러스터 노드 4개에 저장합니다. 세 테이블 모두 균등 테이블 분산 방식을 사용합니다.
해당 회사는 매장 위치 정보를 몇 년에 한두 번 정도만 업데이트합니다.
데이터 엔지니어는 대부분의 쿼리에서 전체 매장 위치 테이블이 4개의 컴퓨팅 노드 모두에 지속적으로 브로드캐스트되면서 Redshift 큐 속도가 느려지는 것을 발견했습니다. 이 데이터 엔지니어는 매장 위치 테이블의 브로드캐스트를 최소화하여 쿼리 성능을 향상시키고자 합니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적인 방식으로 충족할까요?
해당 회사는 매장 위치 정보를 몇 년에 한두 번 정도만 업데이트합니다.
데이터 엔지니어는 대부분의 쿼리에서 전체 매장 위치 테이블이 4개의 컴퓨팅 노드 모두에 지속적으로 브로드캐스트되면서 Redshift 큐 속도가 느려지는 것을 발견했습니다. 이 데이터 엔지니어는 매장 위치 테이블의 브로드캐스트를 최소화하여 쿼리 성능을 향상시키고자 합니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적인 방식으로 충족할까요?
DEA-C01 문제 138
데이터 엔지니어가 AWS Glue 크롤러를 사용하여 Amazon S3 버킷에 있는 데이터를 카탈로그화하고 있습니다.
S3 버킷에는 .csv 파일과 .json 파일이 모두 포함되어 있습니다. 데이터 엔지니어는 크롤러가 카탈로그에서 .json 파일을 제외하도록 구성했습니다.
데이터 엔지니어가 Amazon Athena에서 쿼리를 실행할 때, 제외된 .json 파일도 함께 처리되는 문제가 발생합니다. 데이터 엔지니어는 이 문제를 해결하고자 하며, 소스 S3 버킷의 .csv 파일에 대한 접근 권한에는 영향을 주지 않는 해결책을 필요로 합니다.
어떤 솔루션이 가장 짧은 쿼리 시간으로 이 요구 사항을 충족할까요?
S3 버킷에는 .csv 파일과 .json 파일이 모두 포함되어 있습니다. 데이터 엔지니어는 크롤러가 카탈로그에서 .json 파일을 제외하도록 구성했습니다.
데이터 엔지니어가 Amazon Athena에서 쿼리를 실행할 때, 제외된 .json 파일도 함께 처리되는 문제가 발생합니다. 데이터 엔지니어는 이 문제를 해결하고자 하며, 소스 S3 버킷의 .csv 파일에 대한 접근 권한에는 영향을 주지 않는 해결책을 필요로 합니다.
어떤 솔루션이 가장 짧은 쿼리 시간으로 이 요구 사항을 충족할까요?
DEA-C01 문제 139
테이블의 클러스터링 메타데이터를 보거나 모니터링하기 위해 Snowflake는 다음 시스템 기능 중 어떤 기능을 제공합니까?
DEA-C01 문제 140
데이터 엔지니어는 이벤트 알림을 사용하여 데이터 로드를 자동화하는 기존 파이프라인을 사용하고 있었는데, 나중에 파이프라인 속성을 수정해야 할 필요성을 느꼈습니다. 이에 따라 그는 모범 사례를 따라 파이프라인을 새로 만들기로 결정하고 다음과 같은 단계를 따랐습니다.
1. SYSTEM$PIPE_STATUS 함수를 조회하여 파이프 실행 상태가 RUN-NING인지 확인합니다.
2. 파이프를 다시 생성합니다(파이프 생성 또는 교체 기능 사용).
3. SYSTEM$PIPE_STATUS 함수를 조회하고 파이프 실행 상태가 RUN-NING인지 확인합니다.
자동 데이터 로드를 위한 파이프를 재구성할 때 누락된 권장 단계는 무엇입니까?
1. SYSTEM$PIPE_STATUS 함수를 조회하여 파이프 실행 상태가 RUN-NING인지 확인합니다.
2. 파이프를 다시 생성합니다(파이프 생성 또는 교체 기능 사용).
3. SYSTEM$PIPE_STATUS 함수를 조회하고 파이프 실행 상태가 RUN-NING인지 확인합니다.
자동 데이터 로드를 위한 파이프를 재구성할 때 누락된 권장 단계는 무엇입니까?
