DEA-C01 문제 66

한 회사가 전 세계에 위치한 검사 시설로부터 검사 결과를 받습니다. 이 회사는 검사 결과를 수백만 개의 1KB 크기 JSON 파일 형태로 Amazon S3 버킷에 저장합니다. 데이터 엔지니어는 이 파일들을 처리하고, Apache Parquet 형식으로 변환한 후, Amazon Redshift 테이블에 로드해야 합니다. 데이터 엔지니어는 파일 처리를 위해 AWS Glue를, 프로세스 실행을 위한 오케스트레이션을 위해 AWS Step Functions를, 그리고 작업을 예약하기 위해 Amazon EventBridge를 사용합니다.
최근 회사가 테스트 시설을 추가하면서 파일 처리 시간이 증가하고 있습니다. 데이터 엔지니어는 데이터 처리 시간을 단축해야 합니다.
어떤 솔루션이 데이터 처리 시간을 가장 많이 줄여줄까요?

DEA-C01 문제 67

한 회사가 민감한 거래 데이터를 아마존 S3 버킷에 저장합니다. 데이터 엔지니어는 실수로 데이터가 삭제되는 것을 방지하기 위한 제어 기능을 구현해야 합니다. 이 요구 사항을 충족하는 솔루션은 무엇일까요?

DEA-C01 문제 68

데이터 엔지니어는 언제 수평 평면화 조합 대신 평면화 함수를 사용하여 테이블을 처리할까요?

DEA-C01 문제 69

데이터 엔지니어가 CSV 파일에서 다음 행들을 추출하여 다음과 같은 구조의 Snowflake 테이블에 로드하려고 합니다.

엔지니어는 다음과 같은 COPY INTO 문을 사용하고 있습니다.

하지만 다음과 같은 오류가 발생합니다.

오류를 해결하고 모든 데이터를 테이블에 성공적으로 로드하려면 어떤 파일 형식 옵션을 사용해야 합니까?

DEA-C01 문제 70

한 회사가 아마존 레드시프트를 데이터 웨어하우스로 사용하고 있습니다. 데이터 웨어하우스의 기존 테이블에는 데이터 인코딩이 적용되어 있습니다. 데이터 엔지니어는 일부 테이블에 적용된 압축 인코딩이 데이터에 가장 적합하지 않다는 것을 발견했습니다.
데이터 엔지니어는 인코딩이 최적화되지 않은 테이블의 데이터 인코딩을 개선해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?