DEA-C01 문제 131

한 회사가 아마존 S3 스탠다드 버킷을 사용하여 아파치 아이스버그 테이블을 활용하는 자체 관리형 트랜잭션 데이터 레이크를 유지 관리합니다. 이 데이터 레이크는 실시간 및 배치 방식으로 데이터를 수집합니다.
사용자들이 실시간 테이블의 성능 저하를 보고했습니다. 데이터 엔지니어는 실시간 테이블을 검토한 결과, 테이블이 여러 개의 작은 데이터 파일로 구성되어 있음을 발견했습니다. 데이터 엔지니어는 실시간 테이블의 성능을 개선해야 합니다.
어떤 솔루션이 이 요구 사항을 충족할까요?

DEA-C01 문제 132

한 회사가 애플리케이션의 데이터를 프로비저닝된 용량 모드로 작동하는 Amazon DynamoDB 테이블에 저장합니다. 해당 애플리케이션의 워크로드는 일정한 일정에 따라 예측 가능한 처리량 부하를 보입니다. 매주 월요일 아침 일찍에는 활동량이 급격히 증가합니다.
해당 애플리케이션은 주말에 사용량이 매우 적습니다.
회사는 사용량이 가장 많은 시간대에도 애플리케이션이 안정적으로 작동하도록 보장해야 합니다.
어떤 솔루션이 이러한 요구 사항을 가장 비용 효율적인 방식으로 충족할까요?

DEA-C01 문제 133

ACCOUNTADMIN 역할이 아닌 사용자가 데이터 공유 작업을 수행할 수 있도록 하기 위해 Snowflake에서 제공하는 두 가지 전역/계정 권한은 무엇입니까?

DEA-C01 문제 134

한 회사가 매일 500GB의 시청자 및 광고 데이터를 처리하고, AWS Glue 데이터 카탈로그에 등록된 스키마를 사용하여 CSV 파일을 Amazon S3에 저장합니다. 이 회사는 해당 파일을 Apache Parquet 형식으로 변환하여 S3 버킷에 저장해야 합니다.
이 솔루션은 데이터를 동시에 처리하기 위해 15GiB의 메모리 용량을 갖춘 장시간 실행 워크플로우가 필요하며, 그 후 앞의 두 프로세스가 완료된 후에야 상관 관계 분석 프로세스가 시작됩니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?

DEA-C01 문제 135

한 회사가 JSON 형식과 CSV 형식의 데이터 세트를 Amazon S3 버킷에 저장합니다. 또한 Amazon RDS for Microsoft SQL Server 데이터베이스, 프로비저닝된 용량 모드로 설정된 Amazon DynamoDB 테이블, 그리고 Amazon Redshift 클러스터를 보유하고 있습니다. 데이터 엔지니어링 팀은 데이터 과학자들이 SQL과 유사한 구문을 사용하여 모든 데이터 소스를 쿼리할 수 있는 솔루션을 개발해야 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?