DEA-C01 문제 116

한 회사가 Amazon RDS에서 실행되는 고객 데이터베이스에서 데이터를 읽어옵니다. 이 데이터베이스에는 일관성이 없는 필드가 많습니다. 예를 들어, 한 데이터베이스에서는 place_id로 명명된 고객 레코드 필드가 다른 데이터베이스에서는 location_id로 명명되어 있습니다. 이 회사는 고객 레코드 필드가 일치하지 않더라도 서로 다른 데이터베이스 간의 고객 레코드를 연결해야 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?

DEA-C01 문제 117

검색 최적화 서비스에 가장 적합한 사용 사례는 무엇일까요?

DEA-C01 문제 118

한 회사가 비즈니스 인텔리전스 보고서 작성을 위한 데이터 처리용 새로운 데이터 파이프라인을 구축했습니다. 그런데 사용자들이 보고서에서 데이터가 누락된 것을 발견했습니다.
데이터 엔지니어는 데이터가 저장소에 추가되기 전 단계에서 null 값을 포함하는 열과 참조 무결성에 대한 데이터 품질 검사를 추가해야 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?

DEA-C01 문제 119

한 회사가 아마존 EMR 클러스터에서 실행되는 아파치 스파크 작업을 사용하여 스트리밍 데이터를 처리하려고 합니다. 스파크 작업은 데이터를 변환하여 아마존 S3 버킷에 저장합니다. 회사는 아마존 아테나를 사용하여 데이터를 분석할 예정입니다.
회사는 분석 쿼리에 최적화된 데이터 형식을 필요로 합니다.
다음 요구 사항을 충족하면서 쿼리 시간이 가장 짧은 솔루션은 무엇입니까? (두 가지를 선택하십시오.)

DEA-C01 문제 120

한 회사가 AWS Organizations의 조직을 사용하여 여러 AWS 계정을 관리합니다. 이 회사는 Amazon Kinesis Data Streams에서 향상된 팬아웃 데이터 스트림을 사용하여 여러 프로듀서로부터 스트리밍 데이터를 수신합니다. 이 데이터 스트림은 Account A라는 계정에서 실행됩니다. 회사는 Account B라는 계정에 있는 AWS Lambda 함수를 사용하여 이 데이터 스트림의 데이터를 처리하려고 합니다. 이를 위해 회사는 Account B에 Account A의 데이터 스트림에 접근할 수 있는 권한을 가진 Lambda 실행 역할을 생성합니다.
이 요건을 충족하기 위해 회사는 어떤 추가적인 조치를 취해야 합니까?