DP-203 문제 251

Azure 구독이 있습니다.
준비 테이블과 차원 모델을 포함할 pool1이라는 Azure Synapse Analytics 전용 SQL 풀에 데이터 웨어하우스를 빌드할 계획입니다. Pool1에는 다음 테이블이 포함됩니다.

pool1에 대한 테이블 스토리지를 디자인해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* Staging.WebSessions에 대한 데이터 로드 작업 성능을 최대화합니다.
* 차원 모델에 대한 쿼리 보고를 위한 쿼리 시간을 최소화합니다.
각 테이블에 어떤 유형의 테이블 배포를 사용해야 합니까? 대답하려면 적절한 테이블 배포 유형을 올바른 테이블로 드래그하세요. 각 테이블 배포 유형은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 내용을 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수도 있습니다.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

DP-203 문제 252

다음 그림과 같이 Azure Synapse 작업 영역에 대한 Azure Data Lake Storage Gen2에 파일과 폴더가 있습니다.

LOCATION='/topfolder/'가 있는 ExtTable이라는 외부 테이블을 생성합니다.
Azure Synapse Analytics 서버리스 SQL 풀을 사용하여 ExtTable을 쿼리하면 어떤 파일이 반환되나요?

DP-203 문제 253

Azure Data Lake Storage Gen 2 계정을 사용하여 요금소에서 페타바이트 규모의 자동차 번호판 사진을 저장하는 애플리케이션을 디자인하고 있습니다. 계정은 ZRS(영역 중복 저장소)를 사용합니다.
다음과 같은 사용 패턴을 식별합니다.
* 데이터가 생성된 후 처음 30일 동안 하루에 여러 번 데이터에 액세스합니다. 데이터는 99.9%의 가용성 SU를 충족해야 합니다.
* 90일 이후에는 데이터에 자주 액세스하지 않지만 30초 이내에 사용할 수 있어야 합니다.
* 365일 이후에는 데이터에 자주 액세스하지 않지만 5분 이내에 사용할 수 있어야 합니다.

DP-203 문제 254

CSV 파일에서 데이터를 수집하고, 열을 지정된 데이터 유형으로 캐스팅하고, Azure Synapse Analytic 전용 SQL 풀의 테이블에 데이터를 삽입하는 Azure Data Factory 데이터 흐름을 만듭니다. CSV 파일에는 사용자 이름, 설명 및 날짜라는 세 개의 열이 포함되어 있습니다.
데이터 흐름에는 이미 다음이 포함되어 있습니다.
* 소스 변환.
* 적절한 데이터 유형을 설정하기 위한 파생 열 변환.
* 데이터를 풀에 저장하기 위한 싱크 변환.
데이터 흐름이 다음 요구 사항을 충족하는지 확인해야 합니다.
* 유효한 행은 모두 대상 테이블에 기록되어야 합니다.
* 댓글란의 잘림 오류는 사전에 방지해야 합니다.
* 삽입 시 잘림 오류를 발생시키는 주석 값이 포함된 모든 행은 Blob Storage의 파일에 기록되어야 합니다.
어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

DP-203 문제 255

Azure Databricks에서 PySpark를 사용하여 다음 JSON 입력을 구문 분석합니다.

다음 표 형식으로 데이터를 출력해야 합니다.

PySpark 코드를 어떻게 완성해야 합니까? 대답하려면 적절한 값을 올바른 대상으로 드래그하세요. 각 값은 한 번만 사용되거나 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 내용을 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수도 있습니다.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.