DP-203 문제 301

고객을 위한 JSON 파일이 포함된 Azure Data Lake Storage Gen2 계정이 있습니다. 파일에는 FirstName 및 LastName이라는 두 가지 속성이 포함되어 있습니다.
Azure Databricks를 사용하여 JSON 파일의 데이터를 Azure Synapse Analytics 테이블에 복사해야 합니다. FirstName 및 LastName 값을 연결하는 새 열을 만들어야 합니다.
다음 구성요소를 생성합니다.
Azure Synapse의 대상 테이블
Azure Blob 스토리지 컨테이너
서비스 주체
어떤 순서로 작업을 수행해야 합니까? 답변하려면 작업 목록에서 해당 작업을 답변 영역으로 이동하고 올바른 순서로 정렬하세요.

DP-203 문제 302

ADF1이라는 Azure Data Factory 인스턴스와 WS1 및 WS2라는 두 개의 Azure Synapse Analytics 작업 영역이 있습니다.
ADF1에는 다음 파이프라인이 포함되어 있습니다.
P1: 복사 활동을 사용하여 WS1의 전용 SQL 풀에 있는 분할되지 않은 테이블의 데이터를 Azure Data Lake Storage Gen2 계정으로 복사합니다. P2: 복사 활동을 사용하여 Azure Data Lake Storage Gen2 계정의 텍스트로 구분된 파일에서 데이터를 복사합니다. WS2의 전용 SQL 풀에 있는 분할되지 않은 테이블에 병렬성과 성능을 최대화하려면 P1과 P2를 구성해야 합니다.
각 파이프라인의 경우 복사 활동에 대해 어떤 데이터 세트 설정을 구성해야 하나요? 답변하려면 답변에서 적절한 옵션을 선택하세요.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

DP-203 문제 303

다양한 볼륨의 데이터를 수집하는 스트리밍 데이터 솔루션을 설계하고 있습니다.
생성 후에 파티션 수를 변경할 수 있는지 확인해야 합니다.
데이터를 수집하려면 어떤 서비스를 사용해야 합니까?

DP-203 문제 304

Azure Synapse Analytics 전용 SQL 풀에서 FactPurchase라는 팩트 테이블을 디자인하고 있습니다. 테이블에는 소매점 공급업체로부터의 구매가 포함되어 있습니다. FactPurchase에는 다음 열이 포함됩니다.

FactPurchase에는 매일 100만 행의 데이터가 추가되며 3년간의 데이터가 포함됩니다.
다음 쿼리와 유사한 Transact-SQL 쿼리가 매일 실행됩니다.
선택하다
공급업체키, StockItemKey, COUNT(*)
FactPurchase에서
DateKey >= 20210101인 경우
AND DateKey <= 20210131
공급자 키, StockItemKey별 그룹
쿼리 시간을 최소화하는 테이블 배포는 무엇입니까?

DP-203 문제 305

100TB의 데이터를 포함하는 Azure Data Lake Storage Gen2 컨테이너가 있습니다.
주 지역에서 중단이 발생하는 경우 컨테이너의 데이터를 보조 지역의 읽기 워크로드에 사용할 수 있는지 확인해야 합니다. 솔루션은 비용을 최소화해야 합니다.
어떤 유형의 데이터 중복성을 사용해야 합니까?