DP-203-KR 문제 151
Azure Synapse Analytics 전용 SQL 풀이 포함된 Azure 구독이 있습니다. 판매 데이터를 분석하고 다음을 포함하는 솔루션을 배포할 계획입니다.
* 195개의 행을 포함하는 Country라는 이름의 테이블
* 1억 개의 행을 포함할 Sales라는 테이블
* 지난 30일 동안 국가별, 고객별 총매출액을 확인하기 위한 쿼리 테이블을 생성해야 합니다. 솔루션은 쿼리 성능을 최대화해야 합니다.
스크립트를 어떻게 완성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

* 195개의 행을 포함하는 Country라는 이름의 테이블
* 1억 개의 행을 포함할 Sales라는 테이블
* 지난 30일 동안 국가별, 고객별 총매출액을 확인하기 위한 쿼리 테이블을 생성해야 합니다. 솔루션은 쿼리 성능을 최대화해야 합니다.
스크립트를 어떻게 완성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-203-KR 문제 152
ADF1이라는 Azure Data Factory 인스턴스와 WS1 및 WS2라는 두 개의 Azure Synapse Analytics 작업 영역이 있습니다.
ADF1에는 다음 파이프라인이 포함되어 있습니다.
P1: 복사 작업을 사용하여 WS1의 전용 SQL 풀에 있는 분할되지 않은 테이블에서 Azure Data Lake Storage Gen2 계정으로 데이터를 복사합니다. P2: 복사 작업을 사용하여 Azure Data Lake Storage Gen2 계정의 텍스트 구분 파일에서 데이터를 복사합니다. WS2의 전용 SQL 풀에 있는 분할되지 않은 테이블에 병렬 처리 및 성능을 최대화하려면 P1 및 P2를 구성해야 합니다.
각 파이프라인의 경우 복사 활동에 대해 어떤 데이터 세트 설정을 구성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

ADF1에는 다음 파이프라인이 포함되어 있습니다.
P1: 복사 작업을 사용하여 WS1의 전용 SQL 풀에 있는 분할되지 않은 테이블에서 Azure Data Lake Storage Gen2 계정으로 데이터를 복사합니다. P2: 복사 작업을 사용하여 Azure Data Lake Storage Gen2 계정의 텍스트 구분 파일에서 데이터를 복사합니다. WS2의 전용 SQL 풀에 있는 분할되지 않은 테이블에 병렬 처리 및 성능을 최대화하려면 P1 및 P2를 구성해야 합니다.
각 파이프라인의 경우 복사 활동에 대해 어떤 데이터 세트 설정을 구성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-203-KR 문제 153
Table1이라는 테이블이 포함된 Azure Synapse Analytics 전용 SQL 풀이 있습니다. Table1에는 다음이 포함됩니다.
10억 행
클러스터형 columnstore 인덱스
제품 키라는 해시 분산 열
날짜 데이터 형식이고 null일 수 없는 Sales Date라는 열이 매달 Table1에 3천만 개의 행이 추가됩니다.
Sales Date 열을 기준으로 Table1을 분할해야 합니다. 솔루션은 쿼리 성능과 데이터 로드를 최적화해야 합니다.
얼마나 자주 파티션을 만들어야 합니까?
10억 행
클러스터형 columnstore 인덱스
제품 키라는 해시 분산 열
날짜 데이터 형식이고 null일 수 없는 Sales Date라는 열이 매달 Table1에 3천만 개의 행이 추가됩니다.
Sales Date 열을 기준으로 Table1을 분할해야 합니다. 솔루션은 쿼리 성능과 데이터 로드를 최적화해야 합니다.
얼마나 자주 파티션을 만들어야 합니까?
DP-203-KR 문제 154
여러 회사를 지원할 Azure Synapse Analytics 전용 SQL 풀에 대한 보안 모델을 설계하고 있습니다. 각 회사의 사용자가 해당 회사의 데이터만 볼 수 있도록 해야 합니다. 솔루션에 어떤 두 개체를 포함해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다. 참고: 각 정답은 1점의 가치가 있습니다.
DP-203-KR 문제 155
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 영역에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자에게는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터가 할당되어야 합니다. 현재 세 명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자를 위한 표준 클러스터, 데이터 엔지니어를 위한 높은 동시성 클러스터 및 작업을 위한 높은 동시성 클러스터를 만듭니다.
이것이 목표를 달성합니까?
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 영역에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자에게는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터가 할당되어야 합니다. 현재 세 명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자를 위한 표준 클러스터, 데이터 엔지니어를 위한 높은 동시성 클러스터 및 작업을 위한 높은 동시성 클러스터를 만듭니다.
이것이 목표를 달성합니까?


