DP-203 문제 46
Azure Databricks에서 구조화된 스트리밍 솔루션을 빌드할 계획입니다. 솔루션은 5분 간격으로 새 이벤트를 계산하고 해당 간격 동안 도착한 이벤트만 보고합니다. 출력은 Delta Lake 테이블로 전송됩니다.
어떤 출력 모드를 사용해야 합니까?
어떤 출력 모드를 사용해야 합니까?
DP-203 문제 47
Azure Stream Analytics를 사용하여 스트리밍 소셜 미디어 데이터를 수집할 계획입니다. 데이터는 Azure Data Lake Storage의 파일에 저장된 다음 Azure Synapse Analytics의 Azure Dataabricks 및 PolyBase를 사용하여 사용됩니다.
파일에 대한 Databricks 및 PolyBase의 쿼리에서 가능한 오류가 최소화되도록 Stream Analytics 데이터 출력 형식을 권장해야 합니다. 솔루션은 타일을 빠르게 쿼리할 수 있고 데이터 유형 정보가 유지되도록 해야 합니다.
무엇을 추천해야 할까요?
파일에 대한 Databricks 및 PolyBase의 쿼리에서 가능한 오류가 최소화되도록 Stream Analytics 데이터 출력 형식을 권장해야 합니다. 솔루션은 타일을 빠르게 쿼리할 수 있고 데이터 유형 정보가 유지되도록 해야 합니다.
무엇을 추천해야 할까요?
DP-203 문제 48
Azure Synaps Analytics 전용 SQL 풀에서 FactPurchase라는 팩트 테이블을 디자인하고 있습니다. 이 테이블에는 소매점에 대한 공급업체의 구매가 포함됩니다. FactPurchase에는 다음 열이 포함됩니다.

FactPurchase에는 매일 100만 행의 데이터가 추가되고 3년 동안의 데이터가 포함됩니다.
다음 쿼리와 유사한 Transact-SQL 쿼리가 매일 실행됩니다.


FactPurchase에는 매일 100만 행의 데이터가 추가되고 3년 동안의 데이터가 포함됩니다.
다음 쿼리와 유사한 Transact-SQL 쿼리가 매일 실행됩니다.

DP-203 문제 49
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 둘 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 공간에는 다음 세 가지 워크로드가 포함됩니다.
* Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드.
* Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드.
* 데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
* 데이터 엔지니어는 클러스터를 공유해야 합니다.
* 작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지된 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
* 모든 데이터 과학자는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터를 할당해야 합니다. 현재 3명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자에 대한 표준 클러스터, 데이터 엔지니어에 대한 높은 동시성 클러스터 및 작업에 대한 표준 클러스터를 생성합니다.
이것이 목표를 달성합니까?
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 공간에는 다음 세 가지 워크로드가 포함됩니다.
* Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드.
* Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드.
* 데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
* 데이터 엔지니어는 클러스터를 공유해야 합니다.
* 작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지된 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
* 모든 데이터 과학자는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터를 할당해야 합니다. 현재 3명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자에 대한 표준 클러스터, 데이터 엔지니어에 대한 높은 동시성 클러스터 및 작업에 대한 표준 클러스터를 생성합니다.
이것이 목표를 달성합니까?
DP-203 문제 50
다음 표에 표시된 사용자를 포함하는 Azure Synapse Analytics 전용 SQL 풀이 있습니다.

User1은 데이터베이스에서 쿼리를 실행하고 쿼리는 다음 예시에 표시된 결과를 반환합니다.

User1은 마스킹되지 않은 데이터에 액세스할 수 있는 유일한 사용자입니다.
드롭다운 메뉴를 사용하여 그래픽에 표시된 정보를 기반으로 각 문장을 완성하는 답안을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.


User1은 데이터베이스에서 쿼리를 실행하고 쿼리는 다음 예시에 표시된 결과를 반환합니다.

User1은 마스킹되지 않은 데이터에 액세스할 수 있는 유일한 사용자입니다.
드롭다운 메뉴를 사용하여 그래픽에 표시된 정보를 기반으로 각 문장을 완성하는 답안을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.


