DP-203 문제 67

Azure Data Lake Storage Gen2 컨테이너가 있습니다.
데이터는 컨테이너로 수집된 다음 데이터 통합 ​​애플리케이션에 의해 변환됩니다. 그 이후에는 데이터가 수정되지 않습니다. 사용자는 컨테이너의 파일을 읽을 수 있지만 파일을 수정할 수는 없습니다.
다음 요구 사항을 충족하는 데이터 보관 솔루션을 설계해야 합니다.
새로운 데이터는 자주 액세스되며 가능한 한 빨리 사용할 수 있어야 합니다.
5년 이상 된 데이터는 드물게 액세스되지만 요청 시 1초 이내에 사용할 수 있어야 합니다.
7년이 지난 데이터는 액세스할 수 없습니다. 7년 후 데이터는 가능한 가장 낮은 비용으로 유지되어야 합니다.
필요한 가용성을 유지하면서 비용을 최소화해야 합니다.
데이터를 어떻게 관리해야 할까요? 답변하려면 답변에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-203 문제 68

가상 네트워크 서비스 엔드포인트가 구성된 Azure Data Lake Storage 계정이 있습니다.
Azure Data Factory를 사용하여 Data Lake Storage 계정에서 데이터를 추출할 계획입니다. 그런 다음 데이터는 PolyBase를 사용하여 Azure Synapse Analytics의 데이터 웨어하우스에 로드됩니다.
Data Lake Storage에 액세스하려면 어떤 인증 방법을 사용해야 합니까?

DP-203 문제 69

SQL 서버에서 Azure Data Lake Storage로 일일 인벤토리 데이터를 가져오기 위해 어떤 Azure Data Factory 구성 요소를 함께 사용하는 것이 좋습니까? 응답하려면 응답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-203 문제 70

Azure Synapse Analytics 전용 SQL 풀을 설계하고 있습니다.
그룹은 다음 표와 같이 풀의 민감한 데이터에 액세스할 수 있습니다.

민감한 데이터에 대한 정책이 있습니다.
ㅏ. 정책은 다음 표와 같이 지역에 따라 다릅니다.

각 지역에 대한 환자 테이블이 있습니다. 테이블에는 다음과 같은 잠재적으로 민감한 열이 포함되어 있습니다.

규정 준수를 유지하기 위해 동적 데이터 마스킹을 설계하고 있습니다.
다음 각 문에 대해 해당 문이 참이면 예를 선택합니다. 그렇지 않으면 아니오를 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-203 문제 71

참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 둘 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 공간에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지된 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터를 할당해야 합니다. 현재 3명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자에 대한 표준 클러스터, 데이터 엔지니어에 대한 높은 동시성 클러스터 및 작업에 대한 높은 동시성 클러스터를 만듭니다.
이것이 목표를 달성합니까?