DP-203 문제 196

Pool1이라는 Azure Synapse Analytics 전용 SQL 풀이 있습니다. Pool1에는 table1이라는 테이블이 포함되어 있습니다.
5TB의 데이터를 table1에 로드합니다.
table1에 대해 Columnstore 압축이 최대화되었는지 확인해야 합니다.
어떤 명령문을 실행해야 합니까?

DP-203 문제 197

회사를 위한 데이터 엔지니어링 솔루션을 개발합니다.
프로젝트에는 Azure Data Lake Storage에 데이터를 배포해야 합니다.
프로젝트 구성원이 Azure Data Lake Storage 리소스를 관리할 수 있도록 RBAC(역할 기반 액세스 제어)를 구현해야 합니다.
어떤 세 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

DP-203 문제 198

Azure Databricks에서 PySpark를 사용하여 다음 JSON 입력을 구문 분석합니다.

다음 표 형식으로 데이터를 출력해야 합니다.

PySpark 코드를 어떻게 완성해야 합니까? 대답하려면 적절한 값을 올바른 대상으로 드래그하세요. 각 값은 한 번만 사용되거나 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 내용을 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수도 있습니다.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.

DP-203 문제 199

Azure Databricks에서 하루에 한 번씩 일괄 처리를 수행할 계획입니다.
어떤 유형의 Databricks 클러스터를 사용해야 하나요?

DP-203 문제 200

매일 200,000개의 새 파일을 생성하는 Azure Storage 계정이 있습니다. 파일 이름의 형식은 {YYYY}/{MM}/{DD}/{HH}/{CustomerID}.csv입니다.
한 시간에 한 번씩 스토리지 계정에서 Azure Data Lake로 새 데이터를 로드하는 Azure Data Factory 솔루션을 설계해야 합니다. 솔루션은 로드 시간과 비용을 최소화해야 합니다.
솔루션을 어떻게 구성해야 합니까? 답변하려면 답변 영역에서 적절한 옵션을 선택하세요.
참고: 올바른 선택은 각각 1점의 가치가 있습니다.