Databricks-Certified-Data-Engineer-Professional 문제 46

데이터 엔지니어가 의료비 청구 데이터를 처리하기 위해 Lakeflow Declarative Pipelines 파이프라인을 구축하고 있습니다. 메타데이터 JSON 파일에는 다음을 포함한 여러 테이블에 대한 데이터 품질 규칙이 정의되어 있습니다.
{
"주장": [
{"name": "valid_patient_id", "constraint": "patient_id IS NOT NULL"},
{"name": "음수가 아닌 금액", "constraint": "청구 금액 >= 0"}
]
}
파이프라인은 규칙을 하드코딩하지 않고 이러한 규칙을 클레임 테이블에 동적으로 적용해야 합니다.
데이터 엔지니어는 어떻게 이를 달성해야 할까요?

Databricks-Certified-Data-Engineer-Professional 문제 47

데이터 관리팀은 개인 식별 정보(PII)가 포함된 "사용자" 테이블의 사회 보장 번호(SSN) 열에 적절한 마스킹 처리를 적용해야 한다는 요구 사항을 도입했습니다. 즉, HRAdminGroup 외부의 사용자는 마스킹 처리된 사회 보장 번호를 ***-**- 형식으로 볼 수 있습니다.
****.
팀은 마스킹 기능을 개발했습니다.

데이터 거버넌스 팀이 이 목표를 달성하기 위해 다음에 해야 할 일은 무엇입니까?

Databricks-Certified-Data-Engineer-Professional 문제 48

개발자가 Databricks 리포지토리에 대한 자격 증명을 성공적으로 구성하고 원격 Git 리포지토리를 복제했습니다. 하지만 현재 작업 공간에 보이는 유일한 브랜치인 메인 브랜치에 대한 변경 권한이 없습니다.
Response를 사용하여 원격 Git 저장소의 커밋에서 변경 사항을 가져오고, 가져온 변경 사항이 나타난 브랜치로 변경 사항을 푸시할 수 있습니다.

Databricks-Certified-Data-Engineer-Professional 문제 49

데이터 엔지니어링 팀의 주니어 멤버가 Databricks 노트북의 언어 상호 운용성을 탐색하고 있습니다. 아래 코드의 목표는 geo_lookup 테이블에 있는 아프리카 대륙 국가에서 발생한 모든 판매 내역을 표시하는 것입니다.
코드를 실행하기 전에 현재 데이터베이스에서 SHOW TABLES 명령을 실행하면 데이터베이스에 geo_lookup과 sales라는 두 개의 테이블만 있는 것으로 나타납니다.

대화형 노트북에서 이러한 명령 셀을 순서대로 실행했을 때의 결과를 올바르게 설명하는 문장은 무엇입니까?

Databricks-Certified-Data-Engineer-Professional 문제 50

야간 작업은 다음 코드를 사용하여 Delta Lake 테이블에 데이터를 수집합니다.

파이프라인의 다음 단계에서는 파이프라인의 다음 테이블로 아직 처리되지 않은 새 레코드를 조작하는 데 사용할 수 있는 객체를 반환하는 함수가 필요합니다.
다음 코드 조각 중 어떤 것이 이 함수 정의를 완성합니까?