무료 온라인 액세스 Databricks.Databricks-Certified-Data-Engineer-Professional.v2026-06-15.q112 모의 시험 (Page 10)

Databricks-Certified-Data-Engineer-Professional 문제 41

한 회사가 여러 데이터 소스에 걸쳐 Lakehouse Federation을 구현하려고 하지만, 데이터 일관성과 모든 팀이 동일한 공식 버전의 데이터에 액세스하는 것을 보장하는 데 우려를 가지고 있습니다. Lakehouse Federation이 데이터 일관성을 유지하기 위해 적용되는 설명은 무엇입니까?

A. 페더레이션은 소스 시스템의 현재 상태를 반영하는 읽기 전용 액세스를 제공합니다.

B. 연합은 모든 소스에서 변경 데이터 캡처(CDC)를 구현합니다.

C. 별도의 데이터 동기화 서비스를 배포해야 합니다.

D. 페더레이션은 수동으로 새로 고쳐야 하는 로컬 복사본을 생성합니다.

Databricks-Certified-Data-Engineer-Professional 문제 42

데이터 파이프라인은 구조화된 스트리밍 방식을 사용하여 Kafka에서 Delta Lake로 데이터를 수집합니다. 데이터는 Bronze 테이블에 저장되며, Kafka에서 생성된 타임스탬프, 키, 값이 포함됩니다. 파이프라인 배포 후 3개월이 지난 시점에서 데이터 엔지니어링 팀은 특정 시간대에 지연 현상이 발생하는 것을 발견했습니다.
선임 데이터 엔지니어가 Delta 테이블의 스키마와 데이터 수집 로직을 업데이트하여 Apache Spark에서 기록한 현재 타임스탬프와 Kafka 토픽 및 파티션 정보를 포함시켰습니다. 팀은 추가된 메타데이터 필드를 활용하여 일시적인 처리 지연 현상을 진단할 계획입니다.
이 문제를 진단하는 과정에서 팀은 어떤 제약에 직면하게 될까요?

A. 새로운 필드는 과거 기록에 대해 계산되지 않습니다.

B. 테이블 스키마를 업데이트하면 Delta 트랜잭션 로그 메타데이터가 무효화됩니다.

C. 테이블 스키마를 업데이트하려면 추가되는 각 파일에 대해 기본값을 제공해야 합니다.
최신 및 실제 공인 데이터 엔지니어 전문가 시험 문제와 답을 확인하세요.

D. Spark는 Kafka 소스에서 토픽 파티션 필드를 가져올 수 없습니다.

E. 운영 환경의 Delta 테이블에는 새 필드를 추가할 수 없습니다.

Databricks-Certified-Data-Engineer-Professional 문제 43

데이터 엔지니어가 Delta Lake에서 배치 데이터와 스트리밍 데이터를 모두 처리해야 하는 추가 전용 파이프라인을 설계하고 있습니다. 팀은 스트리밍 구성 요소가 이미 처리된 데이터를 효율적으로 추적할 수 있도록 해야 합니다. 이를 위해 어떤 설정을 해야 할까요?

A. 스키마 덮어쓰기

B. 파티션By

C. 체크포인트 위치

D. 병합 스키마

Databricks-Certified-Data-Engineer-Professional 문제 44

뷰 업데이트는 고객 테이블에 삽입 또는 업데이트될 모든 새로 수집된 데이터의 증분 배치를 나타냅니다.
이러한 기록을 처리하는 데에는 다음과 같은 논리가 사용됩니다.
고객과 합병하세요
사용 (
SELECT updates.customer_id as merge_ey, updates .*
업데이트에서
유니온 올
merge_key로 NULL을 선택하고 업데이트를 실행합니다.
업데이트에서 참여하세요
ON updates.customer_id = customers.customer_id
WHERE customers.current = true AND updates.address <> customers.address ) staged_updates ON customers.customer_id = mergekey WHEN MATCHED AND customers.current = true AND customers.address <> staged_updates.address THEN UPDATE SET current = false, end_date = staged_updates.effective_date WHEN NOT MATCHED THEN INSERT (customer_id, address, current, effective_date, end_date) VALUES (staged_updates.customer_id, staged_updates.address, true, staged_updates.effective_date, null) 이 구현을 설명하는 문장은 무엇입니까?

A. 고객 테이블은 Type 2 테이블로 구현되어 있으며, 기존 값은 덮어쓰여지고 신규 고객은 추가됩니다.

B. 고객 테이블은 타입 1 테이블로 구현되어 있으며, 기존 값은 새 값으로 덮어쓰여지고 이력은 유지되지 않습니다.

C. 고객 테이블은 Type 2 테이블로 구현됩니다. 기존 값은 유지되지만 더 이상 사용되지 않는 것으로 표시되고 새 값이 삽입됩니다.

D. 고객 테이블은 Type 0 테이블로 구현되어 있으며, 모든 쓰기 작업은 기존 값을 변경하지 않고 새로운 값을 추가하는 방식으로만 수행됩니다.

Databricks-Certified-Data-Engineer-Professional 문제 45

상위 소스는 Parquet 데이터를 시간 단위로 현재 날짜로 명명된 디렉터리에 배치 형식으로 저장합니다. 야간 배치 작업은 날짜 변수에 지정된 날짜의 전날 데이터를 모두 가져오기 위해 다음 코드를 실행합니다.

customer_id와 order_id 필드가 각 주문을 고유하게 식별하는 복합 키 역할을 한다고 가정합니다.
상위 시스템에서 단일 주문에 대해 몇 시간 간격으로 중복 항목이 생성되는 경우가 있는 것으로 알려져 있다면, 다음 중 어떤 설명이 맞습니까?

A. orders 테이블에 기록되는 각 항목은 고유한 레코드만 포함하며, 대상 테이블에 중복되지 않는 레코드만 기록됩니다.

B. orders 테이블에 기록되는 각 항목에는 고유한 레코드만 포함되지만, 새로 기록되는 레코드에는 대상 테이블에 이미 존재하는 중복 레코드가 포함될 수 있습니다.

C. orders 테이블에 대한 각 쓰기 작업에는 고유한 레코드만 포함됩니다. 대상 테이블에 동일한 키를 가진 기존 레코드가 있는 경우 해당 레코드는 덮어쓰여집니다.

D. orders 테이블에 대한 각 쓰기 작업에는 고유한 레코드만 포함됩니다. 대상 테이블에 동일한 키를 가진 기존 레코드가 있는 경우 작업이 지연됩니다.

E. 주문 테이블에 데이터를 기록할 때마다 새 레코드와 기존 레코드의 합집합에 대해 중복 제거가 실행되어 중복 레코드가 발생하지 않도록 합니다.

최근 업로드: 119Salesforce.Salesforce-AI-Specialist.v2026-06-19.q86; 124Oracle.1Z1-948.v2026-06-19.q40; 195EXIN.ITILFNDv4.v2026-06-18.q182; 166Adobe.AD0-E605.v2026-06-18.q77; 186Huawei.H12-831_V1.0-ENU.v2026-06-18.q172; 162Microsoft.MB-700.v2026-06-18.q349; 190PECB.ISO-9001-Lead-Auditor.v2026-06-18.q188; 135Peoplecert.ITIL-4-Specialist-High-velocity-IT.v2026-06-18.q43; 135RedHat.EX280.v2026-06-18.q12; 132Juniper.JN0-481.v2026-06-18.q70