Databricks-Certified-Data-Engineer-Professional 문제 61

DLT 파이프라인에는 다음과 같은 스트리밍 테이블이 포함됩니다.
Raw_lot은 심박수 추적 장치에서 원시 장치 측정 데이터를 수집합니다.
Bpm_stats는 raw_lot의 BPM 측정값을 기반으로 사용자 통계를 점진적으로 계산합니다.
데이터 엔지니어는 파이프라인 업데이트 실행 시 하위 테이블을 다시 계산하는 동안 raw_iot 테이블에서 수동으로 삭제되거나 업데이트된 레코드를 유지할 수 있도록 이 파이프라인을 어떻게 구성해야 할까요?

Databricks-Certified-Data-Engineer-Professional 문제 62

데이터 엔지니어링 팀의 한 구성원이 더 큰 데이터 파이프라인의 일부로 실행되도록 예약하려는 간단한 노트북 파일을 제출했습니다. 아래 제공된 명령어를 제시된 대로 실행하면 논리적으로 올바른 결과가 생성된다고 가정합니다.
최신 및 실제 공인 데이터 엔지니어 전문가 시험 문제와 답을 확인하세요.

노트북을 작업으로 예약하기 전에 어떤 명령어를 제거해야 할까요?

Databricks-Certified-Data-Engineer-Professional 문제 63

데이터 설계자는 레이크하우스의 모든 테이블을 외부 Delta Lake 테이블로 구성해야 한다고 지시했습니다.
어떤 접근 방식이 이 요구 사항을 충족시킬 수 있을까요?

Databricks-Certified-Data-Engineer-Professional 문제 64

데이터 과학 팀은 MLflow를 사용하여 프로덕션 모델을 생성하고 로그에 기록했습니다. 다음 코드는 프로덕션 모델을 올바르게 가져와 적용하여 "customer_id LONG, predictions DOUBLE, date DATE" 스키마를 가진 preds라는 새 DataFrame으로 예측 결과를 출력합니다.
최신 및 실제 공인 데이터 엔지니어 전문가 시험 문제와 답을 확인하세요.

데이터 과학 팀은 예측 결과를 Delta Lake 테이블에 저장하고, 시간 경과에 따른 모든 예측 결과를 비교할 수 있기를 원합니다. 고객 이탈 예측은 하루에 최대 한 번만 수행됩니다.
어떤 코드 블록이 잠재적인 컴퓨팅 비용을 최소화하면서 이 작업을 수행합니까?

Databricks-Certified-Data-Engineer-Professional 문제 65

분산된 데이터 분석가 팀이 자동 확장이 구성된 대화형 클러스터에서 컴퓨팅 리소스를 공유합니다. 워크스페이스 관리자는 비용과 쿼리 처리량을 더 효율적으로 관리하기 위해 클러스터 확장이 동시 사용자 수 증가 때문인지 아니면 리소스 집약적인 쿼리 때문인지 평가하고자 합니다.
클러스터 크기 조정 이벤트의 타임라인은 어디에서 확인할 수 있나요?