Databricks-Certified-Data-Engineer-Professional 문제 36

뷰는 다음 코드로 등록됩니다.

사용자와 주문 모두 Delta Lake 테이블입니다.
recent_orders 테이블을 조회했을 때의 결과를 설명하는 문장은 무엇입니까?

Databricks-Certified-Data-Engineer-Professional 문제 37

대규모 데이터셋을 다루는 성능이 중요한 애플리케이션에서 기존 PySpark UDF보다 Pandas UDF가 선호되는 이유는 무엇일까요?

Databricks-Certified-Data-Engineer-Professional 문제 38

데이터 팀의 구조화된 스트리밍 작업은 하위 마케팅 대시보드를 업데이트하기 위해 품목 판매량에 대한 집계 데이터를 계산하도록 구성되어 있습니다. 마케팅 팀은 각 품목에 대해 해당 프로모션 코드가 사용된 횟수를 추적하기 위한 새로운 필드를 추가했습니다. 주니어 데이터 엔지니어는 기존 쿼리를 다음과 같이 업데이트할 것을 제안했습니다. 제안된 변경 사항은 굵게 표시되어 있습니다.
원래 검색어:

제안된 질의:

제안된 쿼리를 실제 운영 환경에 적용하려면 어떤 단계를 추가로 완료해야 합니까?

Databricks-Certified-Data-Engineer-Professional 문제 39

다음 오류 추적 정보를 검토하십시오.

발생한 오류를 설명하는 문장은 무엇입니까?

Databricks-Certified-Data-Engineer-Professional 문제 40

신입 데이터 엔지니어에게 DataFrame df를 사용하여 그룹화된 집계를 수행하는 스트리밍 데이터 파이프라인을 개발하라는 요청이 있었습니다. 이 파이프라인은 겹치지 않는 5분 간격으로 평균 습도와 평균 온도를 계산해야 합니다. 또한, 늦게 도착하는 데이터의 경우 10분 동안 증분 상태 정보를 유지해야 합니다.
스트리밍 데이터프레임 df는 다음과 같은 스키마를 가지고 있습니다.
"장치 ID INT, 이벤트 시간 TIMESTAMP, 온도 FLOAT, 습도 FLOAT"
코드 블록:

이 과제를 완료하려면 코드 블록 안의 빈칸을 올바르게 채우는 답을 선택하세요.