Databricks-Certified-Data-Engineer-Professional 문제 76
데이터 엔지니어는 삭제 벡터가 활성화된 Delta 테이블 orders를 가지고 있습니다. 엔지니어는 다음 명령을 실행합니다.
상태가 '취소됨'인 주문 목록을 삭제합니다.
삭제 벡터는 명령이 실행될 때 어떤 동작을 보여야 합니까?
상태가 '취소됨'인 주문 목록을 삭제합니다.
삭제 벡터는 명령이 실행될 때 어떤 동작을 보여야 합니까?
Databricks-Certified-Data-Engineer-Professional 문제 77
상위 시스템에서 특정 데이터 배치에 대한 날짜를 매개변수로 Databricks Jobs API에 전달하도록 구성되었습니다. 예약된 노트북은 이 매개변수를 사용하여 다음 코드로 데이터를 로드합니다.
df = spark.read.format("parquet").load(f"/mnt/source/(date)")
위 코드 블록에서 사용된 날짜 파이썬 변수를 생성하려면 어떤 코드 블록을 사용해야 할까요?
df = spark.read.format("parquet").load(f"/mnt/source/(date)")
위 코드 블록에서 사용된 날짜 파이썬 변수를 생성하려면 어떤 코드 블록을 사용해야 할까요?
Databricks-Certified-Data-Engineer-Professional 문제 78
날씨 기록을 저장하는 Delta 테이블은 날짜별로 분할되어 있으며 다음과 같은 스키마를 가지고 있습니다.
날짜(DATE), 장치 ID(INT), 온도(FLOAT), 위도(FLOAT), 경도(FLOAT)
북극권 내의 모든 기록을 찾으려면 아래 필터를 사용하여 쿼리를 실행합니다.
위도 > 66.3
다음 중 Delta 엔진이 로드할 파일을 식별하는 방법을 설명하는 문장은 무엇입니까?
날짜(DATE), 장치 ID(INT), 온도(FLOAT), 위도(FLOAT), 경도(FLOAT)
북극권 내의 모든 기록을 찾으려면 아래 필터를 사용하여 쿼리를 실행합니다.
위도 > 66.3
다음 중 Delta 엔진이 로드할 파일을 식별하는 방법을 설명하는 문장은 무엇입니까?
Databricks-Certified-Data-Engineer-Professional 문제 79
데이터 엔지니어링 팀은 다음 코드를 유지 관리합니다.

이 코드가 논리적으로 올바른 결과를 생성하고 원본 테이블의 데이터가 중복 제거 및 유효성 검사를 거쳤다고 가정할 때, 이 코드가 실행될 때 발생하는 상황을 설명하는 문장은 무엇입니까?

이 코드가 논리적으로 올바른 결과를 생성하고 원본 테이블의 데이터가 중복 제거 및 유효성 검사를 거쳤다고 가정할 때, 이 코드가 실행될 때 발생하는 상황을 설명하는 문장은 무엇입니까?
Databricks-Certified-Data-Engineer-Professional 문제 80
Databricks를 처음 사용하는 사용자가 작업 중인 파이프라인 로직의 실행 시간이 너무 오래 걸리는 문제를 해결하려고 합니다. 현재 사용자는 display() 호출을 사용하여 코드를 셀 단위로 실행하면서 새로운 변환이 작업에 추가될 때 코드가 논리적으로 올바른 결과를 생성하는지 확인하고 있습니다. 평균 실행 시간을 측정하기 위해 각 셀을 대화형으로 여러 번 실행하고 있습니다.
다음 중 어떤 조정을 하면 실제 운영 환경에서 코드 성능을 더 정확하게 측정할 수 있을까요?
다음 중 어떤 조정을 하면 실제 운영 환경에서 코드 성능을 더 정확하게 측정할 수 있을까요?
