Databricks-Certified-Professional-Data-Engineer 문제 56

현재 다양한 고객 설문 조사에서 받은 데이터를 저장하는 작업을 하고 있습니다. 이 데이터는 구조화되지 않고 시간이 지남에 따라 변경됩니다. 데이터 웨어하우스에 비해 Lakehouse가 더 나은 선택인 이유는 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 57

다음 중 델타 라이브 테이블이 표준 데이터 파이프라인을 통해 ELT 파이프라인에 제공하는 이점은 무엇입니까?
Databricks에서 Spark 및 Delta Lake를 활용합니까?

Databricks-Certified-Professional-Data-Engineer 문제 58

데이터 엔지니어가 데이터 원본에서 스트리밍 읽기를 수행하는 코드 블록을 개발했습니다. 코드 블록은
아래에:
1. (스파크
2. .읽기
3. .스키마(스키마)
4. .format("클라우드 파일")
5. .option("cloudFiles.format", "json")
6. .load(데이터 소스)
7. )
코드 블록이 오류를 반환합니다.
다음 중 블록을 성공적으로 구성하기 위해 코드 블록을 변경해야 하는 것은 무엇입니까?
스트리밍 읽기를 수행하시겠습니까?

Databricks-Certified-Professional-Data-Engineer 문제 59

현재 데이터 파이프라인 구축 작업을 요청받았으며, 현재 매우 대규모 ETL 많은 데이터 종속성 작업을 하고 있음을 알게 되었습니다. 다음 중 이 문제를 해결하는 데 사용할 수 있는 도구는 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 60

데이터 엔지니어는 3개의 Python 변수(region, store,
그리고 년. region = "nyc", store = "100", year = "2021"일 때 테이블 이름의 예는 다음과 같습니다.
nyc100_sales_2021
다음 중 데이터 엔지니어가 Python에서 테이블 이름을 구성하는 데 사용해야 하는 명령은 무엇입니까?