Databricks-Certified-Professional-Data-Engineer 문제 1

두 명의 주니어 데이터 엔지니어가 단일 데이터 파이프라인 노트북의 개별 부분을 작성하고 있습니다. 그들은 작업 중입니다
동일한 노트북에서 동시에 프로그램을 페어링할 수 있도록 별도의 Git 분기. 수석 데이터 엔지니어
Databricks에서 경험한 바에 따르면 이러한 유형의 협업에 대한 더 나은 대안이 있습니다.
다음 중 선임 데이터 엔지니어의 주장을 뒷받침하는 것은 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 2

A는 '학생은 여성' 이벤트를 나타내고 B는 '학생은 프랑스인' 이벤트를 나타냅니다. 학생 100명 수업에서
60명이 프랑스인이고 프랑스인 학생 중 10명이 여학생이라고 가정합니다. 내가 만약
프랑스 학생을 선택하면 여학생이 됩니다. 즉, P(A|B)를 찾으십시오.

Databricks-Certified-Professional-Data-Engineer 문제 3

데이터 엔지니어가 데이터 파이프라인을 설계하고 있습니다. 소스 시스템은 또한 공유 디렉토리에 파일을 생성합니다.
다른 프로세스에서 사용됩니다. 결과적으로 파일은 그대로 유지되어야 하며 디렉토리에 누적됩니다. 그만큼
데이터 엔지니어는 파이프라인에서 이전 실행 이후에 새로운 파일을 식별하고
실행할 때마다 새 파일만 수집하는 파이프라인.
다음 중 데이터 엔지니어가 이 문제를 해결하는 데 사용할 수 있는 도구는 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 4

주니어 데이터 엔지니어는 Spark가 데이터와 데이터를 모두 관리하는 my_table Spark SQL 테이블을 생성해야 합니다.
메타데이터. 메타데이터와 데이터도 DBFS(Databricks Filesystem)에 저장해야 합니다.
다음 명령 중 시니어 데이터 엔지니어가 하급 데이터 엔지니어와 공유해야 하는 명령은 무엇입니까?
이 작업을 완료하시겠습니까?

Databricks-Certified-Professional-Data-Engineer 문제 5

데이터 과학자는 데이터 분석 수명 주기의 어느 단계에서 프로젝트에서 가장 많은 시간을 소비합니까?