Databricks-Certified-Professional-Data-Engineer 문제 41

현재 다운스트림 프로세스 소비에 대한 보고 테이블을 채울 노트북에서 작업하고 있습니다. 이 프로세스는 매시간 일정에 따라 실행되어야 합니다. 이 작업을 설정하는 데 사용할 클러스터 유형은 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 42

데이터 세트는 Delta Live Tables를 사용하여 정의되었으며 기대 절을 포함합니다. CON-STRAINT valid_timestamp EXPECT (timestamp > '2020-01-01') ON VIOLATION FAIL 처리됩니까?

Databricks-Certified-Professional-Data-Engineer 문제 43

앞면이 나올 확률이 p인 동전 던지기를 고려하십시오. 여기서 p는 알 수 없으며 목표는 다음과 같습니다.
추정 p. 명백한 접근 방식은 동전이 앞면이 나온 횟수를 세고 합계로 나누는 것입니다.
동전 던지기 횟수. 동전을 1000번 던질 때 앞면이 367번 나오면 매우 합리적입니다.
p를 대략 0.367로 추정합니다. 그러나 동전을 두 번만 던지고 두 번 모두 앞면이 나왔다고 가정합니다.
p를 1.0으로 추정하는 것이 합리적입니까? 직관적으로 동전을 두 번만 던진 것을 감안하면 약간
동전이 항상 앞면이 나올 것이라고 결론짓는 경솔함은 그러한 발진을 피하는 방법입니다.
결론.

Databricks-Certified-Professional-Data-Engineer 문제 44

데이터 과학 팀 구성원은 단일 클러스터를 사용하여 데이터 분석을 수행하고 있습니다. 여러 사용자를 처리하기 위해 클러스터 크기를 선택하고 자동 크기 조정을 사용하도록 설정했지만 팀은 쿼리가 여전히 느리게 실행되고 있음을 깨달았습니다. 이에 대한 제안된 수정 사항은 무엇입니까?

Databricks-Certified-Professional-Data-Engineer 문제 45

성능 문제를 조사하는 동안 지정된 테이블에 작은 파일이 너무 많다는 사실을 깨달았습니다. 이 문제를 해결하기 위해 실행할 명령은 무엇입니까?