CDP-3002 문제 1
Spark 애플리케이션의 성능을 실시간으로 모니터링하고 검사하는 데 주로 사용되는 도구 또는 API는 무엇입니까?
Spark History 서버
Spark History 서버
CDP-3002 문제 2
운영 중인 Iceberg 테이블에 손상된 데이터 파일이 여러 개 있는 것을 발견했습니다. 다음 중 이 문제를 해결하는 데 도움이 될 수 있는 조치는 무엇일까요?
CDP-3002 문제 3
Catalyst Optimizer가 조인에 포함된 테이블의 크기를 확인할 수 없는 경우 기본적으로 선택되는 Spark SQL 조인 전략은 무엇입니까?
CDP-3002 문제 4
Cloudera 최적화 프레임워크의 맥락에서 동적 파티션 정리의 목적은 무엇입니까?
CDP-3002 문제 5
여러 단계로 구성된 복잡한 Spark 애플리케이션을 작업 중이며, 이전 단계의 모든 데이터가 완료된 후에야 이후 단계의 처리가 시작되도록 하고 싶습니다. Spark에서 이러한 종속성 관리를 어떻게 구현할 수 있을까요?