Associate-Developer-Apache-Spark-3.5 문제 6
데이터 엔지니어는 성능을 개선하기 위해 exact percentile() 함수를 approx_percentile()로 바꾸었지만, 결과가 예상 값과 너무 차이가 납니다.
이 문제를 해결하려면 어떤 변경이 필요합니까?

이 문제를 해결하려면 어떤 변경이 필요합니까?

Associate-Developer-Apache-Spark-3.5 문제 7
데이터 엔지니어가 DataFrame에 여러 변환을 적용하는 Spark 애플리케이션을 검토하고 있지만 작업이 즉시 실행되지 않는다는 점을 발견했습니다.
Apache Spark 실행 모델의 두 가지 특징은 이러한 동작을 설명합니까?
2개의 답을 선택하세요:
Apache Spark 실행 모델의 두 가지 특징은 이러한 동작을 설명합니까?
2개의 답을 선택하세요:
Associate-Developer-Apache-Spark-3.5 문제 8
드라이버에 리소스가 제한되어 있기 때문에 Spark 애플리케이션은 클라이언트 모드에서 성능 문제를 겪고 있습니다.
이 문제는 어떻게 해결해야 할까요?
이 문제는 어떻게 해결해야 할까요?
Associate-Developer-Apache-Spark-3.5 문제 9
개발자는 Spark 3.5.0에 도입된 내장 함수를 활용하기 위해 기존 Spark 코드를 리팩토링하려고 합니다.
기존 코드는 배열 조작을 수동으로 수행합니다. 다음 코드 조각 중 배열 연산을 위해 Spark 3.5.0의 새로운 내장 함수를 활용하는 것은 무엇입니까?

에이)

비)

기음)

디)

기존 코드는 배열 조작을 수동으로 수행합니다. 다음 코드 조각 중 배열 연산을 위해 Spark 3.5.0의 새로운 내장 함수를 활용하는 것은 무엇입니까?

에이)

비)

기음)

디)

Associate-Developer-Apache-Spark-3.5 문제 10
개발자는 기존 Spark 애플리케이션으로 Spark Connect를 테스트하려고 합니다.
개발자가 기존 애플리케이션 코드를 변경하지 않고 로컬 Spark Connect 서버를 시작할 수 있는 두 가지 대안적인 방법은 무엇입니까? (답변 2개 선택)
개발자가 기존 애플리케이션 코드를 변경하지 않고 로컬 Spark Connect 서버를 시작할 수 있는 두 가지 대안적인 방법은 무엇입니까? (답변 2개 선택)
