Associate-Developer-Apache-Spark 문제 41

다음 중 실행기 메모리에 DataFrame itemsDf를 저장하고 사용 가능한 메모리가 부족한 경우 직렬화하여 디스크에 저장하는 코드 블록은 무엇입니까?

Associate-Developer-Apache-Spark 문제 42

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 DataFrame transactionDf의 숫자 및 nullable 열 predError에 적용된 Python 함수 add_2_if_geq_3의 결과가 predErrorAdded 열에 포함된 DataFrame을 반환해야 합니다. 오류를 찾으십시오.
코드 블록:
1.def add_2_if_geq_3(x):
2. x가 없음인 경우:
3. 리턴 x
4. elif x >= 3:
5. x+2 반환
6. 리턴 x
7.
8.add_2_if_geq_3_udf = udf(add_2_if_geq_3)
9.
10.transactionsDf.withColumnRenamed("predErrorAdded", add_2_if_geq_3_udf(col("predError")))

Associate-Developer-Apache-Spark 문제 43

다음 중 슬롯에 대한 설명으로 옳은 것은?

Associate-Developer-Apache-Spark 문제 44

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 transactionId 열의 이름이 transactionNumber로 변경된 DataFrame transactionDf의 복사본을 반환해야 합니다. 오류를 찾으십시오.
코드 블록:
transactionDf.withColumn("transactionNumber", "transactionId")

Associate-Developer-Apache-Spark 문제 45

아래에 표시된 코드 블록은 dataFrames itemsDf 및 transactionDf의 결합된 정보와 함께 transactionId 및 provider 열이 있는 2열 DataFrame을 반환해야 합니다. 코드 블록은 DataFrame transactionDf의 열 productId가 DataFrame itemsDf의 열 itemId 값과 일치하지만 DataFrame transactionDf의 열 storeId가 DataFrame itemsDf의 열 itemId와 일치하지 않는 경우에만 행을 병합해야 합니다. 이를 수행하려면 코드 블록의 공백을 올바르게 채우는 답을 선택하십시오.
코드 블록:
transactionDf.__1__(itemsDf, __2__).__3__(__4__)