Associate-Developer-Apache-Spark 문제 6

다음 코드 블록 중 시즌 열이 문자열 데이터 유형이고 열 wind_speed_ms 데이터 유형이 double인 두 개의 열 season과 wind_speed_ms가 있는 새 DataFrame을 생성하는 코드 블록은 무엇입니까?

Associate-Developer-Apache-Spark 문제 7

다음 코드 블록 중 플로트 유형 값만 포함하는 Python 목록 throughputRates의 모든 항목에 대한 단일 열 DataFrame을 반환하는 것은 무엇입니까?

Associate-Developer-Apache-Spark 문제 8

아래 표시된 코드 블록에 오류가 있습니다. 코드 블록은 predError가 3 또는 6인 행의 수를 세어야 합니다. 오류를 찾으십시오.
코드 블록:
transactionDf.filter(col('predError').in([3, 6])).count()

Associate-Developer-Apache-Spark 문제 9

아래 표시된 코드 블록은 dataFrames itemsDf 및 transactionDf의 결합된 정보와 함께 transactionId 및 supplier 열이 있는 2열 DataFrame을 반환해야 합니다. 코드 블록은 DataFrame transactionDf의 productId 열이 DataFrame itemsDf의 itemId 열 값과 일치하지만 DataFrame transactionDf의 storeId 열이 DataFrame itemsDf의 itemId 열과 일치하지 않는 행을 병합해야 합니다. 이 작업을 수행하려면 코드 블록의 빈칸을 올바르게 채우는 답을 선택하십시오.
코드 블록:
transactionDf.__1__(itemsDf, __2__).__3__(__4__)

Associate-Developer-Apache-Spark 문제 10

The code block displayed below contains an error. The code block should return the average of rows in column value grouped by unique storeId. Find the error.
Code block:
transactionsDf.agg("storeId").avg("value")