Associate-Developer-Apache-Spark 문제 56
다음 중 8개의 파티션이 있는 DataFrame transactionDf를 섞는 코드 블록은 다음과 같습니다.
파티션이 10개?
파티션이 10개?
Associate-Developer-Apache-Spark 문제 57
다음 중 RDD에 대한 설명으로 옳지 않은 것은?
Associate-Developer-Apache-Spark 문제 58
열 storeId 및 productId당 DataFrame transactionDf의 열 predError의 평균을 표시하는 DataFrame을 생성하기 위해 아래에 표시된 코드 블록을 어떤 순서로 실행해야 하나요? 여기서 productId는 2 또는 3이어야 하고 반환된 DataFrame은 오름차순으로 정렬되어야 합니다. 해당 열에 null을 남기지 않고 storeId 열로 주문하시겠습니까?
DataFrame 트랜잭션Df:
1.+-------------+---------+-----+------+--------- +----+
2.|transactionId|predError|value|storeId|productId| f|
3.+-------------+---------+-----+------+--------- +----+
4.| 1| 3| 4| 25| 1|널|
5.| 2| 6| 7| 2| 2|널|
6. | 3 | 3 | 널 | 25 | 3 | 널 |
7. | 4 | 널 | 널 | 3 | 2 | 널 |
8. | 5 | 널 | 널 | 널 | 2 | 널 |
9.| 6| 3| 2| 25| 2|널|
10.+-------------+---------+-----+------+--------- +----+
1. .mean("predError")
2. .groupBy("storeId")
3. .orderBy("storeId")
4. transactionDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot("제품 ID", [2, 3])
DataFrame 트랜잭션Df:
1.+-------------+---------+-----+------+--------- +----+
2.|transactionId|predError|value|storeId|productId| f|
3.+-------------+---------+-----+------+--------- +----+
4.| 1| 3| 4| 25| 1|널|
5.| 2| 6| 7| 2| 2|널|
6. | 3 | 3 | 널 | 25 | 3 | 널 |
7. | 4 | 널 | 널 | 3 | 2 | 널 |
8. | 5 | 널 | 널 | 널 | 2 | 널 |
9.| 6| 3| 2| 25| 2|널|
10.+-------------+---------+-----+------+--------- +----+
1. .mean("predError")
2. .groupBy("storeId")
3. .orderBy("storeId")
4. transactionDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot("제품 ID", [2, 3])
Associate-Developer-Apache-Spark 문제 59
다음 코드 블록 중 storeId 열로 그룹화된 DataFrame transactionDf의 "값" 열 평균 값을 표시하는 DataFrame을 반환하는 코드는 무엇입니까?
Associate-Developer-Apache-Spark 문제 60
다음 코드 블록 중 메모리와 디스크에서 이전에 캐시된 DataFrame transactionDf를 즉시 제거하는 것은 무엇입니까?
