Associate-Developer-Apache-Spark 문제 56
아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 Python 메서드 find_most_freq_letter를 사용하여 DataFrame itemsDf의 itemName 열에서 가장 존재하는 문자를 찾아 새 열 most_frequent_letter에서 반환해야 합니다. 오류를 찾으십시오.
코드 블록:
1. find_most_freq_letter_udf = udf(find_most_freq_letter)
2. itemsDf.withColumn("most_frequent_letter", find_most_freq_letter("itemName"))
코드 블록:
1. find_most_freq_letter_udf = udf(find_most_freq_letter)
2. itemsDf.withColumn("most_frequent_letter", find_most_freq_letter("itemName"))
Associate-Developer-Apache-Spark 문제 57
다음 중 어큐뮬레이터를 사용할 때의 문제로 옳지 않은 것은?
Associate-Developer-Apache-Spark 문제 58
열 storeId 및 productId당 DataFrame transactionDf의 predError 열의 평균을 표시하는 DataFrame을 생성하기 위해 아래에 표시된 코드 블록을 어떤 순서로 실행해야 하나요? 여기서 productId는 2 또는 3이어야 하고 반환된 DataFrame은 오름차순으로 정렬되어야 합니다. 해당 열에 null을 남기지 않고 storeId 열로 주문하시겠습니까?
DataFrame 트랜잭션Df:
1.+-------------+---------+-----+------+--------- +----+
2.|transactionId|predError|value|storeId|productId| f|
3.+-------------+---------+-----+------+--------- +----+
4.| 1| 3| 4| 25| 1|널|
5.| 2| 6| 7| 2| 2|널|
6.| 3| 3| 널| 25| 3|널|
7.| 4| 널| 널| 3| 2|널|
8.| 5| 널| 널| 널| 2|널|
9.| 6| 3| 2| 25| 2|널|
10.+-------------+---------+-----+------+--------- +----+
1. .mean("predError")
2. .groupBy("storeId")
3. .orderBy("storeId")
4. transactionDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot("제품 ID", [2, 3])
DataFrame 트랜잭션Df:
1.+-------------+---------+-----+------+--------- +----+
2.|transactionId|predError|value|storeId|productId| f|
3.+-------------+---------+-----+------+--------- +----+
4.| 1| 3| 4| 25| 1|널|
5.| 2| 6| 7| 2| 2|널|
6.| 3| 3| 널| 25| 3|널|
7.| 4| 널| 널| 3| 2|널|
8.| 5| 널| 널| 널| 2|널|
9.| 6| 3| 2| 25| 2|널|
10.+-------------+---------+-----+------+--------- +----+
1. .mean("predError")
2. .groupBy("storeId")
3. .orderBy("storeId")
4. transactionDf.filter(transactionsDf.storeId.isNotNull())
5. .pivot("제품 ID", [2, 3])
Associate-Developer-Apache-Spark 문제 59
다음 코드 블록 중 표준 편차 및 각 열의 최소값을 포함하여 DataFrame transactionDf의 모든 열에 대한 다양한 집계 통계를 표시하는 것은 무엇입니까?
Associate-Developer-Apache-Spark 문제 60
원과 숫자로 표시된 요소 중 오류가 있거나 잘못 표현된 것은 무엇입니까?
