무료 온라인 액세스 Databricks.Associate-Developer-Apache-Spark.v2022-10-20.q61 모의 시험 (Page 10)

Associate-Developer-Apache-Spark 문제 41

다음 중 실행기 메모리에 DataFrame itemsDf를 저장하고 사용 가능한 메모리가 부족한 경우 직렬화하여 디스크에 저장하는 코드 블록은 무엇입니까?

A. itemsDf.persist(StorageLevel.MEMORY_ONLY)

B. itemsDf.cache(StorageLevel.MEMORY_AND_DISK)

C. itemsDf.store()

D. itemsDf.cache()

E. itemsDf.write.option('대상', '메모리').save()

Associate-Developer-Apache-Spark 문제 42

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 DataFrame transactionDf의 숫자 및 nullable 열 predError에 적용된 Python 함수 add_2_if_geq_3의 결과가 predErrorAdded 열에 포함된 DataFrame을 반환해야 합니다. 오류를 찾으십시오.
코드 블록:
1.def add_2_if_geq_3(x):
2. x가 없음인 경우:
3. 리턴 x
4. elif x >= 3:
5. x+2 반환
6. 리턴 x
7.
8.add_2_if_geq_3_udf = udf(add_2_if_geq_3)
9.
10.transactionsDf.withColumnRenamed("predErrorAdded", add_2_if_geq_3_udf(col("predError")))

A. 열을 추가하는 데 사용되는 연산자가 DataFrame에 predErrorAdded 열을 추가하지 않습니다.

B. col("predError") 대신에 transactionDf.predError와 같이 열이 있는 실제 DataFrame을 전달해야 합니다.

C. udf() 메서드는 반환 유형을 선언하지 않습니다.

D. UDF는 SQL API를 통해서만 사용할 수 있지만 코드 블록에 표시된 것처럼 Python API에서는 사용할 수 없습니다.

E. Python 함수가 null 값을 처리할 수 없어 실행 시 코드 블록이 충돌합니다.

Associate-Developer-Apache-Spark 문제 43

다음 중 슬롯에 대한 설명으로 옳은 것은?

A. 슬롯은 실행자의 작업량에 따라 동적으로 생성 및 소멸됩니다.

B. I/O 성능을 최적화하기 위해 Spark는 디스크의 여러 슬롯에 데이터를 저장합니다.

C. 실행기로 작동하는 JVM(Java Virtual Machine)은 작업 실행을 위한 슬롯 풀로 간주할 수 있습니다.

D. 슬롯은 항상 단일 코어로 제한됩니다.
슬롯은 실행기를 위한 통신 인터페이스이며 명령을 수신하고 결과를 드라이버로 보내는 데 사용됩니다.

Associate-Developer-Apache-Spark 문제 44

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 transactionId 열의 이름이 transactionNumber로 변경된 DataFrame transactionDf의 복사본을 반환해야 합니다. 오류를 찾으십시오.
코드 블록:
transactionDf.withColumn("transactionNumber", "transactionId")

A. withColumn 메서드에 대한 인수를 재정렬해야 합니다.

B. withColumn 메서드에 대한 인수를 재정렬해야 하고 copy() 연산자를 코드 블록에 추가하여 복사본이 반환되도록 해야 합니다.

C. 복사본이 반환되도록 코드 블록에 copy() 연산자를 추가해야 합니다.

D. 각 열 이름은 col() 메서드로 래핑되어야 하며 withColumn 메서드는 withColumnRenamed 메서드로 대체되어야 합니다.

E. withColumn 메소드는 withColumnRenamed 메소드로 대체되어야 하고 메소드에 대한 인수는 재정렬되어야 합니다.

Associate-Developer-Apache-Spark 문제 45

아래에 표시된 코드 블록은 dataFrames itemsDf 및 transactionDf의 결합된 정보와 함께 transactionId 및 provider 열이 있는 2열 DataFrame을 반환해야 합니다. 코드 블록은 DataFrame transactionDf의 열 productId가 DataFrame itemsDf의 열 itemId 값과 일치하지만 DataFrame transactionDf의 열 storeId가 DataFrame itemsDf의 열 itemId와 일치하지 않는 경우에만 행을 병합해야 합니다. 이를 수행하려면 코드 블록의 공백을 올바르게 채우는 답을 선택하십시오.
코드 블록:
transactionDf.__1__(itemsDf, __2__).__3__(__4__)

A. 1. 가입
2. transactionDf.productId==itemsDf.itemId, how="inner"
3. 선택
4. "transactionId", "공급자"

B. 1. 선택
2. "transactionId", "공급자"
3. 가입
4. [transactionsDf.storeId!=itemsDf.itemId, transactionDf.productId==itemsDf.itemId]

C. 1. 가입
2. [transactionsDf.productId==itemsDf.itemId, transactionDf.storeId!=itemsDf.itemId]
3. 선택
4. "transactionId", "공급자"

D. 1. 필터
2. "transactionId", "공급자"
3. 가입
4. "transactionsDf.storeId!=itemsDf.itemId, transactionDf.productId==itemsDf.itemId"

E. 1. 가입
2. transactionDf.productId==itemsDf.itemId, transactionDf.storeId!=itemsDf.itemId
3. 필터
4. "transactionId", "공급자"

정답: C

설명
이 질문은 매우 복잡하며 그 복잡성으로 인해 아마도 시험에서 접하게 되는 것보다 높을 것입니다. 그러나 질문을 주의 깊게 읽으면 논리 기술을 사용하여 여기에서 잘못된 답을 제거할 수 있습니다.
먼저 모든 답변에 공통되는 조인 문을 검토해야 합니다. join() 연산자의 첫 번째 인수(아래에 링크된 문서)는 결합할 DataFrame입니다. 조인이 간격 3에 있는 경우 간격 4의 첫 번째 인수는 따라서 다른 DataFrame이어야 합니다. 조인이 세 번째 간격에 있는 질문 중 어느 것도 해당되지 않습니다. 따라서 두 개의 답변을 즉시 버릴 수 있습니다.
다른 모든 답변의 경우 조인은 갭 1에 있고 코드 블록에 따라 .(itemsDf가 뒤따릅니다. 조인() 연산자가 호출되는 방식을 감안할 때 이제 세 개의 후보가 남아 있습니다.
조인() 문을 자세히 살펴보면 두 번째 인수(on=)는 문서에 따라 "조인 열 이름, 열 이름 목록, 조인 표현식(열) 또는 열 목록에 대한 문자열"을 예상합니다. . 하나의 답변 옵션에는 문서에 따라 지원되지 않는 조인 표현식 목록(transactionsDf.productId==itemsDf.itemId, transactionDf.storeId!=itemsDf.itemId)이 포함되어 있으므로 해당 답변을 버리고 두 개의 후보만 남게 됩니다.
두 후보 모두 유효한 구문을 가지고 있지만 그 중 하나만 "DataFrame transactionDf의 열 storeId가 DataFrame itemsDf의 열 itemId와 일치하지 않는 경우에만"이라는 질문의 조건을 충족합니다. 따라서 이 하나의 남은 답 옵션은 올바른 것이어야 합니다!
보시다시피 처음에는 때로는 압도적이지만 시험 중에 문서에서 얻을 수 있는 지식을 엄격하게 적용하면 훨씬 더 복잡한 질문을 알아낼 수 있습니다.
추가 정보: pyspark.sql.DataFrame.join - PySpark 3.1.2 문서
정적 노트북 | 동적 노트북: 테스트 3 참조

다른 버전: 669Databricks.Associate-Developer-Apache-Spark.v2025-12-04.q64; 706Databricks.Associate-Developer-Apache-Spark.v2023-08-28.q61; 1476Databricks.Associate-Developer-Apache-Spark.v2022-07-14.q65; 1327Databricks.Associate-Developer-Apache-Spark.v2022-01-27.q63

최근 업로드: 108Microsoft.AZ-500-KR.v2026-06-04.q213; 111Microsoft.DP-600-KR.v2026-06-04.q98; 108Microsoft.AZ-204-KR.v2026-06-04.q237; 136Microsoft.PL-600-KR.v2026-06-04.q112; 194Microsoft.SC-300-KR.v2026-06-03.q151; 154Microsoft.DP-600-KR.v2026-06-03.q70; 873PMI.PMP-KR.v2026-06-01.q1069; 237Microsoft.MS-102-KR.v2026-06-01.q252; 213Amazon.DOP-C02-KR.v2026-06-01.q207; 166Microsoft.AZ-104-KR.v2026-06-01.q197