무료 온라인 액세스 Databricks.Associate-Developer-Apache-Spark-3.5.v2025-11-27.q71 모의 시험 (Page 14)

Associate-Developer-Apache-Spark-3.5 문제 61

55개 중 42개.
개발자는 복잡한 Spark 변환 체인의 출력을 events.liveLatest라는 Parquet 테이블에 작성해야 합니다.
이 테이블의 소비자는 event_ts 열(타임스탬프)의 연도와 월에 대한 필터를 사용하여 자주 쿼리를 실행합니다.
현재 코드:
pyspark.sql에서 함수를 F로 가져오기
최종 = df.withColumn("이벤트_년도", F.년도("이벤트_ts")) \
.withColumn("이벤트_월", F.month("이벤트_ts")) \
.bucketBy(42, ["이벤트_년도", "이벤트_월"]) \
.saveAsTable("이벤트.라이브최신")
하지만 소비자들은 쿼리 성능이 좋지 않다고 보고합니다.
어떤 변경 사항을 적용하면 연도 및 월별로 효율적으로 조회할 수 있을까요?

A. .bucketBy()를 .partitionBy("event_year", "event_month")로 교체합니다.

B. 버킷 개수(42)를 더 낮은 숫자로 변경합니다.

C. .bucketBy() 뒤에 .sortBy()를 추가합니다.

D. .bucketBy()를 .partitionBy("event_year")로만 바꾸세요.

Associate-Developer-Apache-Spark-3.5 문제 62

Spark에서 Pandas를 사용하여 데이터 변환을 수행하는 이점은 무엇입니까?
옵션:

A. Python에서만 사용할 수 있으므로 학습 곡선이 단축됩니다.

B. 즉시 실행을 통해 결과를 계산하므로 사용하기 간편합니다.

C. 단일 노드에서만 실행되며 메모리 바운드 DataFrames를 사용하여 메모리를 활용하므로 비용 효율적입니다.

D. 클러스터에서 사용 가능한 모든 코어를 사용하여 쿼리를 더 빠르게 실행하고 Pandas의 풍부한 기능 세트를 제공합니다.

Associate-Developer-Apache-Spark-3.5 문제 63

다음 코드 조각이 my_spark_app.py에 주어졌습니다.

드라이버 노드의 역할은 무엇인가요?

A. 드라이버 노드는 작업을 작업으로 변환하고 이를 작업자 노드에 배포하여 실행을 조정합니다.

B. 드라이버 노드는 애플리케이션 모니터링을 위한 사용자 인터페이스만 제공합니다.

C. 드라이버 노드는 DataFrame 데이터를 보관하고 모든 계산을 로컬에서 수행합니다.

D. 드라이버 노드는 작업자 노드가 계산을 완료한 후 최종 결과를 저장합니다.

Associate-Developer-Apache-Spark-3.5 문제 64

데이터 엔지니어는 다음 구성을 사용하여 Spark 클러스터에서 일괄 처리 작업을 실행하고 있습니다.
10개의 워커 노드
워커 노드당 16개의 CPU 코어
노드당 64GB RAM
데이터 엔지니어는 노드당 4개의 실행자를 할당하고, 각 실행자는 4개의 코어를 사용하려고 합니다.
해당 애플리케이션에서 사용되는 CPU 코어의 총 개수는 얼마입니까?

A. 160

B. 64

C. 80

D. 40

Associate-Developer-Apache-Spark-3.5 문제 65

주어진 코드:

df = spark.read.csv("대형 데이터셋.csv")
필터링된_df = df.filter(col("오류_열").포함("오류"))
mapped_df = filtered_df.select(split(col("timestamp")," ").getItem(0).alias("date"), lit(1).alias("count")) reduced_df = mapped_df.groupBy("date").sum("count") reduced_df.count() reduced_df.show() Spark는 실제로 어느 시점에서 데이터 처리를 시작할까요?

A. 필터 변환이 적용될 때

B. 카운트 동작이 적용될 때

C. groupBy 변환이 적용될 때

D. show 액션이 적용될 때

최근 업로드: 190ACAMS.CAMS.v2026-01-15.q822; 140Microsoft.GH-300.v2026-01-15.q65; 125NACE.NACE-CIP1-001.v2026-01-15.q34; 156Salesforce.MCE-Admn-201.v2026-01-14.q54; 155Salesforce.MC-101.v2026-01-14.q41; 162Google.Professional-Cloud-Architect.v2026-01-14.q101; 140RUCKUS.RCWA.v2026-01-14.q48; 137SOCRA.CCRP.v2026-01-14.q43; 130CompTIA.FC0-U71.v2026-01-13.q88; 191APICS.CPIM.v2026-01-13.q161