무료 온라인 액세스 Databricks.Associate-Developer-Apache-Spark-3.5.v2025-11-27.q71 모의 시험 (Page 11)

Associate-Developer-Apache-Spark-3.5 문제 46

데이터 엔지니어는 국가별로 분할된 Parquet 파일에 DataFramedf를 작성하고 대상 경로에 있는 기존 데이터를 덮어써야 합니다.
Apache Spark에서 이 작업을 완료하려면 데이터 엔지니어가 어떤 코드를 사용해야 합니까?

A. df.write.mode("덮어쓰기").partitionBy("국가").parquet("/데이터/출력")

B. df.write.mode("append").partitionBy("country").parquet("/data/output")

C. df.write.mode("덮어쓰기").parquet("/데이터/출력")

D. df.write.partitionBy("country").parquet("/데이터/출력")

Associate-Developer-Apache-Spark-3.5 문제 47

데이터 엔지니어는 업스트림 스트리밍 소스에서 중복 레코드를 전송하는 것을 발견했습니다. 중복 레코드는 동일한 키를 공유하며 event_timestamp에서 최대 30분 차이가 납니다. 엔지니어는 다음과 같이 덧붙였습니다.
dropDuplicatesWithinWatermark("event_timestamp", "30분")
결과는 어떻게 되나요?

A. 이 시나리오에서는 중복 제거를 처리할 수 없습니다.

B. 워터마크가 지정한 30분 창 내에 도착한 중복을 제거합니다.

C. 언제 도착하든 모든 중복을 제거합니다.

D. 몇 초 안에 워터마크를 받아들이고 코드에서 오류가 발생합니다.

Associate-Developer-Apache-Spark-3.5 문제 48

Spark 클러스터와의 원격 상호작용을 가능하게 하는 애플리케이션을 설계할 때 Spark Connect의 어떤 기능이 고려됩니까?

A. 모든 프로그래밍 언어로 원격으로 Spark 애플리케이션을 실행할 수 있는 방법을 제공합니다.

B. REST API를 사용하여 모든 원격 클러스터와 상호 작용하는 데 사용할 수 있습니다.

C. Spark 작업의 원격 실행을 허용합니다.

D. 주로 외부 소스에서 Spark로 데이터를 수집하는 데 사용됩니다.

Associate-Developer-Apache-Spark-3.5 문제 49

55개 중 47개.
데이터 엔지니어는 두 개의 DataFrames df1과 df2를 결합하기 위해 다음 코드를 작성했습니다.
df1 = spark.read.csv("판매_데이터.csv")
df2 = spark.read.csv("제품_데이터.csv")
df_joined = df1.join(df2, df1.제품_id == df2.제품_id)
DataFrame df1에는 약 10GB의 판매 데이터가 포함되어 있고, df2에는 약 8MB의 제품 데이터가 포함되어 있습니다.
Spark는 어떤 조인 전략을 사용할 것인가?

A. df1과 df2의 크기 차이가 너무 커서 브로드캐스트 조인이 효율적으로 작동할 수 없으므로 셔플 조인을 사용합니다.

B. AQE가 활성화되지 않았고 Spark가 정적 쿼리 계획을 사용하기 때문에 셔플 조인이 사용됩니다.

C. 브로드캐스트 힌트가 제공되지 않아 셔플 조인이 실행되었습니다.

D. df2가 기본 브로드캐스트 임계값보다 작으므로 브로드캐스트 조인입니다.

Associate-Developer-Apache-Spark-3.5 문제 50

55개 중 16개.
데이터 엔지니어가 DataFrame에 여러 변환을 적용하는 Spark 애플리케이션을 검토하고 있지만 작업이 즉시 실행되지 않는다는 점을 발견했습니다.
Apache Spark 실행 모델의 어떤 두 가지 특성이 이러한 동작을 설명합니까? (답변 2개 선택)

A. 계통 그래프를 구축하기 위해 변환이 즉시 실행됩니다.

B. Spark 엔진은 변환 중에 실행 계획을 최적화하여 지연을 발생시킵니다.

C. 변환은 지연 평가됩니다.

D. Spark 엔진은 변환 실행을 시작하려면 수동 개입이 필요합니다.

E. 동작만이 변환 파이프라인의 실행을 트리거합니다.

최근 업로드: 190ACAMS.CAMS.v2026-01-15.q822; 140Microsoft.GH-300.v2026-01-15.q65; 125NACE.NACE-CIP1-001.v2026-01-15.q34; 156Salesforce.MCE-Admn-201.v2026-01-14.q54; 155Salesforce.MC-101.v2026-01-14.q41; 162Google.Professional-Cloud-Architect.v2026-01-14.q101; 140RUCKUS.RCWA.v2026-01-14.q48; 137SOCRA.CCRP.v2026-01-14.q43; 130CompTIA.FC0-U71.v2026-01-13.q88; 191APICS.CPIM.v2026-01-13.q161