무료 온라인 액세스 Databricks.Associate-Developer-Apache-Spark-3.5.v2025-11-27.q71 모의 시험 (Page 6)

Associate-Developer-Apache-Spark-3.5 문제 21

55개 중 40개.
개발자는 Spark 3.5에 도입된 기본 제공 함수를 활용하기 위해 기존 Spark 코드를 리팩토링하려고 합니다.
원래 코드:
pyspark.sql에서 함수를 F로 가져오기
최소가격 = 110.50
result_df = prices_df.filter(F.col("price") > min_price).agg(F.count("*")) 개발자는 어떤 코드 블록을 사용하여 코드를 리팩토링해야 합니까?

A. 결과_df = 가격_df.filter(F.col("가격") > F.lit(최소_가격)).agg(F.count("*"))

B. 결과_df = 가격_df.where(F.lit("가격") > 최소_가격).groupBy().count()

C. result_df = prices_df.withColumn("유효_가격", when(col("가격") > F.lit(최소_가격), True))

D. 결과_df = 가격_df.필터(F.lit(최소_가격) > F.col("가격")).카운트()

Associate-Developer-Apache-Spark-3.5 문제 22

Spark 개발자는 표준 Spark 함수 라이브러리에서 사용할 수 없는 해시 함수를 실행하는 기존 PySpark UDF의 성능을 개선하고자 합니다. 기존 UDF 코드는 다음과 같습니다.

hashlib 가져오기
pyspark.sql.functions를 sf로 가져오기
pyspark.sql.types에서 StringType 가져오기
def shake_256(원시):
hashlib.shake_256(raw.encode()).hexdigest(20)을 반환합니다.
shake_256_udf = sf.udf(shake_256, StringType())
개발자는 성능 향상을 위해 기존 UDF를 Pandas UDF로 대체하려고 합니다. 개발자는 shake_256_udf의 정의를 다음과 같이 변경합니다. CopyEdit shake_256_udf = sf.pandas_udf(shake_256, StringType()) 하지만 개발자는 다음과 같은 오류를 받습니다.
이 오류를 해결하려면 shake_256() 함수의 서명을 어떻게 변경해야 합니까?

A. def shake_256(df: pd.Series) -> str:

B. def shake_256(df: 반복자[pd.Series]) -> 반복자[pd.Series]:

C. def shake_256(원시: str) -> str:

D. def shake_256(df: pd.Series) -> pd.Series:

Associate-Developer-Apache-Spark-3.5 문제 23

Spark 클러스터와의 원격 상호작용을 가능하게 하는 애플리케이션을 설계할 때 Spark Connect의 어떤 기능이 고려됩니까?

A. 모든 프로그래밍 언어로 원격으로 Spark 애플리케이션을 실행할 수 있는 방법을 제공합니다.

B. REST API를 사용하여 모든 원격 클러스터와 상호 작용하는 데 사용할 수 있습니다.

C. Spark 작업의 원격 실행을 허용합니다.

D. 주로 외부 소스에서 Spark로 데이터를 수집하는 데 사용됩니다.

Associate-Developer-Apache-Spark-3.5 문제 24

55개 중 43개.
어떤 조직에서는 프로덕션 환경에서 Spark 애플리케이션을 실행하고 있으며 리소스 사용량을 줄이기 위해 Spark History Server를 비활성화하는 것을 고려하고 있습니다.
프로덕션 환경에서 Spark History Server를 비활성화하면 어떤 영향이 있을까요?

A. 장기 실행 작업 중 드라이버 로그 누적 방지

B. 로깅 오버헤드 감소로 인해 작업 실행 속도가 향상되었습니다.

C. 이전 작업 로그에 대한 액세스 손실 및 완료된 작업에 대한 디버깅 기능 감소

D. 로그 크기 감소로 인해 실행기 성능이 향상되었습니다.

Associate-Developer-Apache-Spark-3.5 문제 25

데이터 과학자는 고객 정보가 포함된 customerDF라는 Spark DataFrame을 사용하고 있습니다.
DataFrame에는 고객 이메일 주소가 포함된 email이라는 열이 있습니다. 데이터 과학자는 이 열을 사용자 이름과 도메인 부분으로 분할해야 합니다.
어떤 코드 조각이 이메일 열을 사용자 이름과 도메인 열로 분할합니까?

A. 고객DF.선택(
col("이메일").substr(0, 5).alias("사용자 이름"),
col("이메일").substr(-5).alias("도메인")
)

B. customerDF.withColumn("사용자 이름", split(col("이메일"), "@").getItem(0)) \
.withColumn("도메인", split(col("이메일"), "@").getItem(1))

C. customerDF.withColumn("사용자 이름", substring_index(col("이메일"), "@", 1)) \
.withColumn("도메인", substring_index(col("이메일"), "@", -1))

D. 고객DF.선택(
regexp_replace(col("이메일"), "@", "").alias("사용자 이름"),
regexp_replace(col("이메일"), "@", "").alias("도메인")
)

최근 업로드: 185ACAMS.CAMS.v2026-01-15.q822; 140Microsoft.GH-300.v2026-01-15.q65; 123NACE.NACE-CIP1-001.v2026-01-15.q34; 156Salesforce.MCE-Admn-201.v2026-01-14.q54; 155Salesforce.MC-101.v2026-01-14.q41; 162Google.Professional-Cloud-Architect.v2026-01-14.q101; 140RUCKUS.RCWA.v2026-01-14.q48; 137SOCRA.CCRP.v2026-01-14.q43; 130CompTIA.FC0-U71.v2026-01-13.q88; 190APICS.CPIM.v2026-01-13.q161