무료 온라인 액세스 Databricks.Associate-Developer-Apache-Spark.v2022-01-27.q63 모의 시험 (Page 12)

Associate-Developer-Apache-Spark 문제 51

아래 표시된 코드 블록은 실행기의 메모리를 최대한 활용하되 디스크에 아무 것도 쓰지 않고 두 개의 다른 실행기에 DataFrame transactionDf를 저장해야 합니다. 이를 수행하려면 코드 블록의 공백을 올바르게 채우는 답을 선택하십시오.
1. pyspark 가져오기 StorageLevel에서
2.transactionsDf.__1__(StorageLevel.__2__).__3__

A. 1. 캐시
2. MEMORY_ONLY_2
3. 카운트()

B. 1. 지속
2. DISK_ONLY_2
3. 카운트()

C. 1. 지속
2. MEMORY_ONLY_2
3. 선택()

D. 1. 캐시
2. DISK_ONLY_2
3. 카운트()

E. 1. 지속
2. MEMORY_ONLY_2
3. 카운트()

Associate-Developer-Apache-Spark 문제 52

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 기존 마루 파일에 추가하여 경로 경로에 있는 DataFrame transactionDf를 마루 파일로 저장해야 합니다. 오류를 찾으십시오.
코드 블록:

A. transactionDf.format("parquet").option("mode", "append").save(경로)

B. 코드 블록에 DataFrameWriter에 대한 참조가 없습니다.

C. save()는 느리게 평가되며 조치가 뒤따를 필요가 있습니다.

D. 명령이 기본 모드를 사용하도록 모드 옵션을 생략해야 합니다.

E. 코드 블록에 파티션을 처리하는 bucketBy 명령이 없습니다.

F. DataFrame을 쪽모이 세공 파일로 저장해야 하므로 경로가 잘못된 방법으로 전달되고 있습니다.

Associate-Developer-Apache-Spark 문제 53

아래에 표시된 코드 블록에 오류가 있습니다. 코드 블록은 DataFrame transactionDf의 모든 행을 반환해야 하지만 storeId 및 predError 열만 포함합니다. 오류를 찾으십시오.
코드 블록:
spark.collect(transactionsDf.select("storeId", "predError"))

A. 선택 대신 필터 연산자를 사용하여 DataFrame transactionDf를 필터링해야 합니다.

B. storeId 및 predError 열은 Python 목록으로 표시되어야 하므로 대괄호([])로 묶어야 합니다.

C. collect 방식 대신 take 방식을 사용해야 합니다.

D. 수집 대신 collectAsRows를 호출해야 합니다.

E. collect 메소드가 SparkSession 객체의 메소드가 아닙니다.

Associate-Developer-Apache-Spark 문제 54

다음 중 Spark에서 동적 파티션 정리의 이면에 있는 아이디어는 무엇입니까?

A. 동적 파티션 정리는 쿼리 결과에서 필요하지 않은 데이터를 건너뛰기 위한 것입니다.

B. 동적 파티션 정리는 조인 성능을 최적화하기 위해 유사한 데이터 유형의 열을 연결합니다.

C. 동적 파티션 정리는 메모리 대신 디스크에서 광범위한 변환을 수행합니다.

D. 동적 파티션 프루닝은 데이터 유형 및 브로드캐스트 변수를 기반으로 물리적 계획을 재최적화합니다.

E. 동적 파티션 정리는 쿼리 실행 중에 수집된 런타임 통계를 기반으로 쿼리 계획을 다시 최적화합니다.

Associate-Developer-Apache-Spark 문제 55

아래에 표시된 코드 블록에는 하나 이상의 오류가 있습니다. 코드 블록은 filePath 위치에 있는 쪽모이 세공 파일을 DataFrame으로 로드해야 하며 이전에 수정된 파일만 로드해야 합니다.
2029-03-20 05:44:46. Spark는 아래 표시된 스키마에 따라 스키마를 적용해야 합니다. 오류를 찾으십시오.
개요:
1.루트
2. |-- itemId: 정수(nullable = true)
3. |-- 속성: 배열(nullable = true)
4. | |-- 요소: 문자열(containsNull = true)
5. |-- 공급자: 문자열(nullable = true)
코드 블록:
1.스키마 = StructType([
2. StructType("itemId", IntegerType(), True),
3. StructType("속성", ArrayType(StringType(), True), True),
4. StructType("공급자", StringType(), True)
5.])
6.
7.spark.read.options("modifiedBefore", "2029-03-20T05:44:46").schema(스키마).load(filePath)

A. 속성 배열이 잘못 지정되었고, Spark가 파일 형식을 식별할 수 없으며, Spark의 DataFrameReader에 대한 호출 구문이 올바르지 않습니다.

B. 스키마 정의의 열이 잘못된 개체 유형을 사용하고 Spark의 DataFrameReader에 대한 호출 구문이 올바르지 않습니다.

C. 스키마의 데이터 유형이 schema() 연산자와 호환되지 않고 수정 날짜 임계값이 잘못 지정되었습니다.

D. 스키마 정의의 열이 잘못된 개체 유형을 사용하고 수정 날짜 임계값이 잘못 지정되어 Spark가 파일 형식을 식별할 수 없습니다.

E. 스키마의 열이 빈 값을 처리할 수 없으며 수정 날짜 임계값이 잘못 지정되었습니다.

정답: D

설명
올바른 코드 블록:
스키마 = StructType([
StructField("itemId", IntegerType(), True),
StructField("속성", ArrayType(StringType(), True), True),
StructField("공급자", StringType(), True)
])
spark.read.options(modifiedBefore="2029-03-20T05:44:46").schema(schema).parquet(filePath) 이 문제는 시험에서 볼 수 있는 것보다 더 어렵습니다. 시험에서 이 문제 유형의 경우 문제에서와 같이 "하나 또는 여러 개"가 아닌 하나의 오류만 식별하면 됩니다.
스키마 정의의 열이 잘못된 개체 유형을 사용하고 수정 날짜 임계값이 잘못 지정되어 Spark가 파일 형식을 식별할 수 없습니다.
옳은! 스키마 정의의 열은 StructField 유형을 사용해야 합니다. 여기에서 StructType 및 StructField와 같은 클래스를 사용하여 pyspark.sql.types에서 스키마를 빌드하는 것은 Spark에서 스키마를 표현하는 여러 방법 중 하나입니다. StructType에는 항상 StructFields 목록이 포함됩니다(아래 링크된 문서 참조). 따라서 질문에서와 같이 StructType과 StructType을 중첩하는 것은 잘못된 것입니다.
수정 날짜 임계값은 원본 코드 블록에서와 같이 두 개의 연속적인 비 키워드 인수가 아니라 options(modifiedBefore="2029-03-20T05:44:46")과 같은 키워드 인수로 지정해야 합니다(아래 링크된 문서 참조).
DataFrameReader.format()을 사용하여 DataFrameReader.load()에 대한 인수로 지정하거나 DataFrameReader.parquet()와 같이 직접 호출하여 지정해야 하기 때문에 Spark는 파일 형식을 올바르게 식별할 수 없습니다.
스키마의 열은 빈 값을 처리할 수 없으며 수정 날짜 임계값이 잘못 지정되었습니다.
아니요. StructType 대신 열에 StructField가 사용되는 경우(위 참조) 세 번째 인수는 열이 null 허용 여부를 지정합니다. 원래 스키마는 열이 null을 입력할 수 있어야 하며 이는 코드 블록의 스키마에서 True인 세 번째 인수에 의해 올바르게 지정되었음을 보여줍니다.
그러나 수정 날짜 임계값이 잘못 지정된 것은 맞습니다(위 참조).
속성 배열이 잘못 지정되고 Spark가 파일 형식을 식별할 수 없으며 Spark의 DataFrameReader 호출 구문이 올바르지 않습니다.
잘못된. 속성 배열은 ArrayType 구문에 따라 올바르게 지정됩니다(아래 링크된 문서 참조). Spark는 파일 형식이 올바른지 식별할 수 없습니다. 위의 정답을 참조하세요. 또한 DataFrameReader는 SparkSession 스파크를 통해 올바르게 호출됩니다.
스키마 정의의 열이 잘못된 개체 유형을 사용하고 Spark의 DataFrameReader에 대한 호출 구문이 올바르지 않습니다.
틀림, 스키마 정의의 개체 유형이 정확하고 Spark의 DataFrameReader에 대한 호출 구문이 정확합니다.
스키마의 데이터 유형이 schema() 연산자와 호환되지 않으며 수정 날짜 임계값이 잘못 지정되었습니다.
거짓. 스키마의 데이터 형식은 StructType이며 DataFrameReader.schema() 메서드에 대해 허용되는 데이터 형식입니다. 그러나 수정 날짜 임계값이 잘못 지정된 것은 맞습니다(위의 정답 참조).

다른 버전: 444Databricks.Associate-Developer-Apache-Spark.v2025-12-04.q64; 636Databricks.Associate-Developer-Apache-Spark.v2023-08-28.q61; 963Databricks.Associate-Developer-Apache-Spark.v2022-10-20.q61; 1395Databricks.Associate-Developer-Apache-Spark.v2022-07-14.q65

최근 업로드: 260ACAMS.CAMS.v2026-01-15.q822; 153Microsoft.GH-300.v2026-01-15.q65; 132NACE.NACE-CIP1-001.v2026-01-15.q34; 156Salesforce.MCE-Admn-201.v2026-01-14.q54; 155Salesforce.MC-101.v2026-01-14.q41; 162Google.Professional-Cloud-Architect.v2026-01-14.q101; 145RUCKUS.RCWA.v2026-01-14.q48; 140SOCRA.CCRP.v2026-01-14.q43; 130CompTIA.FC0-U71.v2026-01-13.q88; 192APICS.CPIM.v2026-01-13.q161