무료 온라인 액세스 Snowflake.DEA-C01.v2026-06-26.q200 모의 시험 (Page 17)

DEA-C01 문제 76

데이터 엔지니어는 AWS로 실시간 스트리밍 데이터를 수집하는 작업을 관리해야 합니다. 이 엔지니어는 최대 30분 기간 동안 시간 기반 집계를 사용하여 수신되는 스트리밍 데이터에 대한 실시간 분석을 수행하고자 합니다. 또한, 데이터 엔지니어는 높은 내결함성을 갖춘 솔루션을 필요로 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?

A. 이벤트 타임스탬프를 기준으로 최대 30분 동안의 텀블링 윈도우에 대한 집계를 수행하기 위해 비즈니스 로직과 분석 로직을 모두 포함하는 AWS Lambda 함수를 사용합니다.

B. Amazon Kinesis Data Streams의 데이터에 대해 최대 30분 기간 동안 시간 기반 집계를 수행하기 위해 비즈니스 로직과 분석 로직을 모두 포함하는 AWS Lambda 함수를 사용합니다.

C. Amazon Managed Service for Apache Flink(이전 명칭: Amazon Kinesis Data Analytics)를 사용하여 여러 유형의 집계를 통해 중복이 포함될 수 있는 데이터를 분석합니다.

D. Amazon Managed Service for Apache Flink(이전 명칭: Amazon Kinesis Data Analytics)를 사용하여 최대 30분 기간 동안 시간 기반 분석을 수행하기 위해 다양한 유형의 집계를 활용하여 데이터를 분석합니다.

DEA-C01 문제 77

세션 매개변수 USE_CACHED_RESULT가 false로 설정되어 있다고 가정할 때, Snowpark 사용 측면에서 Snowflake 가상 웨어하우스의 특징은 무엇입니까?

A. 테이블에서 DataFrame을 생성하면 가상 데이터 웨어하우스가 시작됩니다.

B. read() 메서드를 사용하여 스테이징된 파일에서 DataFrame을 생성하면 가상 데이터 웨어하우스가 시작됩니다.

C. replace()와 같은 메서드를 사용하여 DataFrame을 변환하면 가상 데이터 웨어하우스가 시작됩니다.

D. 세션을 사용하여 데이터베이스를 쿼리하기 위해 Snowpark 저장 프로시저를 호출합니다. 호출()은 가상 저장소를 시작합니다.

DEA-C01 문제 78

한 회사가 고객 연락처 정보가 저장된 데이터 레이크를 관리하기 위해 Amazon S3와 AWS Glue Data Catalog를 사용합니다. 이 회사는 PySpark와 DynamicFrame을 사용하는 AWS Glue 작업을 통해 데이터 레이크 내의 데이터를 처리하는 워크플로우를 실행합니다.
데이터 엔지니어는 고객 우편번호가 데이터 레이크에 저장되는 방식 때문에 워크플로에서 오류가 발생하는 것을 발견했습니다. 일부 우편번호에는 불필요한 숫자나 유효하지 않은 문자가 포함되어 있습니다.
데이터 엔지니어는 데이터 레이크에서 오류를 해결하고 우편번호를 수정할 수 있는 솔루션이 필요합니다.

A. 우편번호 처리 워크플로에서 요구하는 형식에 맞는 PySpark용 스키마 정의를 생성합니다. 처리 중에 해당 스키마를 DynamicFrame에 전달합니다.

B. AWS Glue 워크플로 속성을 사용하여 작업 상태 공유를 허용합니다. 이전에 성공적으로 실행된 작업의 속성을 사용하여 AWS Glue 작업이 우편번호 열에서 값을 읽도록 구성합니다.

C. DynamicFrame의 우편번호 열에 대해 column.push_down_predicate 설정과 catalogPartitionPredicate 설정을 구성합니다.

D. DynamicFrame의 additional_options 매개변수 `useS3ListImplementation`을 True로 설정합니다.

DEA-C01 문제 79

한 회사가 아마존 S3 버킷에 원시 클릭스트림 데이터를 저장하고 있습니다. 이 회사는 자체 개발한 라이브러리를 사용하는 복잡한 PySpark 변환을 통해 매일 데이터를 처리해야 합니다. 변환이 완료된 데이터는 분석을 위해 아마존 레드시프트에 저장해야 합니다. 또한, 대규모 데이터 워크로드를 처리할 수 있도록 높은 확장성을 갖춰야 합니다. 이러한 요구 사항을 충족하면서 운영 오버헤드를 최소화하는 솔루션은 무엇일까요?

A. AWS Glue Studio를 사용하여 PySpark 작업을 빌드하고 예약합니다. 사용자 지정 라이브러리가 포함된 AWS Glue 데이터 연결을 구성합니다.

B. 사용자 지정 라이브러리가 포함된 사용자 지정 AMI를 사용하여 Amazon EC2 Auto Scaling 그룹을 이용해 PySpark 애플리케이션을 실행합니다.

C. Amazon EMR을 사용하여 PySpark 작업을 실행합니다. 부트스트랩 액션을 사용하여 사용자 지정 라이브러리를 설치합니다.

D. Amazon SageMaker Processing 작업을 사용하여 네이티브 SageMaker 라이브러리를 사용하는 PySpark 코드를 실행합니다.

DEA-C01 문제 80

온프레미스 서버에서 매일 약 1TB 크기의 CSV 파일이 생성됩니다. 해당 데이터에 대한 테이블, 내부 스테이지 및 파일 형식이 이미 Snowflake에 생성되어 데이터 로딩 프로세스를 용이하게 합니다. 운영 오버헤드를 최소화하면서 CSV 파일을 Snowflake로 가져오는 프로세스를 자동화하는 방법은 무엇일까요?

A. Snowflake에 하루에 한 번 실행되는 태스크를 생성하고, 내부 스테이지를 참조하는 복사 문을 실행합니다. 내부 스테이지는 온프레미스 서버에서 파일을 직접 읽어 가장 최근 파일을 온프레미스 서버의 테이블로 복사하여 Snowflake 테이블에 저장합니다.

B. 온프레미스 서버에서 SnowSQL을 사용하여 특정 파일을 내부 스테이지로 푸시하는 PUT 문을 실행하는 SQL 파일을 예약합니다. Snowflake에서 하루에 한 번 실행되는 작업을 생성하고, 내부 스테이지를 참조하는 OOPY WTO 문을 실행합니다. 파일이 내부 스테이지에 업로드된 후 작업이 시작되도록 예약합니다.

C. 온프레미스 서버에서 SnowSQL을 사용하여 특정 파일을 내부 스테이지로 푸시하는 PUT 문을 실행하는 SQL 파일을 예약 실행합니다. 내부 스테이지를 참조하는 copy into 문을 실행하는 파이프를 생성합니다. Snowpipe 자동 수집 기능은 새 파일이 내부 스테이지에 추가되면 자동으로 파일을 로드합니다.

D. 온프레미스 서버에서 Snowpark Python 라이브러리를 사용하는 Python 파일을 예약 실행합니다. 이 Python 스크립트는 CSV 데이터를 DataFrame으로 읽어 들여 테이블에 직접 데이터를 삽입하는 INSERT INTO 문을 생성합니다. 따라서 파일을 내부 스테이지로 이동하는 과정이 생략됩니다.

다른 버전: 2540Snowflake.DEA-C01.v2024-10-11.q119

최근 업로드: 116HCLSoftwareAcademy.HCL-DOM-AADM-12.v2026-06-27.q25; 116Apple.App-Development-with-Swift-Certified-User.v2026-06-27.q14; 143AAVSB.VTNE.v2026-06-27.q109; 136Qlik.QSSA2022.v2026-06-27.q56; 148Fortinet.FCP_FMG_AD-7.6.v2026-06-26.q61; 137Salesforce.Experience-Cloud-Consultant.v2026-06-26.q151; 135Symantec.250-579.v2026-06-26.q65; 157Snowflake.DEA-C01.v2026-06-26.q200; 117Microsoft.GH-500.v2026-06-26.q75; 138WGU.Introduction-to-Cryptography.v2026-06-26.q54