무료 온라인 액세스 Snowflake.DSA-C03.v2025-10-13.q101 모의 시험 (Page 2)

DSA-C03 문제 1

데이터 엔지니어는 Snowflake에서 사용자 활동 로그가 포함된 'USER ACTIVITY'라는 테이블에서 중복된 행을 제거하는 작업을 맡고 있습니다. 이 테이블에는 'ACTIVITY TIMESTAMP', 'ACTIVITY TYPE', 'DEVICE_ID' 열이 있습니다. 데이터 엔지니어는 'USER ID', 'ACTIVITY TYPE', 'DEVICE_ID' 열만 고려하여 중복 행을 제거하려고 합니다. 지정된 열의 각 고유한 조합에 대해 가장 빠른 'ACTIVITY TIMESTAMP'만 유지하면서 이를 달성하는 가장 효율적이고 정확한 SQL 쿼리는 무엇입니까?

A. 옵션 A

B. 옵션 B

C. 옵션 C

D. 옵션 D

E. 옵션 E

DSA-C03 문제 2

Snowflake ML을 사용하여 사기 탐지 모델을 개발했고 모델의 예측을 기반으로 예상 지불금(손실 또는 이익)을 추정하려고 합니다. 잠재적으로 사기성 거래를 조사하는 데 드는 비용은 50달러입니다. 사기성 거래가 탐지되지 않을 경우 평균 손실은 1,000달러입니다. 검증 데이터 세트에 대한 모델의 혼동 행렬은 다음과 같습니다. 예측 사기 예측됨 사기 아님 실제 사기 150 50 실제 사기 아님 20 780 'FRAUD PREDICTIONS' 테이블에 'TRANSACTION ID', 'ACTUAL FRAUD' 및 'PREDICTED FRAUD'(사기는 1, 사기 아님은 0) 열이 있다고 가정할 때 Snowflake에서 다음 SQL 쿼리 중 1,000개 거래당 예상 지불금에 대한 가장 정확한 추정치를 제공하는 것은 무엇입니까?

A. 옵션 A

B. 옵션 B

C. 옵션 C

D. 옵션 D

E. 옵션 E

DSA-C03 문제 3

감정 분석을 위해 'PRODUCT REVIEWS'라는 Snowflake 테이블을 준비해야 합니다. 이 테이블에는 'REVIEW ID', 'PRODUCT ID', 'REVIEW TEXT', 'RATING', 'TIMESTAMP'와 같은 열이 포함되어 있습니다. 목표는 모델 학습을 최적화하기 위해 관련 없는 필드를 제거하는 것입니다. 다음 중 Snowpark SQL을 사용하여 'PRODUCT REVIEWS' 테이블에서 저장 효율성과 모델 정확도를 모두 고려하여 관련 없거나 문제가 있는 필드를 식별하고 제거하는 유효하고 효과적인 전략은 무엇일까요? 모델에 리뷰 텍스트, 리뷰 ID, 그리고 평점만 필요하다고 가정합니다.

A. 'ALTER TABLE DROP COLUMN'을 사용하여 감성 분석 모델과 관련이 없는 'TIMESTAMP' 열을 직접 제거합니다. SQL: 'ALTER TABLE PRODUCT REVIEWS DROP COLUMN TIMESTAMP;'

B. 'REVIEW _ TEXT', 'REVIEW_ID', 'RATING' 열만 선택하는 VIEW를 생성하여 모델에서 관련 없는 열을 효과적으로 숨깁니다. SQL: 'CREATE OR REPLACE VIEW REVIEWS FOR ANALYSIS AS SELECT REVIEW TEXT, REVIEW ID, RATING FROM PRODUCT REVIEWS;'

C. 'CREATE TABLE AS SELECT'를 사용하여 관련 열 CREVIEW_TEXT, 'REVIEW_ID', 'RATING'만 포함하는 새 테이블 'REVIEWS_CLEANED'를 생성합니다. SQL: 'CREATE OR REPLACE TABLE REVIEWS CLEANED AS SELECT REVIEW TEXT, REVIEW ID, RATING FROM PRODUCT REVIEWS;'

D. REVIEW_TEXT에서 'NULL' 값이 있는 행을 삭제한 다음 'ALTER TABLE. SQL: 'CREATE OR REPLACE TABLE PRODUCT REVIEWS AS SELECT FROM PRODUCT REVIEWS WHERE REVIEW TEXT IS NOT NULL; ALTER TABLE PRODUCT REVIEWS DROP COLUMN PRODUCT ID; ALTER TABLE PRODUCT REVIEWS DROP COLUMN TIMESTAMP;'를 사용하여 'PRODUCT_ID' 및 'TIMESTAMP' 열을 삭제합니다.

E. 위의 모든 것.

DSA-C03 문제 4

한 금융 기관이 비정상적인 거래 패턴을 기반으로 사기 행위를 의심합니다. 연관 규칙 마이닝을 사용하여 사기를 나타내는 다양한 거래 속성(예: 거래 금액, 위치, 시간대, 가맹점 카테고리 코드) 간의 관계를 파악하려고 합니다. 데이터는 'TRANSACTIONS'라는 Snowflake 테이블에 저장됩니다. 이 사기 탐지 시나리오에서 연관 규칙 마이닝을 적용할 때 다음 중 중요한 고려 사항은 무엇입니까?

A. 통계적 유의성을 보장하고 드문 사기 이벤트에 대한 과도한 적합을 방지하기 위해 지원이 매우 높은(예: > 0.1) 규칙에만 집중합니다.

B. '거래 금액' 및 '시간대'와 같은 연속형 변수를 의미 있는 범주로 신중하게 분리하여 연관 규칙 마이닝을 활성화하고, 다양한 분리 전략이 결과 규칙에 미치는 영향을 고려합니다.

C. 지원이 비교적 낮더라도 신뢰도와 리프트가 높은 규칙을 우선시합니다. 속성의 드물지만 예측 가능성이 높은 조합은 사기 활동의 강력한 지표가 될 수 있기 때문입니다.

D. 고유 값의 수가 많은 거래 속성(예: 특정 위치 좌표)은 무시하세요. 그렇지 않으면 규칙이 폭발적으로 늘어나고 해석이 어려워질 수 있습니다.

E. 외부 Python 환경에서 데이터를 추출하여 처리하는 대신, Snowflake 내에서 SQL을 사용하여 Apriori 알고리즘을 직접 실행하여 성능과 확장성을 극대화합니다.

DSA-C03 문제 5

Snowpark를 사용하여 Snowflake에 머신 러닝 모델을 성공적으로 배포하고 예측을 생성하고 있습니다. 예측 중 모델에 문제(예: 특성 누락, 잘못된 데이터 유형)가 발생하더라도 프로세스가 중단되지 않고 오류가 적절하게 기록되도록 강력한 오류 처리 메커니즘을 구현해야 합니다. 사용자 정의 함수(UDF)를 사용하여 모델을 호출하고 있습니다. 다음 전략 중 어떤 것을 조합하여 사용할 때 이 시나리오에서 최상의 오류 처리 및 모니터링 기능을 제공합니까?

A. UDF 내에서 'TRY...CATCH' 블록을 사용하여 예외를 포착하고, 오류를 별도의 Snowflake 테이블에 기록하고, 영향을 받은 행에 대한 기본 예측 값(예: NULL)을 반환합니다.

B. UDE 내에서 명시적인 오류 처리 없이 Snowflake의 쿼리 기록에만 의존하여 실패한 예측을 식별하고 모델을 디버깅합니다.

C. 자세한 쿼리 실행 통계를 얻고 잠재적인 성능 병목 현상을 식별하기 위해 예측 호출을 'SYSTEM$QUERY_PROFILE' 함수로 래핑합니다.

D. Snowflake의 이벤트 테이블을 사용하여 UDF 실행과 관련된 오류 및 감사 로그를 캡처합니다.

E. UDE 내부에서 호출되는 외부 함수를 사용하여 외부 파일 저장소(예: AWS S3)에 오류 메시지를 작성하여 사용자 정의 로깅 솔루션을 구현합니다.

최근 업로드: 130Snowflake.DSA-C03.v2025-10-13.q101; 114Adobe.AD0-E902.v2025-10-13.q19; 129CompTIA.CLO-002.v2025-10-13.q140; 123Salesforce.B2C-Commerce-Architect.v2025-10-13.q59; 135Oracle.1z0-1047-25.v2025-10-11.q32; 217IAPP.CIPP-E.v2025-10-10.q185; 158ATLASSIAN.ACP-120.v2025-10-09.q64; 165Google.Associate-Data-Practitioner.v2025-10-09.q48; 139Confluent.CCAAK.v2025-10-09.q20; 148ServiceNow.CTA.v2025-10-09.q17