무료 온라인 액세스 Snowflake.DSA-C03.v2025-10-13.q101 모의 시험 (Page 12)

DSA-C03 문제 51

Snowpark를 사용하여 제품 추천을 위한 협업 필터링 모델을 구축하고 있습니다. 'USER_ITEM INTERACTIONS' 테이블에 'USER ID', 'ITEM ID', 'INTERACTION TYPE' 열이 있습니다. Snowpark를 사용하여 이 데이터를 희소 행렬로 표현하고, 이를 행렬 분해 알고리즘의 입력으로 사용하려고 합니다. 다음 코드 조각 중 Snowflake 내에서 대용량 데이터 세트를 효율적으로 처리하면서 이러한 목표를 가장 잘 달성하는 것은 무엇입니까?

C.
{<디>}:

DSA-C03 문제 52

Snowpark Python을 사용하여 'WEB ACTIVITY'라는 Snowflake 테이블에 저장된 대규모 웹사이트 사용자 활동 로그 데이터 세트를 처리하고 있습니다. 이 테이블에는 'USER ID', 'TIMESTAMP', 'PAGE URL', 'BROWSER', 'IP ADDRESS'와 같은 열이 포함되어 있습니다. 모델 성능을 개선하려면 관련 없는 데이터를 제거해야 합니다. 사용자 전환율을 예측하는 모델에서 관련 없는 데이터를 제거하는 데 다음 중 단독으로 또는 조합하여 가장 효과적인 작업은 무엇이며, 이러한 작업을 보여주는 Snowpark Python 코드 조각은 무엇입니까? 전환율은 페이지 상호작용에 따라 달라지며 모델은 세션 ID와 세션 기간만 활용한다고 가정해 보겠습니다.

A. 옵션 A

B. 옵션 B

C. 옵션 C

D. 옵션 D

E. 옵션 E

DSA-C03 문제 53

Snowflake에 저장된 대규모 금융 데이터세트에서 비지도 학습을 사용하여 사기 거래를 식별하는 업무를 맡게 되었습니다. 이 데이터세트에는 거래 금액, 가맹점 ID, 위치, 시간, 사용자 ID와 같은 특징이 포함되어 있습니다. 클러스터링과 이상 탐지 기술을 함께 사용하기로 결정했습니다. 다음 중 Snowflake의 기능을 활용하고 오탐(false positive)을 최소화하면서 이 목표를 달성하는 데 가장 효과적인 단계와 기술은 무엇일까요?

A. 사용 가능한 모든 특성을 사용하여 전체 데이터 세트에 K-평균 클러스터링을 수행한 다음, 클러스터에 속하지 않는 모든 거래를 사기로 표시합니다. 프로세스를 단순화하기 위해 특성 선택이나 엔지니어링은 무시합니다.

B. 차원 축소를 위해 주성분 분석(PCA)을 적용한 후, DBSCAN 클러스터링을 사용하여 정상 거래가 밀집된 영역을 식별하고, 밀집 영역에 속하지 않는 모든 거래를 잠재적 사기 거래로 표시합니다. 그 후, 이상 데이터 포인트를 검토합니다.

C. 복잡한 JOIN과 윈도우 함수를 사용하여 SQL에서 직접 격리 포레스트 알고리즘을 구현하여 거래량과 속도를 기반으로 이상을 식별합니다.

D. Snowflake Python UDF를 사용하여 특성 선택을 수행하고, K-평균 클러스터링과 Isolation Forest 또는 Local Outlier Factor(LOF)와 같은 이상 탐지 기법을 조합하여 적용한 다음, 각 거래의 사기 가능성에 따라 점수를 매깁니다. 매개변수를 조정하고 홀드아웃 검증 세트를 사용하여 Snowpark DataFrame을 사용하여 거짓 양성을 최소화합니다.

E. '거래 금액' 기능만 사용하고 Snowflake SQL에서 히스토그램 기반 이상 감지를 수행하여 일반적인 범위를 벗어나는 값을 식별하고 다른 잠재적으로 관련된 정보는 무시합니다.

DSA-C03 문제 54

Snowflake에 고객 리뷰가 포함된 데이터 세트가 있습니다. 'review_text' 열 중 하나에 고객 피드백(자유 텍스트)이 포함되어 있습니다. 이러한 리뷰에 대한 감정 분석을 수행하고 감정 점수를 머신 러닝 모델에 특성으로 포함하려고 합니다. 또한, 감정을 '긍정적', '부정적', '중립적'으로 분류하려고 합니다. Snowflake 내에서 확장성과 효율성이 필요하다는 점을 고려할 때, 어떤 방법을 사용할 수 있을까요?

A. 사전 학습된 감정 분석 라이브러리(예: NLTK 또는 spaCy)와 Python UDF(사용자 정의 함수)를 사용하여 감정 점수를 계산하고 분류합니다. UDF를 Snowflake에 배포하고 'review_text' 열에 적용합니다.

B. Snowflake 테이블에서 Snowpark Python DataFrame을 만들고, Snowpark 환경 내의 감성 분석 라이브러리를 사용하여 감성을 분류한 다음, 결과 DataFrame을 Snowflake에 새 테이블로 다시 저장합니다.

C. Snowflake의 외부 함수를 활용하여 기존 감정 분석 API(예: Google Cloud Natural Language API 또는 AWS Comprehend)를 호출하여 리뷰 텍스트를 전달하고 반환된 감정 점수와 카테고리를 저장합니다. 적절한 API 키 관리 및 네트워크 구성을 확보하세요.

D. 모든 'review_text' 데이터를 읽고, Snowflake 외부의 감성 분석 소프트웨어를 실행하는 외부 서버로 데이터를 전송한 다음, 결과를 새 테이블에 다시 쓰는 Snowflake 프로시저를 사용합니다.

E. 복잡한 문자열 매칭과 키워드 분석을 활용하여 미리 정의된 어휘집을 기반으로 감정을 파악하는 일련의 Snowflake SQL 쿼리를 생성합니다. CASE 문을 통해 범주를 지정합니다.

DSA-C03 문제 55

Snowflake에서 고객 거래 데이터세트에 대한 탐색적 데이터 분석을 수행하여 여러 고객 관련 특성(예: 연령, 위치, 이전 거래 횟수)을 기반으로 거래 가치를 예측하는 선형 회귀 모델을 준비하고 있습니다. 'customer_age'와 'transaction_value' 사이에 비선형 관계가 있는 것으로 추정됩니다. 다음 Snowflake SQL 기법 중 'customer_age' 변수를 탐색하고 변환하여 선형 회귀 모델에 더 적합하게 만드는 데 가장 적합한 것은 무엇입니까?

A. 'customer_age' 대 'transaction_value'의 산점도가 'customer_age'가 증가함에 따라 평평해지는 곡선을 보이면 'customer_age'에 대수 변환을 적용합니다.

B. 상호 작용 효과를 확인하지 않고 'customer_ageA2'와 'customer_ageA3'을 새 열로 테이블에 추가하여 다항식 특성을 만듭니다.

C. 윈도우 함수를 사용하여 'customer_age'를 사분위수로 나누고 각 사분위수를 선형 회귀 모델에서 범주형 변수로 처리합니다.

D. 함수를 사용하여 'customer_age'와 'transaction_value' 사이의 피어슨 상관 계수를 계산합니다. 상관 관계가 낮으면 'customer_age' 변수를 삭제합니다.

E. Snowpark Python에서 Box-Cox 변환을 구현하고, 데이터를 기반으로 적절한 변환 매개변수를 선택하고, 'customer_age' 기능에 변환을 적용합니다.

최근 업로드: 108Microsoft.AZ-500-KR.v2026-06-04.q213; 111Microsoft.DP-600-KR.v2026-06-04.q98; 105Microsoft.AZ-204-KR.v2026-06-04.q237; 136Microsoft.PL-600-KR.v2026-06-04.q112; 193Microsoft.SC-300-KR.v2026-06-03.q151; 154Microsoft.DP-600-KR.v2026-06-03.q70; 870PMI.PMP-KR.v2026-06-01.q1069; 231Microsoft.MS-102-KR.v2026-06-01.q252; 211Amazon.DOP-C02-KR.v2026-06-01.q207; 159Microsoft.AZ-104-KR.v2026-06-01.q197