무료 온라인 액세스 Snowflake.DSA-C03.v2025-10-13.q101 모의 시험 (Page 21)

DSA-C03 문제 96

Snowpark Container Services를 사용하여 Kafka 토픽의 이벤트를 사용하는 실시간 예측 서비스를 성공적으로 배포했습니다. 이 서비스는 Snowflake 모델 레지스트리에 저장된 대용량 언어 모델(LLM)을 활용합니다. 추론 지연 시간이 길고 서비스가 수신 이벤트 속도를 따라잡는 데 어려움을 겪고 있습니다. 처리량을 높이고 지연 시간을 줄이도록 서비스를 최적화해야 합니다. 다음 중 어떤 작업을 함께 구현하면 Snowpark Container Services 배포의 성능을 가장 효과적으로 향상시킬 수 있을까요?

A. 서비스의 복제본 수를 늘리세요. 컨테이너화된 애플리케이션 내에서 배칭을 구현하여 단일 추론 호출에서 여러 이벤트를 처리하세요.

B. 더 작고 정확도가 낮은 LLM으로 전환하세요. 서비스의 'container.resources.cpu' 할당량을 늘리세요. Kafka로 전송하기 전에 데이터가 전처리되었는지 확인하세요.

C. CPU 사용률에 따라 서비스 자동 확장을 활성화합니다. 컨테이너화된 애플리케이션에서 모든 로깅 구문을 제거하여 1/0 오버헤드를 줄이세요.

D. 서비스에 대한 'container.resources.memory' 할당량을 늘리세요. 컨테이너화된 애플리케이션 내에서 자주 액세스하는 데이터의 캐싱을 구현하세요.

E. 스노우플레이크 외부에서 사용자 지정 모니터링 솔루션을 구현하고 애플리케이션의 병목 현상을 파악하세요. 서비스의 container.resources.gpu 할당량을 늘리세요.

DSA-C03 문제 97

이탈 예측 모델을 개발 중이며, Snowflake 모델 레지스트리를 사용하여 다양한 모델 버전에서 해당 모델의 성능을 추적하려고 합니다. 새 모델 버전을 등록한 후에는 평가 지표(예: AUC, F 1 점수)와 학습 실행과 관련된 사용자 지정 태그를 기록해야 합니다. 이름이 'churn_model'이고 버전이 'v2'인 등록된 모델이 있다고 가정할 때, 다음 코드 조각 중 Snowflake Python 커넥터와 'ModelRegistry' API를 사용하여 이러한 지표와 태그를 기록하는 올바른 방법을 보여주는 것은 무엇입니까?

C.
{<디>}:

DSA-C03 문제 98

Snowflake와 Snowpark를 사용하여 일일 매출에 대한 시계열 예측 모델을 검증하고 있습니다. 잔차 그림은 명확한 사인파 패턴을 보입니다. 다음 중 모델 개선을 위해 고려해야 할 사항은 무엇입니까? (해당되는 모든 항목 선택)

A. 모델의 정규화 강도를 높입니다.

B. 이전 판매 값을 나타내는 지연된 피처를 통합합니다(예: 전날, 전날 또는 전날의 판매).

C. 분산을 안정화하기 위해 대상 변수(판매량)에 Box-Cox 변환을 적용합니다.

D. 전반적인 모델 성능을 개선하기 위해 이상치 데이터 포인트를 제거합니다.

E. 사인파 패턴을 포착할 가능성이 더 높으므로 알고리즘을 선형 회귀 모델로 변경합니다.

DSA-C03 문제 99

Snowflake에서 Snowpark를 사용하여 고객 이탈을 예측하는 이진 분류 모델을 학습하고 있습니다. 데이터셋에는 수치형 및 범주형 특성이 혼합되어 있으며, 'COUNTRY' 특성의 카디널리티가 높은 것으로 확인되었습니다. 하지만 빈도가 낮은 국가에서는 모델 성능이 저하되는 것을 발견했습니다. 이를 해결하기 위해 학습 전에 'COUNTRY' 특성 내 소수 집단을 업샘플링하기로 했습니다. 대규모 데이터셋을 사용하고 네트워크 전체에서 데이터 셔플링을 최소화하려는 경우, Snowflake에서 업샘플링에 가장 적합하고 계산 효율이 높은 기법 조합은 무엇일까요?

A. Snowflake SQL의 'SAMPLE 절'과 각 소수 국가에 대한 'REPLACE'를 사용하여 별도의 임시 테이블을 생성한 후 UNION ALL로 결합합니다. 이 방법은 소규모 데이터셋에는 효율적이지만, 카디널리티가 높으면 확장성이 떨어집니다.

B. Snowflake의 'DataFrame.groupBy()' 및 'DataFrame.count()' 함수를 사용하여 소수 국가를 식별합니다. 그런 다음 각 소수 국가에 대해 DataFrame.unionByName() 함수를 사용하여 원본 데이터를 'DataFrame.sample()' 함수와 대체 연산을 사용하여 생성된 여러 개의 소수 국가 데이터 사본과 결합합니다. 이렇게 하면 Snowflake 내에서 데이터 이동이 최소화됩니다.

C. Python으로 작성된 저장 프로시저를 사용하여 각 국가를 반복하고, 소수 민족 국가를 식별한 다음, Snowpark에서 'DataFrame.sample()'을 사용하여 해당 국가를 복원하여 업샘플링합니다. 이 방법은 유연성이 가장 뛰어나지만, 컨텍스트 전환으로 인해 상당한 오버헤드가 발생합니다.

D. Java로 작성된 Snowflake UDF(사용자 정의 함수)를 활용하여 'COUNTRY' 피처에 대한 계층화 표본 추출을 수행하고, 업샘플링된 데이터세트에서 각 소수 민족 계층이 적절하게 표현되도록 합니다. UDF는 복잡한 로직을 구현할 수 있지만, Snowflake 내에서 디버깅하기 어려울 수 있습니다.

E. Snowpark의 'DataFrame.collect()'를 활용하여 전체 데이터셋을 클라이언트 머신으로 가져온 다음, Python의 scikit-learn 라이브러리를 사용하여 업샘플링합니다. 이 방법은 상당한 네트워크 오버헤드를 발생시키므로 소규모 데이터셋에만 적합합니다.

DSA-C03 문제 100

Snowflake 데이터를 사용하여 사기 탐지 모델을 구축하고 있습니다. 특징 중 하나는 '거래 금액'인데, 이 거래 금액은 매우 편향된 분포를 가지고 있으며 이상치 값을 포함합니다. 데이터를 머신 러닝 모델에 입력하기 전에 이상치의 영향을 최소화하고 분포 형태를 최대한 보존해야 한다는 점을 고려할 때, Snowflake에서 이 상황을 효과적으로 처리하는 데 가장 적합한 확장 기술은 무엇일까요? 충분한 컴퓨팅 리소스가 있다고 가정해 보겠습니다.

A. StandardScaler(Z-점수 정규화)

B. MinMaxScaler(최소-최대 스케일링)

C. RobustScaler(사분위 범위 사용)

D. 전력 변압기(Yeo-Johnson 또는 Box-Cox)

E. 트리 기반 모델은 왜곡된 데이터에 강하므로 확장이 필요하지 않습니다.

최근 업로드: 129SAP.C_S4CPB_2602.v2026-06-13.q7; 148SAP.C-S4CS-2602.v2026-06-13.q29; 169Salesforce.Slack-Con-201.v2026-06-13.q86; 173Oracle.1Z1-136.v2026-06-13.q46; 151BCS.BAPv5.v2026-06-13.q62; 139PaloAltoNetworks.SSE-Engineer.v2026-06-13.q18; 138SAP.C_CR125.v2026-06-13.q26; 136Proofpoint.PPAN01.v2026-06-13.q19; 142Workday.Workday-Pro-Time-Tracking.v2026-06-13.q19; 164API.API-1184.v2026-06-12.q40