DSA-C03 문제 96

Snowpark Container Services를 사용하여 Kafka 토픽의 이벤트를 사용하는 실시간 예측 서비스를 성공적으로 배포했습니다. 이 서비스는 Snowflake 모델 레지스트리에 저장된 대용량 언어 모델(LLM)을 활용합니다. 추론 지연 시간이 길고 서비스가 수신 이벤트 속도를 따라잡는 데 어려움을 겪고 있습니다. 처리량을 높이고 지연 시간을 줄이도록 서비스를 최적화해야 합니다. 다음 중 어떤 작업을 함께 구현하면 Snowpark Container Services 배포의 성능을 가장 효과적으로 향상시킬 수 있을까요?

DSA-C03 문제 97

이탈 예측 모델을 개발 중이며, Snowflake 모델 레지스트리를 사용하여 다양한 모델 버전에서 해당 모델의 성능을 추적하려고 합니다. 새 모델 버전을 등록한 후에는 평가 지표(예: AUC, F 1 점수)와 학습 실행과 관련된 사용자 지정 태그를 기록해야 합니다. 이름이 'churn_model'이고 버전이 'v2'인 등록된 모델이 있다고 가정할 때, 다음 코드 조각 중 Snowflake Python 커넥터와 'ModelRegistry' API를 사용하여 이러한 지표와 태그를 기록하는 올바른 방법을 보여주는 것은 무엇입니까?

DSA-C03 문제 98

Snowflake와 Snowpark를 사용하여 일일 매출에 대한 시계열 예측 모델을 검증하고 있습니다. 잔차 그림은 명확한 사인파 패턴을 보입니다. 다음 중 모델 개선을 위해 고려해야 할 사항은 무엇입니까? (해당되는 모든 항목 선택)

DSA-C03 문제 99

Snowflake에서 Snowpark를 사용하여 고객 이탈을 예측하는 이진 분류 모델을 학습하고 있습니다. 데이터셋에는 수치형 및 범주형 특성이 혼합되어 있으며, 'COUNTRY' 특성의 카디널리티가 높은 것으로 확인되었습니다. 하지만 빈도가 낮은 국가에서는 모델 성능이 저하되는 것을 발견했습니다. 이를 해결하기 위해 학습 전에 'COUNTRY' 특성 내 소수 집단을 업샘플링하기로 했습니다. 대규모 데이터셋을 사용하고 네트워크 전체에서 데이터 셔플링을 최소화하려는 경우, Snowflake에서 업샘플링에 가장 적합하고 계산 효율이 높은 기법 조합은 무엇일까요?

DSA-C03 문제 100

Snowflake 데이터를 사용하여 사기 탐지 모델을 구축하고 있습니다. 특징 중 하나는 '거래 금액'인데, 이 거래 금액은 매우 편향된 분포를 가지고 있으며 이상치 값을 포함합니다. 데이터를 머신 러닝 모델에 입력하기 전에 이상치의 영향을 최소화하고 분포 형태를 최대한 보존해야 한다는 점을 고려할 때, Snowflake에서 이 상황을 효과적으로 처리하는 데 가장 적합한 확장 기술은 무엇일까요? 충분한 컴퓨팅 리소스가 있다고 가정해 보겠습니다.