DSA-C03 문제 66

Snowflake와 외부 함수를 사용하여 실시간 사기 탐지 시스템을 개발하고 있습니다. 이 시스템은 Google Cloud A1 Platform Prediction에 호스팅된 사전 학습된 TensorFlow 모델을 기준으로 수신 거래의 점수를 계산합니다. 거래 데이터는 Snowflake 스트림에 저장됩니다. 목표는 지연 시간과 비용을 최소화하는 것입니다. 다음 중 외부 함수를 통해 Snowflake와 Google Cloud A1 Platform Prediction 서비스 간의 상호작용을 최적화하는 데 가장 효과적인 전략은 무엇입니까? 성능과 비용을 모두 고려합니다.

DSA-C03 문제 67

고객 세분화 모델을 구축하고 있으며 다양한 테이블의 데이터를 집계해야 합니다. Snowflake에 다음과 같은 테이블이 있습니다. 'customer demographics'(고객 ID, 나이, 도시, 소득) 'customer transactionS'(거래 ID, 고객 ID, 거래 날짜, 금액) 'product_details'(제품 ID, 카테고리) 'transaction_products'(거래 ID, 제품 ID) 목표는 고객 인구 통계와 각 고객이 지난 1년 동안 '전자제품' 카테고리의 제품에 지출한 총 금액을 포함하는 단일 Snowpark DataFrame을 생성하는 것입니다. 단, 소득이 50,000달러를 초과하는 고객만 고려하고, 거래 기록이 없는 고객의 경우 해당 고객의 'total_electronics_spending' 열에 0 값을 할당하여 처리해야 합니다. Snowpark를 사용하여 이를 어떻게 달성할 수 있을까요? 올바른 옵션을 선택하세요.

DSA-C03 문제 68

Snowflake에서 대출 채무 불이행 위험을 예측하기 위해 복잡한 랜덤 포레스트 모델을 학습시켰습니다. '신용 점수'와 '부채 대 소득 비율'이 예측 채무 불이행 확률에 미치는 개별 효과와 복합 효과를 이해하고자 합니다. 이러한 관계를 시각화하고 해석하는 데 가장 적합한 접근 방식은 무엇입니까?

DSA-C03 문제 69

데이터 과학자가 두 가지 광고 캠페인의 웹사이트 클릭률(CTR)을 분석하고 있습니다. 캠페인 A는 2주 동안 진행되었고 10,000회의 노출과 500회의 클릭을 기록했습니다. 캠페인 B 역시 2주 동안 진행되었고 12,000회의 노출과 660회의 클릭을 기록했습니다. 데이터 과학자는 두 캠페인 간의 CTR에 통계적으로 유의미한 차이가 있는지 확인하고자 합니다. 모집단 표준 편차가 알려지지 않았고 두 캠페인의 모집단 표준 편차가 동일하지 않다고 가정합니다. 어떤 통계 검정을 사용하는 것이 가장 적합하며, 이 검정의 p-값을 근사하는 데 어떤 Snowflake SQL 코드를 사용해야 할까요? ('clicks_b'와 'clicks_b'는 이미 정의된 Snowflake 변수라고 가정합니다.)

DSA-C03 문제 70

통신 회사의 고객 이탈 예측 모델을 구축하고 있습니다. '고객 데이터' 테이블에는 고객의 월별 청구 금액을 나타내는 '월 지출액' 열이 있습니다. 이 열을 이진화하여 고객이 '고액 지출자'인지 '저액 지출자'인지 나타내는 특성을 생성하려고 합니다. 75달러 이상 지출하는 고객을 '고액 지출자'로 분류합니다. 다음 Snowflake SQL 문 중 성능과 가독성을 고려하면서 이진화된 결과 열에 NULL 값이 포함되지 않도록 하는 가장 효율적이고 정확한 방법은 무엇입니까?