DSA-C03 문제 91

고객 이름, 이메일 주소, 전화번호 등 개인 식별 정보(PII)가 포함된 '고객 데이터'라는 Snowflake 테이블을 사용하고 있습니다. 팀에서는 고객 인구 통계 및 행동을 파악하기 위해 이 데이터에 대한 탐색적 데이터 분석을 수행해야 합니다. 하지만 PII는 보호되어야 하며, 권한이 있는 직원만 민감한 정보에 접근할 수 있도록 해야 합니다. 안전한 EDA를 달성하기 위해 Snowflake에서 다음 중 어떤 전략을 구현해야 할까요?

DSA-C03 문제 92

데이터 과학자가 Snowflake에 저장된 웹사이트 트래픽 데이터를 분석하고 있습니다. 이 데이터에는 여러 페이지의 일일 페이지 뷰가 포함되어 있습니다. 데이터 과학자는 특정 페이지인 '홈'의 페이지 뷰 분산이 최근 크게 증가했다고 의심합니다. 다음 중 시간 경과에 따른 '홈' 페이지 뷰 분산의 잠재적 변화를 파악하는 데 사용할 수 있는 단계와 Snowflake SQL 쿼리는 무엇입니까? (예: 특정 날짜 이전과 이후의 분산 비교) 해당하는 모든 항목을 선택하십시오.

DSA-C03 문제 93

Snowflake에서 사기 탐지 시스템을 개발하고 있습니다. Snowflake Cortex를 사용하여 거래 설명에서 임베딩을 생성하고, 유사한 사기 거래를 클러스터링하는 것을 목표로 합니다. Snowflake Cortex를 사용하여 수백만 개의 거래 설명으로 구성된 대규모 데이터 세트에 대한 임베딩 생성의 성능과 비용을 최적화하는 데 가장 효과적인 방법은 무엇입니까? 특히 대규모 임베딩 생성에 따른 잠재적 비용 영향을 고려할 때, 다음 중 어떤 방법이 가장 효과적일까요? 두 가지 옵션을 선택하세요.

DSA-C03 문제 94

Snowpark ML과 Dynamic Tables를 사용하여 실시간 사기 탐지 시스템을 구축하고 있습니다. 원시 거래 데이터는 Snowflake 스트림을 통해 지속적으로 수신됩니다. 데이터를 지속적으로 변환하고, 모델을 학습시키고, 거의 실시간으로 새로운 거래에 대한 점수를 매기는 데이터 과학 파이프라인을 구축해야 합니다. 이 사기 탐지 시스템에서 낮은 지연 시간과 높은 처리량을 달성하는 데 가장 적합한 Snowflake 기능 조합은 무엇입니까? 해당하는 모든 항목을 선택하세요.

DSA-C03 문제 95

Snowpark Python을 사용하여 Snowflake 테이블인 'FEEDBACK DATA'에 저장된 고객 피드백 데이터를 처리하는 데이터 파이프라인을 구축하는 업무를 맡게 되었습니다. 이 테이블에는 자유 텍스트 피드백이 포함되어 있으며, 감정 분석을 위해 이 데이터를 정리하고 준비해야 합니다. 구체적으로 불용어를 제거하고, 어간 추출을 수행하고, 결측값을 처리해야 합니다. 다음 코드 조각과 전략 중 Snowpark 환경 내에서 이 작업에 가장 효과적이고 성능이 뛰어난 솔루션을 제공하는 것은 무엇일까요?