Professional-Data-Engineer 문제 221

온라인 판매 기능을 Google Home과 같은 다양한 재택 도우미와 통합하려는 소매업체입니다. 고객 음성 명령을 해석하고 백엔드 시스템에 명령을 내려야 합니다.
어떤 솔루션을 선택해야 합니까?

Professional-Data-Engineer 문제 222

Cloud Storage에 데이터를 보관하려고 합니다. 일부 데이터는 매우 민감하기 때문에 "TNO(Trust No One)" 접근 방식을 사용하여 데이터를 암호화하여 클라우드 제공업체 직원이 데이터를 해독하지 못하도록 하려고 합니다.
당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 223

팀은 회사에서 ETL을 개발하고 유지 관리할 책임이 있습니다. Dataflow 작업 중 하나가 입력 데이터의 일부 오류로 인해 실패하고 있으며 파이프라인(.
모든 실패한 데이터를 재처리할 수 있음).
당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 224

분석 팀은 몇 가지 다른 메트릭을 기반으로 회사와 다시 협력할 가능성이 가장 높은 고객을 결정하기 위해 간단한 통계 모델을 구축하려고 합니다. 그들은 Google Cloud Storage에 저장된 데이터를 사용하여 Apache Spark에서 모델을 실행하기를 원하며 Google Cloud Dataproc을 사용하여 이 작업을 실행하도록 권장했습니다. 테스트에 따르면 이 워크로드는 15개 노드 클러스터에서 약 30분 안에 실행되어 결과를 Google BigQuery로 출력할 수 있습니다. 계획은 이 워크로드를 매주 실행하는 것입니다.
비용 대비 클러스터를 어떻게 최적화해야 합니까?

Professional-Data-Engineer 문제 225

개인 사용자 데이터와 관련된 민감한 프로젝트를 진행 중입니다.