Professional-Data-Engineer 문제 296

온라인 리테일러가 Google App Engine에서 현재 애플리케이션을 구축했습니다. 이 회사의 새로운 이니셔티브는 고객이 애플리케이션을 통해 직접 거래할 수 있도록 애플리케이션을 확장하도록 요구합니다.
그들은 BI(Business Intelligence) 도구를 사용하여 쇼핑 거래를 관리하고 여러 데이터 세트의 결합된 데이터를 분석해야 합니다. 그들은 이 목적을 위해 단일 데이터베이스만 사용하고 싶어합니다. 어떤 Google Cloud 데이터베이스를 선택해야 할까요?

Professional-Data-Engineer 문제 297

Google Cloud에서 IoT 데이터를 Cloud Pub/Sub에서 Cloud Dataflow를 거쳐 BigQuery로 스트리밍하기 위한 새로운 파이프라인을 만들고 있습니다. 데이터를 미리 보는 동안 약 2%의 데이터가 손상된 것으로 보입니다. 이 손상된 데이터를 필터링하기 위해 Cloud Dataflow 파이프라인을 수정해야 합니다. 어떻게 해야 하나요?

Professional-Data-Engineer 문제 298

BigQuery, Cloud Dataflow, Cloud Dataproc에서 실행되는 데이터 파이프라인이 있습니다. 상태 검사를 수행하고 동작을 모니터링한 다음 파이프라인이 실패하면 파이프라인을 관리하는 팀에 알려야 합니다. 또한 여러 프로젝트에서 작업할 수 있어야 합니다. 플랫폼의 관리형 제품이나 기능을 사용하는 것이 좋습니다. 어떻게 해야 할까요?

Professional-Data-Engineer 문제 299

Cloud Machine Learning Engine은 어떤 소프트웨어 라이브러리를 지원합니까?

Professional-Data-Engineer 문제 300

모바일 애플리케이션에 새로운 스토리지 시스템을 배포하고 있는데, 이는 미디어 스트리밍 서비스입니다. 가장 적합한 것은 Google Cloud Datastore라고 결정합니다. 여러 속성을 가진 엔터티가 있는데, 그 중 일부는 여러 값을 가질 수 있습니다. 예를 들어, 엔터티 '영화'에서 속성 '배우'와 속성 '태그'는 여러 값을 갖지만 속성 '출시일'은 그렇지 않습니다. 일반적인 쿼리는 actor=<배우 이름>인 모든 영화를 date_released 순으로 정렬하거나 tag=코미디인 모든 영화를 date_released 순으로 정렬합니다. 인덱스 수의 조합적 폭발을 어떻게 방지해야 할까요?