Professional-Data-Engineer 문제 146

시계열 측정항목을 집계하고 Cloud Bigtable에 쓰는 Cloud Dataflow 작업이 있는 데이터 파이프라인이 있습니다. 이 데이터는 조직 전체에서 수천 명의 사용자가 사용하는 대시보드를 제공합니다. 추가 동시 사용자를 지원하고 데이터 쓰기에 필요한 시간을 줄여야 합니다. 어떤 두 가지 조치를 취해야 합니까? (2개를 선택하세요.)

Professional-Data-Engineer 문제 147

Cloud Bigtable 성능이 좋지 않은 이유가 아닌 것은?

Professional-Data-Engineer 문제 148

회사의 온프레미스 Apache Hadoop 서버 수명이 거의 다 되었고 IT 부서에서 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 클러스터의 유사 마이그레이션에는 노드당 50TB의 Google 영구 디스크가 필요합니다. CIO는 많은 블록 스토리지를 사용하는 데 드는 비용을 걱정하고 있습니다.
마이그레이션의 스토리지 비용을 최소화하려고 합니다. 당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 149

내부 IT 애플리케이션 중 하나와 Google BigQuery를 통합하고 있으므로 사용자가 애플리케이션 인터페이스에서 BigQuery를 쿼리할 수 있습니다. 개별 사용자가 BigQuery에 인증하는 것을 원하지 않으며 이들에게 데이터 세트에 대한 액세스 권한을 부여하고 싶지 않습니다. IT 애플리케이션에서 BigQuery에 안전하게 액세스해야 합니다. 당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 150

전자 상거래 회사의 장바구니 포기 시스템을 설계하고 있습니다. 시스템은 다음 규칙에 따라 사용자에게 메시지를 보냅니다.
* 1시간 동안 사이트에서 사용자의 상호 작용 없음
* 장바구니에 $30 이상의 제품을 추가했습니다.
* 거래가 완료되지 않았습니다.
Google Cloud Dataflow를 사용하여 데이터를 처리하고 메시지를 보내야 하는지 여부를 결정합니다. 파이프라인을 어떻게 설계해야 합니까?