Professional-Data-Engineer 문제 276

조직에서 사용자 수준 데이터가 있는 테이블이 포함된 Google BigQuery 데이터 세트를 유지 관리합니다. 그들은 사용자 수준 데이터에 대한 액세스를 제어하는 ​​동시에 이 데이터의 집계를 다른 Google Cloud 프로젝트에 노출하려고 합니다. 또한 전체 스토리지 비용을 최소화하고 다른 프로젝트의 분석 비용이 해당 프로젝트에 할당되도록 해야 합니다. 그들은 무엇을 해야 할까요?

Professional-Data-Engineer 문제 277

고객의 거리 주소가 포함된 BigQuery 데이터 세트가 하나 있습니다. 데이터 세트에서 거리 주소의 모든 발생을 검색하려고 합니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 278

기본적으로 Dataflow는 다음 중 어떤 윈도잉 동작을 무제한 데이터 세트에 적용합니까?

Professional-Data-Engineer 문제 279

Cloud Dataproc 클러스터를 관리하고 있습니다. 클러스터에서 진행 중인 작업을 잃지 않으면서 비용을 최소화하면서 작업을 더 빠르게 실행해야 합니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 280

일정에 따라 실행해야 하는 여러 배치 작업을 구현하고 있습니다. 이러한 작업에는 특정 순서로 실행해야 하는 많은 상호 종속 단계가 있습니다. 작업의 일부는 셸 스크립트 실행, Hadoop 작업 실행 및 BigQuery에서 쿼리 실행을 포함합니다. 작업은 몇 분에서 몇 시간까지 실행될 것으로 예상됩니다. 단계가 실패하면 고정된 횟수만큼 다시 시도해야 합니다. 이러한 작업의 실행을 관리하기 위해 어떤 서비스를 사용해야 합니까?