Professional-Data-Engineer 문제 166

소프트웨어는 모든 메시지에 대해 간단한 JSON 형식을 사용합니다. 이러한 메시지는 Google Cloud Pub/Sub에 게시된 다음 Google Cloud Dataflow로 처리되어 CFO를 위한 실시간 대시보드를 만듭니다. 테스트하는 동안 대시보드에서 일부 메시지가 누락되었음을 알 수 있습니다. 로그를 확인하면 모든 메시지가 Cloud Pub/Sub에 성공적으로 게시되고 있습니다. 다음에 무엇을 해야 합니까?

Professional-Data-Engineer 문제 167

Cloud Pub/Sub에서 메시지를 가져오고 데이터를 BigQuery로 보내는 Node.js로 작성된 Cloud Functions가 있습니다. Pub/Sub 주제의 메시지 처리 속도가 예상보다 훨씬 높지만 Stackdriver 로그 뷰어에 오류가 기록되지 않음을 확인했습니다. 이 문제의 가장 가능성 있는 두 가지 원인은 무엇입니까? 2개의 답변을 선택하세요.

Professional-Data-Engineer 문제 168

GCP에 데이터 파이프라인을 배포하는 과정에서 20TB의 텍스트 파일을 위한 스토리지를 설계하고 있습니다. 입력 데이터는 CSV 형식입니다. 여러 엔진을 사용하여 Cloud Storage의 데이터를 쿼리할 여러 사용자의 집계 값 쿼리 비용을 최소화하려고 합니다. 어떤 스토리지 서비스와 스키마 디자인을 사용해야 합니까?

Professional-Data-Engineer 문제 169

회사를 위한 새로운 실시간 데이터 웨어하우스를 구축 중이며 Google BigQuery 스트리밍 삽입을 사용할 것입니다. 데이터가 한 번만 전송된다는 보장은 없지만 각 데이터 행과 이벤트 타임스탬프에 대해 고유한 ID가 있습니다. 대화식으로 데이터를 쿼리하는 동안 중복 항목이 포함되지 않도록 하려고 합니다. 어떤 쿼리 유형을 사용해야 합니까?

Professional-Data-Engineer 문제 170

Cloud Bigtable은 Google의 ______ 빅 데이터 데이터베이스 서비스입니다.