Professional-Data-Engineer 문제 56
다음 조건을 충족하도록 클라우드 네이티브 기록 데이터 처리 시스템을 설계하고 있습니다.
* 분석 중인 데이터는 CSV, Avro 및 PDF 형식이며 Cloud Dataproc, BigQuery 및 Compute Engine을 포함한 여러 분석 도구에서 액세스합니다.
* 스트리밍 데이터 파이프라인은 매일 새로운 데이터를 저장합니다.
* 성능은 솔루션의 요소가 아닙니다.
* 솔루션 설계는 가용성을 최대화해야 합니다.
이 솔루션의 데이터 스토리지를 어떻게 설계해야 합니까?
* 분석 중인 데이터는 CSV, Avro 및 PDF 형식이며 Cloud Dataproc, BigQuery 및 Compute Engine을 포함한 여러 분석 도구에서 액세스합니다.
* 스트리밍 데이터 파이프라인은 매일 새로운 데이터를 저장합니다.
* 성능은 솔루션의 요소가 아닙니다.
* 솔루션 설계는 가용성을 최대화해야 합니다.
이 솔루션의 데이터 스토리지를 어떻게 설계해야 합니까?
Professional-Data-Engineer 문제 57
온라인 판매 기능을 Google Home과 같은 다양한 가정용 비서와 통합하려는 소매업체입니다. 고객의 음성 명령을 해석하고 백엔드 시스템에 명령을 내려야 합니다. 어떤 솔루션을 선택해야 합니까?
Professional-Data-Engineer 문제 58
Dataflow 프로그램을 로컬에서 실행하는 데 사용할 수 있는 자바 SDK 클래스는 무엇인가요?
Professional-Data-Engineer 문제 59
시계열 측정항목을 집계하고 Cloud Bigtable에 쓰는 Cloud Dataflow 작업이 포함된 데이터 파이프라인이 있습니다. 이 데이터는 조직 전체에서 수천 명의 사용자가 사용하는 대시보드를 제공합니다. 추가 동시 사용자를 지원하고 데이터 쓰기에 필요한 시간을 줄여야 합니다. 어떤 두 가지 조치를 취해야 합니까? (두 가지를 선택하세요.)
Professional-Data-Engineer 문제 60
타임스탬프 및 ID 열에서 WHERE 절을 사용하여 BigQuery 테이블을 필터링하는 쿼리가 있습니다. bq 쿼리 - -dry_run을 사용하면 타임스탬프 및 ID에 대한 필터가 전체 데이터의 아주 작은 부분을 선택하더라도 쿼리가 테이블의 전체 스캔을 트리거한다는 것을 알 수 있습니다.
ㅏ. 기존 SQL 쿼리를 최소한으로 변경하여 BigQuery에서 스캔하는 데이터의 양을 줄이려고 합니다. 어떻게 해야 합니까?
ㅏ. 기존 SQL 쿼리를 최소한으로 변경하여 BigQuery에서 스캔하는 데이터의 양을 줄이려고 합니다. 어떻게 해야 합니까?
