Professional-Data-Engineer 문제 151
다음 조건을 충족하도록 클라우드 네이티브 기록 데이터 처리 시스템을 설계하고 있습니다.
분석 중인 데이터는 CSV, Avro 및 PDF 형식이며 다중 분석을 통해 액세스됩니다.

Cloud Dataproc, BigQuery, Compute Engine을 포함한 도구
스트리밍 데이터 파이프라인은 매일 새로운 데이터를 저장합니다.

성능은 솔루션의 요소가 아닙니다.

솔루션 설계는 가용성을 극대화해야 합니다.

이 솔루션을 위한 데이터 스토리지는 어떻게 설계해야 합니까?
분석 중인 데이터는 CSV, Avro 및 PDF 형식이며 다중 분석을 통해 액세스됩니다.

Cloud Dataproc, BigQuery, Compute Engine을 포함한 도구
스트리밍 데이터 파이프라인은 매일 새로운 데이터를 저장합니다.

성능은 솔루션의 요소가 아닙니다.

솔루션 설계는 가용성을 극대화해야 합니다.

이 솔루션을 위한 데이터 스토리지는 어떻게 설계해야 합니까?
Professional-Data-Engineer 문제 152
스트리밍 Cloud Dataflow 파이프라인을 운영 중입니다. 엔지니어는 다른 윈도우 알고리즘과 트리거링 전략을 사용하는 새 버전의 파이프라인을 보유하고 있습니다. 실행 중인 파이프라인을 새 버전으로 업데이트하려고 합니다. 업데이트하는 동안 데이터가 손실되지 않도록 하려고 합니다. 당신은 무엇을해야합니까?
Professional-Data-Engineer 문제 153
다음 중 Cloud Dataproc에서 지원하는 작업 유형은 무엇인가요(3개 선택)?
Professional-Data-Engineer 문제 154
Cloud Bigtable에 의존하는 성능 테스트를 실행하는 경우 아래 하나를 제외한 모든 선택 사항이 권장되는 단계입니다. 따라야 할 권장 단계가 아닌 것은 무엇입니까?
Professional-Data-Engineer 문제 155
GCP에서 실행되는 다단계 데이터 파이프라인의 실행을 자동화하려고 합니다. 파이프라인에는 서로에 대해 여러 종속 항목이 있는 Cloud Dataproc 및 Cloud Dataflow 작업이 포함됩니다. 가능한 경우 관리형 서비스를 사용하려고 하며 파이프라인은 매일 실행됩니다. 어떤 도구를 사용해야 합니까?
