Professional-Data-Engineer 문제 121
수백만 대의 컴퓨터에 대한 시계열 CPU 및 메모리 사용량을 저장할 데이터베이스를 선택해야 합니다. 이 데이터를 1초 간격 샘플로 저장해야 합니다. 분석가는 데이터베이스에 대해 실시간 임시 분석을 수행합니다. 실행된 모든 쿼리에 대해 비용이 청구되는 것을 피하고 스키마 디자인이 향후 데이터 세트의 성장을 허용하는지 확인하려고 합니다. 어떤 데이터베이스와 데이터 모델을 선택해야 합니까?
Professional-Data-Engineer 문제 122
다음 중 Cloud Dataproc에서 지원하는 작업 유형은 무엇인가요(답변 3개 선택)?
Professional-Data-Engineer 문제 123
귀사는 현재 코로케이션 시설에서 Spark, Hive 및 HDFS를 사용하여 대규모 온프레미스 클러스터를 실행하고 있습니다.
클러스터는 시스템의 최대 사용량을 수용하도록 설계되었습니다. 그러나 많은 작업은 본질적으로 배치이며 클러스터 사용량은 상당히 크게 변동합니다. 귀사는 온프레미스 인프라 및 유지 관리와 관련된 오버헤드를 줄이고 비용 절감의 이점을 얻기 위해 클라우드로 이전하기를 원합니다.
또한 클라우드를 활용하기 위해 더 많은 서버리스 제품을 사용하도록 기존 인프라를 현대화하기를 바라고 있습니다. 코로케이션 시설과의 계약 갱신 시점으로 인해 초기 마이그레이션에 2개월밖에 시간이 없습니다. 적시에 마이그레이션을 실행하면서 클라우드에서 비용 절감을 극대화할 수 있도록 예정된 마이그레이션 전략에 어떻게 접근할 것을 권장하시겠습니까?
클러스터는 시스템의 최대 사용량을 수용하도록 설계되었습니다. 그러나 많은 작업은 본질적으로 배치이며 클러스터 사용량은 상당히 크게 변동합니다. 귀사는 온프레미스 인프라 및 유지 관리와 관련된 오버헤드를 줄이고 비용 절감의 이점을 얻기 위해 클라우드로 이전하기를 원합니다.
또한 클라우드를 활용하기 위해 더 많은 서버리스 제품을 사용하도록 기존 인프라를 현대화하기를 바라고 있습니다. 코로케이션 시설과의 계약 갱신 시점으로 인해 초기 마이그레이션에 2개월밖에 시간이 없습니다. 적시에 마이그레이션을 실행하면서 클라우드에서 비용 절감을 극대화할 수 있도록 예정된 마이그레이션 전략에 어떻게 접근할 것을 권장하시겠습니까?
Professional-Data-Engineer 문제 124
Cloud Pub/Sub에서 Cloud Dataflow를 통해 BigQuery로 IoT 데이터를 스트리밍하기 위해 Google Cloud에서 새 파이프라인을 만들고 있습니다. 데이터를 미리 보는 동안 데이터의 약 2%가 손상된 것으로 나타납니다.
이 손상된 데이터를 필터링하려면 Cloud Dataflow 파이프라인을 수정해야 합니다. 어떻게 해야 합니까?
이 손상된 데이터를 필터링하려면 Cloud Dataflow 파이프라인을 수정해야 합니다. 어떻게 해야 합니까?
Professional-Data-Engineer 문제 125
Google Cloud의 데이터 파이프라인을 위해 Cloud Pub/Sub에서 BigQuery로 JSON 메시지를 작성하고 변환하는 서비스를 선택하고 있습니다. 서비스 비용을 최소화하고 싶습니다. 또한 최소한의 수동 개입으로 다양한 크기의 입력 데이터 볼륨을 모니터링하고 수용하고자 합니다. 어떻게 해야 합니까?
