Professional-Data-Engineer 문제 66

회사의 온프레미스 Apache Hadoop 서버 수명이 거의 다 되었고 IT 부서에서 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 클러스터의 유사 마이그레이션에는 노드당 50TB의 Google 영구 디스크가 필요합니다. CIO는 많은 블록 스토리지를 사용하는 데 드는 비용을 걱정하고 있습니다.
마이그레이션의 스토리지 비용을 최소화하려고 합니다. 당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 67

귀하의 회사는 매시간 20,000개의 파일을 생성합니다. 각 데이터 파일은 쉼표로 구분된 값으로 형식이 지정됩니다.
(CSV) 파일은 4KB 미만입니다. 모든 파일은 Google Cloud Platform에서 수집되어야 데이터화할 수 있습니다.
처리됨. 회사 사이트는 Google Cloud에 대해 200ms의 지연 시간을 가지며 인터넷 연결
대역폭은 50Mbps로 제한됩니다. 현재 가상 머신에 보안 FTP(SFTP) 서버를 배포하고 있습니다.
Google Compute Engine을 데이터 수집 지점으로 사용합니다. 로컬 SFTP 클라이언트는 전용 머신에서 실행됩니다.
CSV 파일을 그대로 전송합니다. 목표는 전날의 데이터가 포함된 보고서를
매일 오전 10시까지 임원. 이 디자인은 현재의 볼륨을 간신히 따라갈 수 있습니다.
대역폭 활용도는 다소 낮지만.
회사에서는 계절성으로 인해 다음 3개 기간 동안 파일 수가 두 배로 증가할 것으로 예상한다고 들었습니다.
개월. 어떤 두 가지 조치를 취해야 합니까? (2개를 선택하세요.)

Professional-Data-Engineer 문제 68

한 온라인 소매업체가 Google App Engine에 현재 애플리케이션을 구축했습니다. 회사의 새로운 이니셔티브에서는 고객이 애플리케이션을 통해 직접 거래할 수 있도록 애플리케이션을 확장해야 합니다.
비즈니스 인텔리전스(BI) 도구를 사용하여 쇼핑 거래를 관리하고 여러 데이터 세트에서 결합된 데이터를 분석해야 합니다. 그들은 이 목적을 위해 단 하나의 데이터베이스만 사용하기를 원합니다. 어떤 Google Cloud 데이터베이스를 선택해야 하나요?

Professional-Data-Engineer 문제 69

귀하는 각기 다른 우선 순위와 예산을 가진 여러 사업부를 보유한 대기업의 BI 책임자입니다. 프로젝트당 2,000개의 동시 주문형 슬롯 할당량이 있는 BigQuery에 주문형 가격 책정을 사용합니다. 조직의 사용자가 쿼리를 실행할 슬롯을 얻지 못하는 경우가 있으므로 이를 수정해야 합니다. 계정에 새 프로젝트를 도입하는 것을 피하고 싶습니다.
당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 70

Dataproc 클러스터에는 많은 구성 파일이 포함되어 있습니다. 이러한 파일을 업데이트하려면 --properties 옵션을 사용해야 합니다. 옵션 형식은 file_prefix:property=_____입니다.