Professional-Data-Engineer 문제 51

확장 가능한 방식으로 데이터를 수집하는 데 필요한 새 애플리케이션을 구축하고 있습니다. 데이터는 하루 종일 애플리케이션에서 지속적으로 도착하며 연말까지 매일 약 150GB의 JSON 데이터가 생성될 것으로 예상합니다. 요구 사항은 다음과 같습니다.
* 생산자와 소비자의 분리
* 무기한 저장되는 원시 수집 데이터의 공간 및 비용 효율적인 저장
* 실시간에 가까운 SQL 쿼리
* 최소 2년 동안의 과거 데이터를 유지하고 SQL로 쿼리합니다. 이러한 요구 사항을 충족하기 위해 어떤 파이프라인을 사용해야 합니까?

Professional-Data-Engineer 문제 52

실시간 애플리케이션에 Bigtable을 사용하고 있으며 읽기와 쓰기가 혼합된 로드가 많습니다.
최근에 추가 사용 사례를 확인했으며 전체 데이터베이스에서 특정 통계를 계산하기 위해 매시간 분석 작업을 수행해야 합니다. 프로덕션 애플리케이션과 분석 워크로드의 안정성을 모두 보장해야 합니다.
당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 53

Google Cloud Platform에서 실행될 POS 애플리케이션에서 결제 거래를 처리하려고 합니다. 사용자 기반은 기하급수적으로 증가할 수 있지만 인프라 확장을 관리하고 싶지는 않습니다.
어떤 Google 데이터베이스 서비스를 사용해야 합니까?

Professional-Data-Engineer 문제 54

데이터 웨어하우스를 BigQuery로 마이그레이션하고 있습니다. 모든 데이터를 데이터세트의 테이블로 마이그레이션했습니다. 조직의 여러 사용자가 데이터를 사용하게 됩니다. 그들은 팀 구성원을 기반으로 특정 테이블만 볼 수 있어야 합니다. 사용자 권한을 어떻게 설정해야 합니까?

Professional-Data-Engineer 문제 55

Google Cloud에서 추천 엔진을 사용하는 애플리케이션을 개발 중입니다. 솔루션은 과거 조회수를 기반으로 고객에게 새 비디오를 표시해야 합니다. 솔루션은 고객이 본 비디오의 엔터티에 대한 레이블을 생성해야 합니다. 디자인은 몇 TB의 데이터에 대한 다른 고객 선호도의 데이터를 기반으로 매우 빠른 필터링 제안을 제공할 수 있어야 합니다. 당신은 무엇을해야합니까?