Professional-Data-Engineer 문제 1
두 가지 다른 유형의 애플리케이션(작업 생성기와 작업 실행기) 간에 데이터를 공유하기 위한 새로운 데이터 파이프라인을 구축하고 있습니다. 솔루션은 사용량 증가에 맞게 확장되어야 하며 기존 애플리케이션의 성능에 부정적인 영향을 미치지 않으면서 새로운 애플리케이션 추가를 수용해야 합니다. 무엇을 해야 할까요?
Professional-Data-Engineer 문제 2
Google Analytics에서 BigQuery로 매일 테라바이트 규모의 고객 행동 데이터가 스트리밍됩니다. 선호도와 같은 고객 정보는 Cloud SQL for MySQL 데이터베이스에 호스팅됩니다. CRM 데이터베이스는 Cloud SQL for PostgreSQL 인스턴스에 호스팅됩니다. 마케팅 팀은 두 데이터베이스의 고객 정보와 고객 행동 데이터를 사용하여 연간 활성 고객을 위한 마케팅 캠페인을 만들고자 합니다. 마케팅 팀이 일반적인 날에는 하루에 100회 이상, 판매 기간에는 최대 300회까지 캠페인을 실행할 수 있도록 해야 합니다. 동시에 Cloud SQL 데이터베이스의 부하를 최소한으로 유지하려고 합니다. 어떻게 해야 할까요?
Professional-Data-Engineer 문제 3
Flowlogistic은 실시간 재고 추적 시스템을 출시하고 있습니다. 추적 장치는 모두 패키지 추적 메시지를 보내며, 이 메시지는 이제 Apache Kafka 클러스터 대신 단일 Google Cloud Pub/Sub 토픽으로 전송됩니다. 그런 다음 구독자 애플리케이션은 실시간 보고를 위해 메시지를 처리하고 이를 Google BigQuery에 저장하여 과거 분석을 수행합니다. 패키지 데이터를 시간 경과에 따라 분석할 수 있도록 해야 합니다.
어떤 접근방법을 취해야 할까?
어떤 접근방법을 취해야 할까?
Professional-Data-Engineer 문제 4
Bigtable에서 시계열 데이터의 핫스팟을 피하기 위해 가장 선호되는 방법은 무엇입니까?
Professional-Data-Engineer 문제 5
은행업계의 정부 규정은 고객의 개인식별정보(PII)를 보호하도록 규정하고 있습니다. 귀사는 PII가 액세스 제어되고 암호화되며 주요 데이터 보호 표준을 준수하도록 요구합니다. Cloud Data Loss Prevention(Cloud DIP)을 사용하는 것 외에도 Google에서 권장하는 관행을 따르고 서비스 계정을 사용하여 PII에 대한 액세스를 제어해야 합니다. 어떻게 해야 할까요?