Professional-Data-Engineer 문제 136
은행 업계의 정부 규정은 고객의 개인 식별 정보(PII) 보호를 의무화합니다. 회사에서는 PII가 액세스 제어 암호화 및 주요 데이터 보호 표준을 준수하도록 요구합니다. Cloud DIP(Cloud Data Loss Prevention)를 사용하는 것 외에도 Google 권장 사례를 따르고 서비스 계정을 사용하여 PII에 대한 액세스를 제어하려고 합니다. 어떻게 해야 합니까?
Professional-Data-Engineer 문제 137
귀사는 Google Cloud Storage와 Google Compute Engine의 Cassandra 클러스터에 저장된 매우 큰 데이터 세트에서 복잡한 분석을 수행하려는 새로운 데이터 과학자를 고용했습니다. 과학자는 주로 몇 가지 시각화 작업과 함께 기계 학습 프로젝트를 위한 레이블이 지정된 데이터 세트를 생성하려고 합니다. 그녀는 자신의 노트북이 작업을 수행할 만큼 강력하지 않아 속도가 느려지고 있다고 보고합니다. 그녀가 작업을 수행하도록 돕고 싶습니다. 어떻게 해야 합니까?
Professional-Data-Engineer 문제 138
회사의 온프레미스 Apache Hadoop 서버가 수명 종료에 가까워지고 있으며 IT에서 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 유사 클러스터 마이그레이션에는 노드당 50TB의 Google Persistent Disk가 필요합니다. CIO는 그만큼 많은 블록 스토리지를 사용하는 비용에 대해 우려하고 있습니다.
마이그레이션의 스토리지 비용을 최소화하려고 합니다. 어떻게 해야 합니까?
마이그레이션의 스토리지 비용을 최소화하려고 합니다. 어떻게 해야 합니까?
Professional-Data-Engineer 문제 139
Pub/Sub 피드에 대한 구독자의 코드를 업데이트하고 있습니다. 배포 시 구독자가 메시지를 잘못 확인하여 메시지 손실이 발생할 수 있다는 점을 우려하고 있습니다. 구독자가 확인된 메시지를 보관하도록 설정되지 않았습니다. 배포 후 오류로부터 복구할 수 있도록 하려면 어떻게 해야 합니까?
Professional-Data-Engineer 문제 140
GCE VM 인스턴스에 MariaDB SQL 데이터베이스를 배포하고 있으며 모니터링 및 알림을 구성해야 합니다. 최소한의 개발 노력으로 MariaDB에서 네트워크 연결, 디스크 IO 및 복제 상태를 포함한 메트릭을 수집하고 대시보드 및 경고에 StackDriver를 사용하려고 합니다.
어떻게 해야 합니까?
어떻게 해야 합니까?
