무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-12-06.q306 모의 시험 (Page 56)

Professional-Data-Engineer 문제 271

GCE VM 인스턴스에 MariaDB SQL 데이터베이스를 배포하고 모니터링 및 알림을 구성해야 합니다. 최소한의 개발 노력으로 MariaDB에서 네트워크 연결, 디스크 IO 및 복제 상태를 포함한 메트릭을 수집하고 대시보드 및 알림에 StackDriver를 사용하려고 합니다.
어떻게 해야 할까요?

A. OpenCensus 에이전트를 설치하고 StackDriver 내보내기 기능을 사용하여 사용자 정의 메트릭 수집 애플리케이션을 만듭니다.

B. 상태 점검을 통해 MariaDB 인스턴스를 인스턴스 그룹에 배치합니다.

C. StackDriver 로깅 에이전트를 설치하고 fluentd in_tail 플러그인을 구성하여 MariaDB 로그를 읽습니다.

D. StackDriver 에이전트를 설치하고 MySQL 플러그인을 구성합니다.

Professional-Data-Engineer 문제 272

귀사는 현재 캠페인을 위한 데이터 파이프라인을 설정하고 있습니다. 모든 Google Cloud Pub/Sub 스트리밍 데이터의 경우 중요한 비즈니스 요구 사항 중 하나는 캠페인 중에 입력과 타이밍을 주기적으로 식별할 수 있어야 한다는 것입니다. 엔지니어는 이 목적을 위해 Google Cloud Dataflow에서 윈도잉과 변환을 사용하기로 결정했습니다. 그러나 이 기능을 테스트할 때 Cloud Dataflow 작업이 모든 스트리밍 삽입에 실패한다는 것을 알게 되었습니다. 이 문제의 가장 큰 원인은 무엇일까요?

A. 파이프라인이 생성될 때 작업이 실패하게 되는 글로벌 윈도잉 기능을 적용하지 않았습니다.

B. 늦게 들어오는 데이터를 수용하기 위한 트리거를 설정하지 않아 작업이 실패합니다.

C. 타임스탬프를 지정하지 않아 작업이 실패합니다.

D. 파이프라인이 생성될 때 작업이 실패하게 되는 비전역 윈도잉 함수를 적용하지 않았습니다.

Professional-Data-Engineer 문제 273

귀사는 많은 수의 뉴런과 레이어를 가진 TensorFlow 신경망 모델을 구축했습니다. 이 모델은 훈련 데이터에 잘 맞습니다. 그러나 새로운 데이터로 테스트했을 때 성능이 좋지 않습니다.
이 문제를 해결하려면 어떤 방법을 사용할 수 있나요?

A. 스레딩

B. 직렬화

C. 드롭아웃 방법

D. 차원 축소

Professional-Data-Engineer 문제 274

머신 러닝 데이터 세트를 훈련 데이터와 테스트 데이터로 분할해야 하는 이유는 무엇입니까?

A. 두 가지 다른 기능 세트를 시도할 수 있습니다.

B. 훈련 데이터뿐만 아니라 다른 데이터에도 모델이 일반화되도록 하려면

C. 코드에서 단위 테스트를 생성할 수 있도록 합니다.

D. 넓은 모델에는 하나의 데이터 세트를 사용하고 깊은 모델에는 하나의 데이터 세트를 사용할 수 있습니다.

Professional-Data-Engineer 문제 275

기존 온프레미스 데이터 전략을 현대화해야 합니다. 귀하의 조직은 현재 이를 사용합니다.
* 데이터 복제를 위한 온프레미스 Hadoop 분산 파일 시스템(HDFS)을 포함하여 여러 개의 대규모 데이터 세트를 처리하기 위한 Apache Hadoop 클러스터.
* Apache Airflow는 수천 개의 작업 단계로 구성된 수백 개의 ETL 파이프라인을 조율합니다.
Hadoop 워크로드를 처리할 수 있고 기존 오케스트레이션 프로세스를 최소한으로 변경해야 하는 Google Cloud의 새로운 아키텍처를 설정해야 합니다. 무엇을 해야 할까요?

A. Dataproc을 사용하여 Hadoop 클러스터를 Google Cloud로 마이그레이션하고 Cloud Storage를 사용하여 모든 HDFS 사용 사례를 처리합니다. ETL 파이프라인을 Dataflow로 변환합니다.

B. 대규모 작업 부하에는 Bigtable을 사용하고, Cloud Storage에 연결하여 모든 HDFS 사용 사례를 처리합니다. Cloud Composer로 파이프라인을 조정합니다.

C. Dataproc을 사용하여 Hadoop 클러스터를 Google Cloud로 마이그레이션하고 Cloud Storage를 사용하여 모든 HDFS 사용 사례를 처리합니다. Cloud Data Fusion을 사용하여 ETL 파이프라인을 시각적으로 설계하고 배포합니다.

D. Dataproc을 사용하여 Hadoop 클러스터를 Google Cloud로 마이그레이션하고 Cloud Storage를 사용하여 모든 HDFS 사용 사례를 처리합니다. Cloud Composer로 파이프라인을 조정합니다.

정답: D

Dataproc은 Google Cloud에서 Apache Hadoop 및 Spark 워크로드를 실행할 수 있는 완전 관리형 서비스입니다. 오픈 소스 에코시스템과 호환되므로 최소한의 변경으로 기존 Hadoop 클러스터를 Dataproc으로 마이그레이션할 수 있습니다. Cloud Storage는 확장 가능하고 내구성이 뛰어나며 비용 효율적인 개체 스토리지 서비스로, 데이터를 저장하고 액세스하는 데 HDFS를 대체할 수 있습니다. Cloud Storage는 커넥터를 통해 Hadoop과 상호 운용성을 제공하므로 Dataproc 작업의 데이터 소스 또는 싱크로 사용할 수 있습니다. Cloud Composer는 Apache Airflow를 사용하여 워크플로를 만들고, 예약하고, 모니터링할 수 있는 완전 관리형 서비스입니다. Dataproc, BigQuery, Dataflow, Pub/Sub와 같은 Google Cloud 서비스와 통합되어 다양한 플랫폼에서 ETL 파이프라인을 오케스트레이션할 수 있습니다. Cloud Composer는 기존 Airflow 코드와 호환되므로 최소한의 변경으로 기존 오케스트레이션 프로세스를 Cloud Composer로 마이그레이션할 수 있습니다.
다른 옵션은 이 사용 사례에 Dataproc 및 Cloud Composer만큼 적합하지 않습니다. 기존 코드를 더 많이 변경해야 하거나 요구 사항을 충족하지 못하기 때문입니다. Dataflow는 Apache Beam을 사용하여 확장 가능한 데이터 처리 파이프라인을 만들고 실행할 수 있는 완전 관리형 서비스입니다. 그러나 Dataflow는 기존 Hadoop 코드와 호환되지 않으므로 Beam을 사용하여 ETL 파이프라인을 다시 작성해야 합니다. Bigtable은 크고 복잡한 데이터 세트를 처리할 수 있는 완전 관리형 NoSQL 데이터베이스 서비스입니다. 그러나 Bigtable은 기존 Hadoop 코드와 호환되지 않으므로 Bigtable API를 사용하여 쿼리와 애플리케이션을 다시 작성해야 합니다. Cloud Data Fusion은 그래픽 인터페이스를 사용하여 데이터 통합 파이프라인을 시각적으로 설계하고 배포할 수 있는 완전 관리형 서비스입니다. 그러나 Cloud Data Fusion은 기존 Airflow 코드와 호환되지 않으므로 Cloud Data Fusion UI를 사용하여 오케스트레이션 프로세스를 다시 만들어야 합니다. 참조:
Dataproc 개요
Hadoop용 클라우드 스토리지 커넥터
Cloud Composer 개요

다른 버전: 1170Google.Professional-Data-Engineer.v2024-08-24.q281; 1315Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2617Google.Professional-Data-Engineer.v2022-09-06.q248; 2055Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 114TheBerylInstitute.CPXP.v2026-06-06.q56; 146ACAMS.CAMS7-KR.v2026-06-05.q213; 164PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 139NLN.NEX.v2026-06-04.q54; 180Microsoft.AZ-500-KR.v2026-06-04.q213; 167Microsoft.DP-600-KR.v2026-06-04.q98; 184Microsoft.AZ-204-KR.v2026-06-04.q237; 169Microsoft.PL-600-KR.v2026-06-04.q112; 227Microsoft.SC-300-KR.v2026-06-03.q151; 197Microsoft.DP-600-KR.v2026-06-03.q70