무료 온라인 액세스 Google.Professional-Data-Engineer.v2022-09-06.q248 모의 시험 (Page 34)

Professional-Data-Engineer 문제 161

분석 팀은 몇 가지 다른 메트릭을 기반으로 회사와 다시 협력할 가능성이 가장 높은 고객을 결정하기 위해 간단한 통계 모델을 구축하려고 합니다. 그들은 Google Cloud Storage에 저장된 데이터를 사용하여 Apache Spark에서 모델을 실행하기를 원하며 Google Cloud Dataproc을 사용하여 이 작업을 실행하도록 권장했습니다. 테스트에 따르면 이 워크로드는 15개 노드 클러스터에서 약 30분 안에 실행되어 결과를 Google BigQuery로 출력할 수 있습니다. 계획은 이 워크로드를 매주 실행하는 것입니다. 비용 대비 클러스터를 어떻게 최적화해야 합니까?

A. 작업이 더 빨리 실행되도록 더 높은 메모리 노드를 사용합니다.

B. 작업자 노드에서 SSD를 사용하여 작업을 더 빠르게 실행할 수 있습니다.

C. 워크로드를 Google Cloud Dataflow로 마이그레이션

D. 클러스터에 선점형 VM(가상 머신) 사용

Professional-Data-Engineer 문제 162

인프라에는 YouTube 채널 세트가 포함됩니다. 분석을 위해 YouTube 채널 데이터를 Google Cloud로 보내는 프로세스를 만드는 임무를 받았습니다. 전 세계 마케팅 팀이 최신 YouTube 채널 로그 데이터에 대해 ANSI SQL 및 기타 유형의 분석을 수행할 수 있는 솔루션을 설계하려고 합니다. GCP로의 로그 데이터 전송을 어떻게 설정해야 하나요?

A. Storage Transfer Service를 사용하여 오프사이트 백업 파일을 최종 목적지인 Cloud Storage Multi-Regional 스토리지 버킷으로 전송합니다.

B. BigQuery Data Transfer Service를 사용하여 오프사이트 백업 파일을 최종 목적지인 Cloud Storage 지역 스토리지 버킷으로 전송합니다.

C. Storage Transfer Service를 사용하여 오프사이트 백업 파일을 Cloud Storage 지역 버킷에 최종 목적지로 전송합니다.

D. BigQuery Data Transfer Service를 사용하여 오프사이트 백업 파일을 최종 목적지인 Cloud Storage Multi-Regional 스토리지 버킷으로 전송합니다.

Professional-Data-Engineer 문제 163

수백만 개의 사물 인터넷(IoT) 장치에서 제출된 원격 측정 데이터를 처리하기 위해 NoSQL 데이터베이스를 선택하고 있습니다. 데이터의 양은 매년 100TB로 증가하고 있으며 각 데이터 항목은 약
100 속성. 데이터 처리 파이프라인에는 원자성, 일관성, 격리 및 내구성(ACID)이 필요하지 않습니다. 그러나 고가용성과 짧은 대기 시간이 필요합니다.
개별 필드에 대해 쿼리하여 데이터를 분석해야 합니다. 어떤 세 가지 데이터베이스가 귀하의 요구 사항을 충족합니까? (3개를 선택하세요.)

A. 레디스

B. HBase

C. MySQL

D. 몽고DB

E. 카산드라

F. Hive가 있는 HDFS

Professional-Data-Engineer 문제 164

데이터 과학자가 BigQuery ML 모델을 만들고 예측을 제공할 ML 파이프라인을 만들도록 요청합니다.
지연 시간이 100밀리초 미만인 개별 사용자 ID에 대한 예측을 제공해야 하는 REST API 애플리케이션이 있습니다. 다음 쿼리를 사용하여 예측을 생성합니다. SELECT predicted_label, user_id FROM ML.PREDICT(MODEL 'dataset.model', table user_features). ML 파이프라인을 어떻게 생성해야 합니까?

A. BigQueryIO를 사용하여 Cloud Dataflow 파이프라인을 만들어 쿼리에서 결과를 읽습니다. 애플리케이션 서비스 계정에 Dataflow 작업자 역할을 부여합니다.

B. 제공된 쿼리로 Authorized View를 생성합니다. 보기가 포함된 데이터 세트를 애플리케이션 서비스 계정과 공유합니다.

C. BigQueryIO를 사용하여 Cloud Dataflow 파이프라인을 만들어 쿼리에서 모든 사용자에 대한 예측을 읽습니다. BigtableIO를 사용하여 Cloud Bigtable에 결과를 씁니다. 애플리케이션이 Cloud Bigtable에서 개별 사용자에 대한 예측을 읽을 수 있도록 애플리케이션 서비스 계정에 Bigtable 리더 역할을 부여합니다.

D. 쿼리에 WHERE 절을 추가하고 애플리케이션 서비스 계정에 BigQuery 데이터 뷰어 역할을 부여합니다.

Professional-Data-Engineer 문제 165

귀하의 팀은 이진 분류 문제를 해결하기 위해 노력하고 있습니다. 기본 매개변수를 사용하여 지원 벡터 머신(SVM) 분류기를 훈련했으며 검증 세트에서 곡선 아래 영역(AUC) 0.87을 받았습니다.
모델의 AUC를 늘리려고 합니다. 당신은 무엇을해야합니까?

A. 하이퍼파라미터 튜닝 수행

B. 모델을 배포하고 실제 AUC를 측정합니다. 일반화 때문에 항상 더 높습니다.

C. 가장 높은 AUC를 얻기 위해 모델에서 얻은 예측을 스케일링합니다(스케일링 팩터를 하이퍼파라미터로 조정).

D. 신경망이 항상 SVM을 능가하기 때문에 심층 신경망으로 분류기를 훈련합니다.

다른 버전: 1641Google.Professional-Data-Engineer.v2024-12-06.q306; 1167Google.Professional-Data-Engineer.v2024-08-24.q281; 1310Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2052Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 108TheBerylInstitute.CPXP.v2026-06-06.q56; 130ACAMS.CAMS7-KR.v2026-06-05.q213; 154PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 127NLN.NEX.v2026-06-04.q54; 177Microsoft.AZ-500-KR.v2026-06-04.q213; 159Microsoft.DP-600-KR.v2026-06-04.q98; 181Microsoft.AZ-204-KR.v2026-06-04.q237; 163Microsoft.PL-600-KR.v2026-06-04.q112; 221Microsoft.SC-300-KR.v2026-06-03.q151; 192Microsoft.DP-600-KR.v2026-06-03.q70