무료 온라인 액세스 Google.Professional-Data-Engineer.v2023-06-24.q151 모의 시험 (Page 26)

Professional-Data-Engineer 문제 121

수백만 대의 컴퓨터에 대한 시계열 CPU 및 메모리 사용량을 저장할 데이터베이스를 선택해야 합니다. 이 데이터를 1초 간격 샘플로 저장해야 합니다. 분석가는 데이터베이스에 대해 실시간 임시 분석을 수행합니다. 실행된 모든 쿼리에 대해 비용이 청구되는 것을 피하고 스키마 디자인이 향후 데이터 세트의 성장을 허용하는지 확인하려고 합니다. 어떤 데이터베이스와 데이터 모델을 선택해야 합니까?

A. BigQuery에서 테이블을 만들고 CPU 및 메모리에 대한 새 샘플을 테이블에 추가합니다.

B. BigQuery에서 와이드 테이블을 생성하고, 매초 샘플 값에 대한 열을 생성하고, 매초 간격으로 행을 업데이트합니다.

C. Computer Engine 컴퓨터 식별자와 초당 샘플 시간을 결합하는 행 키를 사용하여 Cloud Bigtable에서 좁은 테이블을 만듭니다.

D. 매분마다 컴퓨터 식별자와 샘플 시간을 결합한 행 키로 Cloud Bigtable에 와이드 테이블을 생성하고 초당 값을 열 데이터로 결합합니다.

Professional-Data-Engineer 문제 122

다음 중 Cloud Dataproc에서 지원하는 작업 유형은 무엇인가요(답변 3개 선택)?

A. 하이브

B. 돼지

C. 원사

D. 스파크

Professional-Data-Engineer 문제 123

귀사는 현재 코로케이션 시설에서 Spark, Hive 및 HDFS를 사용하여 대규모 온프레미스 클러스터를 실행하고 있습니다.
클러스터는 시스템의 최대 사용량을 수용하도록 설계되었습니다. 그러나 많은 작업은 본질적으로 배치이며 클러스터 사용량은 상당히 크게 변동합니다. 귀사는 온프레미스 인프라 및 유지 관리와 관련된 오버헤드를 줄이고 비용 절감의 이점을 얻기 위해 클라우드로 이전하기를 원합니다.
또한 클라우드를 활용하기 위해 더 많은 서버리스 제품을 사용하도록 기존 인프라를 현대화하기를 바라고 있습니다. 코로케이션 시설과의 계약 갱신 시점으로 인해 초기 마이그레이션에 2개월밖에 시간이 없습니다. 적시에 마이그레이션을 실행하면서 클라우드에서 비용 절감을 극대화할 수 있도록 예정된 마이그레이션 전략에 어떻게 접근할 것을 권장하시겠습니까?

A. 워크로드를 Dataproc 및 Cloud Storage로 마이그레이션합니다. 나중에 현대화하십시오.

B. 워크로드를 Dataproc 및 HDFS로 마이그레이션합니다. 나중에 현대화하십시오.

C. Spark 워크로드를 Dataproc 및 HDFS로 마이그레이션하고 BigQuery용 Hive 워크로드를 현대화합니다.

D. Dataflow용 Spark 워크로드와 BigQuery용 Hive 워크로드를 현대화합니다.

Professional-Data-Engineer 문제 124

Cloud Pub/Sub에서 Cloud Dataflow를 통해 BigQuery로 IoT 데이터를 스트리밍하기 위해 Google Cloud에서 새 파이프라인을 만들고 있습니다. 데이터를 미리 보는 동안 데이터의 약 2%가 손상된 것으로 나타납니다.
이 손상된 데이터를 필터링하려면 Cloud Dataflow 파이프라인을 수정해야 합니다. 어떻게 해야 합니까?

A. 요소가 손상된 경우 부울을 반환하는 SideInput을 추가합니다.

B. Cloud Dataflow에 ParDo 변환을 추가하여 손상된 요소를 삭제합니다.

C. 유효한 데이터를 손상된 데이터와 분리하기 위해 Cloud Dataflow에 파티션 변환을 추가합니다.

D. Cloud Dataflow에 GroupByKey 변환을 추가하여 모든 유효한 데이터를 함께 그룹화하고 나머지는 삭제합니다.

Professional-Data-Engineer 문제 125

Google Cloud의 데이터 파이프라인을 위해 Cloud Pub/Sub에서 BigQuery로 JSON 메시지를 작성하고 변환하는 서비스를 선택하고 있습니다. 서비스 비용을 최소화하고 싶습니다. 또한 최소한의 수동 개입으로 다양한 크기의 입력 데이터 볼륨을 모니터링하고 수용하고자 합니다. 어떻게 해야 합니까?

A. Cloud Dataproc을 사용하여 변환을 실행하십시오. 클러스터의 CPU 사용률을 모니터링합니다. 명령행을 통해 클러스터의 작업자 노드 수를 조정하십시오.

B. Cloud Dataproc을 사용하여 변환을 실행하십시오. 진단 명령을 사용하여 운영 출력 아카이브를 생성합니다. 병목 현상을 찾아 클러스터 리소스를 조정합니다.

C. Cloud Dataflow를 사용하여 변환을 실행합니다. Stackdriver로 작업 시스템 지연을 모니터링합니다. 작업자 인스턴스에 대해 기본 자동 확장 설정을 사용합니다.

D. Cloud Dataflow를 사용하여 변환을 실행합니다. 작업 샘플링에 대한 총 실행 시간을 모니터링합니다.
필요한 경우 기본이 아닌 Compute Engine 머신 유형을 사용하도록 작업을 구성합니다.

다른 버전: 1653Google.Professional-Data-Engineer.v2024-12-06.q306; 1170Google.Professional-Data-Engineer.v2024-08-24.q281; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2617Google.Professional-Data-Engineer.v2022-09-06.q248; 2056Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 114TheBerylInstitute.CPXP.v2026-06-06.q56; 146ACAMS.CAMS7-KR.v2026-06-05.q213; 164PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 139NLN.NEX.v2026-06-04.q54; 180Microsoft.AZ-500-KR.v2026-06-04.q213; 167Microsoft.DP-600-KR.v2026-06-04.q98; 184Microsoft.AZ-204-KR.v2026-06-04.q237; 169Microsoft.PL-600-KR.v2026-06-04.q112; 227Microsoft.SC-300-KR.v2026-06-03.q151; 197Microsoft.DP-600-KR.v2026-06-03.q70