무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-12-06.q306 모의 시험 (Page 29)

Professional-Data-Engineer 문제 136

BigQuery, Cloud Dataflow, Cloud Dataproc에서 실행되는 데이터 파이프라인이 있습니다. 상태 검사를 수행하고 동작을 모니터링한 다음 파이프라인이 실패하면 파이프라인을 관리하는 팀에 알려야 합니다. 또한 여러 프로젝트에서 작업할 수 있어야 합니다. 플랫폼의 관리형 제품이나 기능을 사용하는 것이 좋습니다. 어떻게 해야 할까요?

A. 정보를 Cloud Stackdriver로 내보내고 알림 정책을 설정합니다.

B. Airflow를 사용하여 Compute Engine에서 가상 머신을 실행하고 해당 정보를 Stackdriver로 내보냅니다.

C. 로그를 BigQuery로 내보내고 로그에서 오류가 발견되면 해당 정보를 읽고 이메일을 보내도록 App Engine을 설정합니다.

D. GCP API 호출을 사용하여 로그를 사용하고 로그에서 오류가 발견되면 이메일을 보내는 App Engine 애플리케이션을 개발합니다.

Professional-Data-Engineer 문제 137

범주형 특성에서 범주 간 관계에 대해 신경망이 학습하도록 하려면 어떻게 해야 할까요?

A. 멀티핫 컬럼 생성

B. 원핫 컬럼 생성

C. 해시 버킷을 생성합니다.

D. 임베딩 열 생성

Professional-Data-Engineer 문제 138

귀사의 온프레미스 Apache Hadoop 서버는 수명이 다 되어 가고 있으며, IT 부서는 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 클러스터를 동일한 방식으로 마이그레이션하려면 노드당 50TB의 Google Persistent Disk가 필요합니다. CIO는 그렇게 많은 블록 스토리지를 사용하는 데 드는 비용에 대해 우려하고 있습니다.
마이그레이션의 저장 비용을 최소화하고 싶습니다. 어떻게 해야 할까요?

A. Cloud Dataproc 클러스터에 선점형 가상 머신(VM)을 사용합니다.

B. Google Cloud Storage에 데이터를 넣습니다.

C. 모든 데이터에 충분한 디스크가 있도록 Cloud Dataproc 클러스터를 조정합니다.

D. 일부 콜드 데이터를 Google Cloud Storage로 마이그레이션하고, 핫 데이터만 영구 디스크에 보관합니다.

Professional-Data-Engineer 문제 139

Pub/Sub 토픽에서 읽는 Apache Beam 처리 파이프라인을 설계했습니다. 토픽의 메시지 보존 기간은 1일이며 Cloud Storage 버킷에 씁니다. RPO가 15분인 지역 중단 시 데이터 손실을 방지하기 위해 버킷 위치와 처리 전략을 선택해야 합니다.
어떻게 해야 할까요?

A. 1 지역별 Cloud Storage 버킷을 사용하세요.
2 Cloud Monitoring을 사용하여 Dataflow 메트릭을 모니터링하여 중단이 발생하는 시점을 확인합니다.
3. 확인된 메시지를 복구하려면 구독을 하루 전으로 되돌려보세요.
4 보조 지역에서 Dataflow 작업을 시작하고 동일한 지역의 버킷에 씁니다.

B. 1 다중 지역 Cloud Storage 버킷을 사용하세요.
2 Cloud Monitoring을 사용하여 Dataflow 메트릭을 모니터링하여 중단이 발생하는 시점을 확인합니다.
3. 확인된 메시지를 복구하기 위해 60분 전으로 구독을 검색합니다.
4 보조 지역에서 Dataflow 작업 시작

C. 1. 이중 지역 Cloud Storage 버킷을 사용하세요.
2. Cloud Monitoring으로 Dataflow 메트릭을 모니터링하여 중단이 발생하는 시점을 확인합니다.
3. 확인된 메시지를 복구하려면 15분 전으로 구독을 다시 검색하세요.
4 보조 지역에서 Dataflow 작업 시작

D. 1. 터보 복제가 활성화된 듀얼 리전 Cloud Storage 버킷을 사용하세요.
2 Cloud Monitoring을 사용하여 Dataflow 메트릭을 모니터링하여 중단이 발생하는 시점을 확인합니다.
3. 확인된 메시지를 복구하기 위해 60분 전으로 구독을 검색합니다.
4. 보조 지역에서 Dataflow 작업을 시작합니다.

정답: C

듀얼 리전 클라우드 스토리지 버킷은 같은 대륙 내의 두 리전에 중복적으로 데이터를 저장하는 버킷 유형입니다. 이는 단일 리전에 데이터를 저장하는 리전 버킷보다 더 높은 가용성과 내구성을 제공합니다. 듀얼 리전 버킷은 또한 대륙 내의 여러 리전 또는 여러 대륙에 데이터를 저장하는 멀티 리전 버킷보다 더 낮은 대기 시간과 더 높은 처리량을 제공합니다. 터보 복제가 활성화된 듀얼 리전 버킷은 리전 간에 더 빠른 복제를 제공하는 프리미엄 옵션이지만, 비용이 더 많이 들고 이 시나리오에는 필요하지 않습니다.
듀얼 리전 Cloud Storage 버킷을 사용하면 데이터가 지역적 중단으로부터 보호되고 낮은 지연 시간과 높은 성능으로 두 리전에서 데이터에 액세스할 수 있습니다. Cloud Monitoring으로 Dataflow 메트릭을 모니터링하여 중단이 발생하는 시점을 확인하고 15분 전으로 구독을 검색하여 확인된 메시지를 복구할 수도 있습니다. 구독을 검색하면 메시지 보존 기간(이 경우 1일) 내에 게시된 Pub/Sub 토픽의 메시지를 재생할 수 있습니다. 15분 전으로 구독을 검색하면 15분의 RPO를 충족할 수 있으며, 이는 비즈니스에 허용되는 최대 데이터 손실량을 의미합니다. 그런 다음 보조 리전에서 Dataflow 작업을 시작하고 동일한 듀얼 리전 버킷에 쓸 수 있으며, 이렇게 하면 메시지 처리가 재개되고 데이터 손실이 방지됩니다.
옵션 A는 지역 Cloud Storage 버킷을 사용해도 중복성이나 지역 중단으로부터 보호 기능을 제공하지 않으므로 좋은 솔루션이 아닙니다. 버킷이 있는 지역에서 중단이 발생하면 데이터에 액세스하거나 버킷에 새 데이터를 쓸 수 없습니다. 구독을 하루 전으로 되돌리는 것도 불필요하고 비효율적입니다. 지난 15분 동안의 메시지만 복구하면 되는데도 지난 하루 동안의 모든 메시지를 재생하기 때문입니다.
옵션 B는 좋은 솔루션이 아닙니다. 이 시나리오에서 다중 지역 Cloud Storage 버킷을 사용하면 최상의 성능이나 비용 효율성을 제공하지 못하기 때문입니다. 다중 지역 버킷은 대륙 내 또는 대륙 간에 여러 지역에 데이터를 저장하므로 이중 지역 버킷보다 가용성과 내구성이 더 높지만 대기 시간이 더 길고 처리량이 낮습니다. 다중 지역 버킷은 단일 대륙 내에서 Dataflow로 데이터를 처리하는 것이 아니라 글로벌 대상에게 데이터를 제공하는 데 더 적합합니다. 구독을 60분 전으로 되돌리는 것도 불필요하고 비효율적입니다. 15분의 RPO를 충족하는 데 필요한 것보다 더 많은 메시지를 재생하기 때문입니다.
옵션 D는 좋은 솔루션이 아닙니다. 터보 복제가 활성화된 듀얼 리전 Cloud Storage 버킷을 사용하면 이 시나리오에서 추가적인 이점이 없고 비용만 증가하기 때문입니다. 터보 복제는 리전 간 복제 속도를 높이는 프리미엄 옵션이지만 15분의 RPO를 충족하는 데 필요하지 않습니다. 60분 전으로 구독을 검색하는 것도 불필요하고 비효율적입니다. 15분의 RPO를 충족하는 데 필요한 것보다 더 많은 메시지를 재생하기 때문입니다. 참조: 스토리지 위치 | Cloud Storage | Google Cloud, Dataflow 메트릭 | Cloud Dataflow | Google Cloud, 구독 검색 | Cloud Pub/Sub | Google Cloud, 복구 지점 목표(RPO) | Acronis.

Professional-Data-Engineer 문제 140

수백만 개의 판매 데이터 행이 포함된 테이블이 있으며, 날짜별로 분할되어 있습니다. 다양한 애플리케이션과 사용자가 이 데이터를 1분에 여러 번 쿼리합니다. 이 쿼리는 avg.max. 및 sum을 사용하여 값을 집계해야 하며, 다른 테이블과 조인할 필요가 없습니다. 필요한 집계는 지난 1년 동안의 데이터에 대해서만 계산되지만, 기본 테이블에 전체 과거 데이터를 유지해야 합니다. 쿼리 결과에 항상 테이블의 최신 데이터가 포함되도록 하면서 계산 비용, 유지 관리 오버헤드 및 기간을 줄이려고 합니다. 어떻게 해야 할까요?

A. 기본 테이블 데이터를 집계하기 위한 구체화된 뷰를 만듭니다. 기본 테이블의 파티션 만료를 구성하여 마지막 1년 동안의 파티션만 유지합니다.

B. 기본 테이블 데이터를 집계하는 구체화된 뷰를 생성하고, 마지막 1년 동안의 파티션을 지정하는 필터 절을 포함합니다.

C. 기본 테이블 데이터를 집계하는 새 테이블을 만듭니다. 마지막 파티션 연도를 지정하는 필터 절을 포함합니다. 매 시간 새 테이블을 다시 만드는 예약된 쿼리를 설정합니다.

D. 기본 테이블 데이터를 집계하는 뷰를 만듭니다. 파티션의 마지막 연도를 지정하는 필터 절을 포함합니다.

다른 버전: 1169Google.Professional-Data-Engineer.v2024-08-24.q281; 1314Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2615Google.Professional-Data-Engineer.v2022-09-06.q248; 2055Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 111TheBerylInstitute.CPXP.v2026-06-06.q56; 134ACAMS.CAMS7-KR.v2026-06-05.q213; 162PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 134NLN.NEX.v2026-06-04.q54; 178Microsoft.AZ-500-KR.v2026-06-04.q213; 165Microsoft.DP-600-KR.v2026-06-04.q98; 182Microsoft.AZ-204-KR.v2026-06-04.q237; 163Microsoft.PL-600-KR.v2026-06-04.q112; 225Microsoft.SC-300-KR.v2026-06-03.q151; 194Microsoft.DP-600-KR.v2026-06-03.q70