무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-08-24.q281 모의 시험 (Page 47)

Professional-Data-Engineer 문제 226

BigQuery를 중앙 집중식 분석 플랫폼으로 사용합니다. 매일 새로운 데이터가 로드되고 ETL 파이프라인은 원본 데이터를 수정하여 최종 사용자를 위해 준비합니다. 이 ETL 파이프라인은 정기적으로 수정되어 오류가 발생할 수 있지만 때로는 2주 후에야 오류가 감지되는 경우도 있습니다. 이러한 오류를 복구할 수 있는 방법을 제공해야 하며 백업은 스토리지 비용에 맞게 최적화되어야 합니다. BigQuery에서 데이터를 어떻게 구성하고 백업을 저장해야 하나요?

A. 데이터를 매월 별도의 테이블로 정리하고 Cloud Storage에 데이터를 내보내고 압축하고 저장합니다.

B. 매월 별도의 테이블에 데이터를 구성하고 BigQuery의 별도 데이터 세트에 데이터를 복제합니다.

C. 데이터를 단일 테이블로 구성하고 BigQuery 데이터를 내보내고 압축하여 Cloud Storage에 저장합니다.

D. 매월 별도의 테이블에 데이터를 구성하고 스냅샷 데코레이터를 사용하여 테이블을 손상되기 전 시점으로 복원합니다.

Professional-Data-Engineer 문제 227

BigQuery 캐싱에 대한 다음 설명 중 참인 것은 무엇인가요?

A. 기본적으로 쿼리 결과는 캐시되지 않습니다.

B. BigQuery는 쿼리 결과를 48시간 동안 캐시합니다.

C. 대상 테이블을 지정하더라도 쿼리 결과가 캐시됩니다.

D. 캐시에서 결과를 검색하는 쿼리에는 요금이 부과되지 않습니다.

Professional-Data-Engineer 문제 228

MJTelco에서는 마지막 데이터의 기록 분석을 허용하는 Google Bigtable의 스키마를 생성해야 합니다.
2년의 기록. 들어오는 각 기록은 15분마다 전송되며 장치의 고유 식별자와 데이터 기록을 포함합니다. 가장 일반적인 쿼리는 특정 날짜의 특정 장치에 대한 모든 데이터에 대한 것입니다. 어떤 스키마를 사용해야 합니까?

A. Rowkey: dateColumn 데이터: device_id, data_point

B. Rowkey: device_idColumn 데이터: 날짜, data_point

C. Rowkey: data_pointColumn 데이터: device_id, 날짜

D. Rowkey: date#device_id열 데이터: data_point

E. Rowkey: 날짜#data_point열 데이터: device_id

Professional-Data-Engineer 문제 229

데이터 과학팀이 분석을 위해 BigQuery 내에서 쿼리할 수 있도록 시계열 트랜잭션 데이터를 복사하는 데이터 파이프라인을 만들어야 합니다. 매시간 수천 건의 거래가 새로운 상태로 업데이트됩니다. 초기 데이터 세트의 크기는 1.5PB이며, 하루에 3TB씩 증가합니다. 데이터는 고도로 구조화되어 있으며 데이터 과학 팀은 이 데이터를 기반으로 기계 학습 모델을 구축합니다. 데이터 과학 팀의 성능과 유용성을 극대화하고 싶습니다. 어떤 두 가지 전략을 채택해야 합니까?
답변을 2개 선택하세요.

A. BigQuery UPDATE를 사용하여 데이터세트 크기를 더 줄입니다.

B. 데이터 구조를 최대한 보존합니다.

C. 상태 업데이트가 업데이트되는 대신 BigQuery에 추가되는 데이터 파이프라인을 개발합니다.

D. 가능한 한 데이터를 비정규화합니다.

E. 트랜잭션 데이터의 일일 스냅샷을 Cloud Storage에 복사하고 Avro 파일로 저장합니다. 외부 데이터 소스에 대한 BigQuery 지원을 사용하여 쿼리하세요.

Professional-Data-Engineer 문제 230

회사의 온프레미스 Apache Hadoop 서버의 수명이 가까워지고 있으며 IT 부서에서는 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 유사한 클러스터 마이그레이션에는 노드당 50TB의 Google 영구 디스크가 필요합니다. CIO는 그만큼의 블록 스토리지를 사용하는 데 드는 비용을 우려하고 있습니다.
마이그레이션에 따른 스토리지 비용을 최소화하려고 합니다. 당신은 무엇을 해야 합니까?

A. 데이터를 Google Cloud Storage에 저장합니다.

B. Cloud Dataproc 클러스터에 선점형 가상 머신(VM)을 사용합니다.

C. 모든 데이터에 충분한 디스크가 있도록 Cloud Dataproc 클러스터를 조정합니다.

D. 콜드 데이터 중 일부를 Google Cloud Storage로 마이그레이션하고 핫 데이터만 영구 디스크에 보관합니다.

다른 버전: 1631Google.Professional-Data-Engineer.v2024-12-06.q306; 1310Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2605Google.Professional-Data-Engineer.v2022-09-06.q248; 2049Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 106TheBerylInstitute.CPXP.v2026-06-06.q56; 122ACAMS.CAMS7-KR.v2026-06-05.q213; 142PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 125NLN.NEX.v2026-06-04.q54; 169Microsoft.AZ-500-KR.v2026-06-04.q213; 142Microsoft.DP-600-KR.v2026-06-04.q98; 179Microsoft.AZ-204-KR.v2026-06-04.q237; 152Microsoft.PL-600-KR.v2026-06-04.q112; 214Microsoft.SC-300-KR.v2026-06-03.q151; 179Microsoft.DP-600-KR.v2026-06-03.q70