무료 온라인 액세스 Google.Professional-Data-Engineer.v2022-05-24.q174 모의 시험 (Page 19)

Professional-Data-Engineer 문제 86

거의 실시간으로 분당 10,000개의 메시지 속도로 Google BigQuery에 소셜 미디어 게시물을 저장하고 분석해야 합니다. 처음에는 개별 게시물에 스트리밍 삽입을 사용하도록 애플리케이션을 디자인합니다.
또한 애플리케이션은 스트리밍 삽입 직후에 데이터 집계를 수행합니다. 스트리밍 삽입 후 쿼리가 강력한 일관성을 나타내지 않고 쿼리의 보고서에서 진행 중인 데이터가 누락될 수 있음을 발견했습니다.

A. 스트리밍 삽입 후 데이터 가용성에 대한 평균 대기 시간을 추정하고 항상 두 배 이상 기다린 후 쿼리를 실행합니다.

B. 애플리케이션 디자인을 어떻게 조정할 수 있습니까?

C. 2분마다 누적 데이터를 로드하도록 애플리케이션을 다시 작성합니다.

D. 원본 메시지를 Google Cloud SQL에 로드하고 스트리밍 삽입을 통해 매시간 테이블을 BigQuery로 내보냅니다.

E. 스트리밍 삽입 코드를 개별 메시지에 대한 일괄 로드로 변환합니다.

Professional-Data-Engineer 문제 87

Google BigQuery를 데이터 웨어하우스로 사용하고 있습니다. 사용자는 쿼리를 실행하는 시기에 관계없이 다음과 같은 간단한 쿼리가 매우 느리게 실행되고 있다고 보고합니다.
SELECT country, state, city FROM [myproject:mydataset.mytable] GROUP BY country 쿼리에 대한 쿼리 계획을 확인하고 Stage:1의 읽기 섹션에서 다음 출력을 확인합니다.

이 쿼리에 대한 지연의 가장 가능성 있는 원인은 무엇입니까?

A. [myproject:mydataset.mytable] 테이블의 주 또는 도시 열에 NULL 값이 너무 많습니다.

B. [myproject:mydataset.mytable] 테이블에 파티션이 너무 많습니다.

C. 사용자가 시스템에서 너무 많은 동시 쿼리를 실행하고 있습니다.

D. [myproject:mydataset.mytable]테이블의 대부분의 행은 국가 열의 값이 동일하여 데이터 왜곡이 발생함

Professional-Data-Engineer 문제 88

귀하의 회사는 휴가철 동안 실시간 데이터를 분석하여 다양한 제안을 제공하는 첫 번째 동적 캠페인을 실행하고 있습니다. 데이터 과학자들은 30일 캠페인 기간 동안 매시간 빠르게 증가하는 테라바이트의 데이터를 수집하고 있습니다. 그들은 Google Cloud Dataflow를 사용하여 데이터를 사전 처리하고 Google Cloud Bigtable의 기계 학습 모델에 필요한 기능(신호) 데이터를 수집합니다. 팀은 10TB의 데이터에 대한 초기 로드의 읽기 및 쓰기로 최적이 아닌 성능을 관찰하고 있습니다. 그들은 비용을 최소화하면서 이 성능을 개선하기를 원합니다. 그들은 어떻게 해야 합니까?

A. 테이블의 행 공간에 읽기 및 쓰기를 고르게 분산하여 스키마를 재정의합니다.

B. 성능 문제는 BigDate 클러스터의 사이트가 증가함에 따라 시간이 지남에 따라 해결되어야 합니다.

C. 단일 행 키를 사용하여 클러스터에서 자주 업데이트해야 하는 값을 식별하도록 스키마를 재설계합니다.

D. 제안을 보는 사용자마다 순차적으로 증가하는 숫자 ID를 기반으로 행 키를 사용하도록 스키마를 재설계합니다.

Professional-Data-Engineer 문제 89

Dataproc 클러스터에는 많은 구성 파일이 포함되어 있습니다. 이러한 파일을 업데이트하려면 --properties 옵션을 사용해야 합니다. 옵션 형식은 file_prefix:property=_____입니다.

A. 세부사항

B. 값

C. 널

D. 아이디

Professional-Data-Engineer 문제 90

BigQuery에서 처리하는 열 수를 줄이는 데 사용할 수 있는 SQL 키워드는 무엇인가요?

A. 사이

B. 어디

C. 선택

D. 제한

다른 버전: 1672Google.Professional-Data-Engineer.v2024-12-06.q306; 1256Google.Professional-Data-Engineer.v2024-08-24.q281; 1366Google.Professional-Data-Engineer.v2023-06-24.q151; 1833Google.Professional-Data-Engineer.v2023-04-17.q208; 2633Google.Professional-Data-Engineer.v2022-09-06.q248

최근 업로드: 129SAP.C_S4CPB_2602.v2026-06-13.q7; 148SAP.C-S4CS-2602.v2026-06-13.q29; 169Salesforce.Slack-Con-201.v2026-06-13.q86; 169Oracle.1Z1-136.v2026-06-13.q46; 150BCS.BAPv5.v2026-06-13.q62; 137PaloAltoNetworks.SSE-Engineer.v2026-06-13.q18; 138SAP.C_CR125.v2026-06-13.q26; 135Proofpoint.PPAN01.v2026-06-13.q19; 142Workday.Workday-Pro-Time-Tracking.v2026-06-13.q19; 163API.API-1184.v2026-06-12.q40