Professional-Data-Engineer 문제 186
귀하는 Google BigQuery를 데이터 웨어하우스로 사용하고 있습니다. 귀하의 사용자는 다음 간단한 쿼리가 언제 쿼리를 실행하든 매우 느리게 실행된다고 보고합니다.
SELECT country, state, city FROM [myproject:mydataset.mytable] GROUP BY country Stage:1의 읽기 섹션에서 쿼리에 대한 쿼리 계획을 확인하고 다음 출력을 확인합니다.

이 질의가 지연되는 가장 큰 원인은 무엇일까요?
SELECT country, state, city FROM [myproject:mydataset.mytable] GROUP BY country Stage:1의 읽기 섹션에서 쿼리에 대한 쿼리 계획을 확인하고 다음 출력을 확인합니다.

이 질의가 지연되는 가장 큰 원인은 무엇일까요?
Professional-Data-Engineer 문제 187
Google BigQuery에서 분당 10,000개의 메시지 속도로 거의 실시간으로 소셜 미디어 게시물을 저장하고 분석해야 합니다. 처음에는 개별 게시물에 스트리밍 삽입을 사용하도록 애플리케이션을 설계합니다. 애플리케이션은 또한 스트리밍 삽입 직후에 데이터 집계를 수행합니다. 스트리밍 삽입 후의 쿼리가 강력한 일관성을 나타내지 않고 쿼리의 보고서에서 진행 중인 데이터가 누락될 수 있음을 알게 됩니다. 애플리케이션 설계를 어떻게 조정할 수 있습니까?
Professional-Data-Engineer 문제 188
파이프라인 작업을 실행하려면 Compute Engine 계정에서 다음 중 어떤 IAM 역할이 필요합니까?
Professional-Data-Engineer 문제 189
회사의 고객 및 주문 데이터베이스는 종종 과부하 상태입니다. 이로 인해 운영에 피해를 주지 않고 분석을 수행하기 어렵습니다. 데이터베이스는 MySQL 클러스터에 있으며, mysqldump를 사용하여 매일 밤 백업을 수행합니다. 운영에 최소한의 영향을 미치는 분석을 수행하고자 합니다.
어떻게 해야 할까요?
어떻게 해야 할까요?
Professional-Data-Engineer 문제 190
귀사의 사업주가 은행 거래 데이터베이스를 제공했습니다. 각 행에는 사용자 ID, 거래 유형, 거래 위치 및 거래 금액이 포함되어 있습니다. 그들은 귀하에게 데이터에 어떤 유형의 머신 러닝을 적용할 수 있는지 조사해 달라고 요청합니다. 어떤 세 가지 머신 러닝 애플리케이션을 사용할 수 있습니까? (세 가지를 선택하십시오.)
