Professional-Data-Engineer 문제 126
귀하는 Google BigQuery를 데이터 웨어하우스로 사용하고 있습니다. 귀하의 사용자는 다음 간단한 쿼리가 언제 쿼리를 실행하든 매우 느리게 실행된다고 보고합니다.
SELECT country, state, city FROM [myproject:mydataset.mytable] GROUP BY country Stage:1의 읽기 섹션에서 쿼리에 대한 쿼리 계획을 확인하고 다음 출력을 확인합니다.

이 질의가 지연되는 가장 큰 원인은 무엇일까요?
SELECT country, state, city FROM [myproject:mydataset.mytable] GROUP BY country Stage:1의 읽기 섹션에서 쿼리에 대한 쿼리 계획을 확인하고 다음 출력을 확인합니다.

이 질의가 지연되는 가장 큰 원인은 무엇일까요?
Professional-Data-Engineer 문제 127
기존 온프레미스 데이터 전략을 현대화해야 합니다. 귀하의 조직은 현재 이를 사용합니다.
* 데이터 복제를 위한 온프레미스 Hadoop 분산 파일 시스템(HDFS)을 포함하여 여러 개의 대규모 데이터 세트를 처리하기 위한 Apache Hadoop 클러스터.
* Apache Airflow는 수천 개의 작업 단계로 구성된 수백 개의 ETL 파이프라인을 조율합니다.
Hadoop 워크로드를 처리할 수 있고 기존 오케스트레이션 프로세스를 최소한으로 변경해야 하는 Google Cloud의 새로운 아키텍처를 설정해야 합니다. 무엇을 해야 할까요?
* 데이터 복제를 위한 온프레미스 Hadoop 분산 파일 시스템(HDFS)을 포함하여 여러 개의 대규모 데이터 세트를 처리하기 위한 Apache Hadoop 클러스터.
* Apache Airflow는 수천 개의 작업 단계로 구성된 수백 개의 ETL 파이프라인을 조율합니다.
Hadoop 워크로드를 처리할 수 있고 기존 오케스트레이션 프로세스를 최소한으로 변경해야 하는 Google Cloud의 새로운 아키텍처를 설정해야 합니다. 무엇을 해야 할까요?
Professional-Data-Engineer 문제 128
projects.regions.clusters.create 작업으로 새 Cloud Dataproc 클러스터를 만들 때는 프로젝트, 지역, 이름, ____라는 네 가지 값이 필요합니다.
Professional-Data-Engineer 문제 129
회사 내 여러 부서에 대해 BigQuery에 대한 액세스를 설정해야 합니다. 솔루션은 다음 요구 사항을 준수해야 합니다.
* 각 부서는 자체 데이터에만 접근해야 합니다.
* 각 부서에는 테이블을 만들고 업데이트하여 팀에 제공해야 하는 한 명 이상의 리드가 있습니다.
* 각 부서에는 데이터를 쿼리할 수는 있지만 수정할 수는 없는 데이터 분석가가 있습니다.
BigQuery에서 데이터에 대한 액세스 권한을 어떻게 설정해야 하나요?
* 각 부서는 자체 데이터에만 접근해야 합니다.
* 각 부서에는 테이블을 만들고 업데이트하여 팀에 제공해야 하는 한 명 이상의 리드가 있습니다.
* 각 부서에는 데이터를 쿼리할 수는 있지만 수정할 수는 없는 데이터 분석가가 있습니다.
BigQuery에서 데이터에 대한 액세스 권한을 어떻게 설정해야 하나요?
Professional-Data-Engineer 문제 130
매달 제3자로부터 CSV 형식의 데이터 파일을 받습니다. 이 데이터를 정리해야 하지만, 3개월마다 파일의 스키마가 변경됩니다. 이러한 변환을 구현하기 위한 요구 사항은 다음과 같습니다.
* 일정에 따라 변환 실행
* 개발자가 아닌 분석가가 변환을 수정할 수 있도록 함
* 변환 설계를 위한 그래픽 도구 제공
어떻게 해야 할까요?
* 일정에 따라 변환 실행
* 개발자가 아닌 분석가가 변환을 수정할 수 있도록 함
* 변환 설계를 위한 그래픽 도구 제공
어떻게 해야 할까요?
