무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-08-24.q281 모의 시험 (Page 34)

Professional-Data-Engineer 문제 161

다음 중 Dataproc 클러스터 인스턴스에서 소프트웨어를 맞춤설정하는 방법이 아닌 것은 무엇인가요?

A. 초기화 작업 설정

B. 클러스터 속성을 사용하여 구성 파일 수정

C. Cloud 배포 관리자를 사용하여 클러스터 구성

D. 마스터 노드에 로그인하고 거기에서 변경합니다.

Professional-Data-Engineer 문제 162

다음 중 Dataproc 클러스터에 선점형 작업자를 추가할 때 적용되는 규칙은 무엇인가요?(답변 2개 선택)

A. 선점형 작업자는 영구 디스크를 사용할 수 없습니다.

B. 선점형 작업자는 데이터를 저장할 수 없습니다.

C. 선점형 작업자가 회수되면 대체 작업자를 수동으로 추가해야 합니다.

D. Dataproc 클러스터에는 선점형 작업자만 있을 수 없습니다.

Professional-Data-Engineer 문제 163

타임스탬프 및 ID 열의 WHERE 절을 사용하여 BigQuery 테이블을 필터링하는 쿼리가 있습니다. bq query -dry_run을 사용하면 타임스탬프 및 ID에 대한 필터가 전체 데이터의 아주 작은 부분을 선택하더라도 쿼리가 테이블의 전체 스캔을 트리거한다는 것을 알 수 있습니다. 기존 SQL 쿼리를 최소한으로 변경하여 BigQuery에서 스캔하는 데이터 양을 줄이고 싶습니다. 당신은 무엇을 해야 합니까?

A. 각 ID에 대해 별도의 테이블을 만듭니다.

B. 반환되는 행 수를 줄이려면 LIMIT 키워드를 사용하세요.

C. 분할 열과 클러스터링 열을 사용하여 테이블을 다시 만듭니다.

D. bq 쿼리 - -maximum_bytes_billed 플래그를 사용하여 청구되는 바이트 수를 제한합니다.

Professional-Data-Engineer 문제 164

3개 진료소의 수백 명의 환자를 대상으로 하는 파일럿 프로젝트로 환자 기록용 데이터베이스를 설계했습니다. 귀하의 디자인에서는 단일 데이터베이스 테이블을 사용하여 모든 환자와 방문을 나타내고 자체 조인을 사용하여 보고서를 생성했습니다. 서버 리소스 활용도는 50%였습니다. 이후 프로젝트 범위가 확대됐다. 이제 데이터베이스는 100배 더 많은 환자 기록을 저장해야 합니다. 보고서가 너무 오래 걸리거나 컴퓨팅 리소스가 부족하여 오류가 발생하기 때문에 더 이상 보고서를 실행할 수 없습니다. 데이터베이스 디자인을 어떻게 조정해야 합니까?

A. 날짜 범위를 기준으로 테이블을 더 작은 테이블로 분할하고 미리 지정된 날짜 범위의 보고서만 생성합니다.

B. 마스터 환자 기록 테이블을 환자 테이블과 방문 테이블로 정규화하고 자체 조인을 방지하기 위해 필요한 다른 테이블을 만듭니다.

C. 데이터베이스 서버에 200 단위로 용량(메모리 및 디스크 공간)을 추가합니다.

D. 테이블을 각 진료소마다 하나씩 더 작은 테이블로 분할합니다. 더 작은 테이블 쌍에 대해 쿼리를 실행하고 통합 보고서에 공용체를 사용합니다.

Professional-Data-Engineer 문제 165

이러한 기본 도구가 사용되며 데이터 형식은 ORC(Optimized Row Columnar)입니다. 모든 ORC 파일이 Cloud Storage 버킷에 성공적으로 복사되었습니다. 성능을 최대화하려면 일부 데이터를 클러스터의 로컬 HDFS(Hadoop 분산 파일 시스템)에 복제해야 합니다. Cloud Dataproc에서 Hive를 사용하는 두 가지 방법은 무엇인가요? (2개를 선택하세요.)

A. ORC 파일을 BigQuery에 로드합니다. Hadoop용 BigQuery 커넥터를 활용하여 BigQuery 테이블을 외부 Hive 테이블로 마운트합니다. 외부 Hive 테이블을 기본 테이블에 복제합니다.

B. gsutil 유틸리티를 실행하여 Cloud Storage 버킷의 모든 ORC 파일을 Dataproc 클러스터의 노드로 전송합니다. Hive 테이블을 로컬로 탑재합니다.

C. Hadoop용 Cloud Storage 커넥터를 활용하여 ORC 파일을 외부 Hive 테이블로 마운트합니다. 외부 Hive 테이블을 기본 테이블에 복제합니다.

D. gsutil 유틸리티를 실행하여 모든 ORC 파일을 Cloud Storage 버킷에서 HDFS로 전송합니다. Hive 테이블을 로컬로 탑재합니다.

E. gsutil 유틸리티를 실행하여 Cloud Storage 버킷의 모든 ORC 파일을 Dataproc 클러스터의 마스터 노드로 전송합니다. 그런 다음 Hadoop 유틸리티를 실행하여 HDFS에 복사합니다. HDFS에서 Hive 테이블을 마운트합니다.

다른 버전: 1661Google.Professional-Data-Engineer.v2024-12-06.q306; 1326Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2624Google.Professional-Data-Engineer.v2022-09-06.q248; 2057Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 110Snowflake.ADA-C02.v2026-06-08.q23; 126Microsoft.SC-300-KR.v2026-06-08.q173; 112Microsoft.DP-300-KR.v2026-06-08.q157; 117Microsoft.MS-102-KR.v2026-06-08.q240; 113Microsoft.DP-300-KR.v2026-06-08.q176; 119Microsoft.SC-100-KR.v2026-06-08.q115; 121TheBerylInstitute.CPXP.v2026-06-06.q56; 190ACAMS.CAMS7-KR.v2026-06-05.q213; 181PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 156NLN.NEX.v2026-06-04.q54