무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-12-06.q306 모의 시험 (Page 43)

Professional-Data-Engineer 문제 206

여러분은 3개 병원의 수백 명의 환자를 대상으로 시범 프로젝트로 환자 기록 데이터베이스를 설계했습니다.
귀하의 디자인은 모든 환자와 방문을 나타내는 단일 데이터베이스 테이블을 사용했고, 셀프 조인을 사용하여 보고서를 생성했습니다. 서버 리소스 사용률은 50%였습니다. 그 이후로 프로젝트 범위가 확장되었습니다.
데이터베이스는 이제 100배 더 많은 환자 기록을 저장해야 합니다. 너무 오래 걸리거나 컴퓨팅 리소스가 부족하여 오류가 발생하기 때문에 더 이상 보고서를 실행할 수 없습니다. 데이터베이스 설계를 어떻게 조정해야 합니까?

A. 마스터 환자 기록 테이블을 환자 테이블과 방문 테이블로 정규화하고, 셀프 조인을 방지하기 위해 다른 필요한 테이블을 생성합니다.

B. 테이블을 더 작은 테이블로 분할하고, 클리닉마다 하나씩 분할합니다. 더 작은 테이블 쌍에 대해 쿼리를 실행하고, 통합 보고서에는 Union을 사용합니다.

C. 날짜 범위를 기준으로 테이블을 더 작은 테이블로 분할하고, 미리 지정된 날짜 범위에 대한 보고서만 생성합니다.

D. 데이터베이스 서버에 용량(메모리와 디스크 공간)을 200만큼 추가합니다.

Professional-Data-Engineer 문제 207

스트리밍 Cloud Dataflow 파이프라인을 운영하고 있습니다. 엔지니어는 다른 윈도잉 알고리즘과 트리거링 전략이 있는 새로운 버전의 파이프라인을 보유하고 있습니다. 실행 중인 파이프라인을 새로운 버전으로 업데이트하려고 합니다. 업데이트 중에 데이터가 손실되지 않도록 하려고 합니다. 어떻게 해야 할까요?

A. --jobName을 새 고유 작업 이름으로 설정하여 --update 옵션을 전달하여 Cloud Dataflow 파이프라인을 진행 중에 업데이트합니다.

B. 취소 옵션으로 Cloud Dataflow 파이프라인을 중지합니다. 업데이트된 코드로 새 Cloud Dataflow 작업을 만듭니다.

C. Drain 옵션으로 Cloud Dataflow 파이프라인을 중지합니다. 업데이트된 코드로 새 Cloud Dataflow 작업을 만듭니다.

D. --jobName을 기존 작업 이름으로 설정하여 --update 옵션을 전달하여 진행 중인 Cloud Dataflow 파이프라인을 업데이트합니다.

Professional-Data-Engineer 문제 208

귀사는 엄격하게 규제되는 산업에 종사하고 있습니다. 귀사의 요구 사항 중 하나는 개별 사용자가 업무를 수행하는 데 필요한 최소한의 정보에만 액세스할 수 있도록 하는 것입니다. Google BigQuery로 이 요구 사항을 시행하려고 합니다.
어떤 세 가지 접근 방식을 취할 수 있나요? (세 가지를 선택하세요.)

A. 특정 테이블에 대한 쓰기를 비활성화합니다.

B. 역할에 따라 테이블에 대한 액세스를 제한합니다.

C. 데이터가 항상 암호화되어 있는지 확인하세요.

D. 승인된 사용자로만 BigQuery API 액세스를 제한합니다.

E. 여러 테이블이나 데이터베이스에 데이터를 분리합니다.

F. Google Stackdriver 감사 로깅을 사용하여 정책 위반을 확인하세요.

Professional-Data-Engineer 문제 209

Google Cloud에서 IoT 데이터를 Cloud Pub/Sub에서 Cloud Dataflow를 거쳐 BigQuery로 스트리밍하기 위한 새로운 파이프라인을 만들고 있습니다. 데이터를 미리 보는 동안 약 2%의 데이터가 손상된 것으로 보입니다.
이 손상된 데이터를 필터링하려면 Cloud Dataflow 파이프라인을 수정해야 합니다. 어떻게 해야 합니까?

A. 손상된 요소를 삭제하기 위해 Cloud Dataflow에 ParDo 변환을 추가합니다.

B. Cloud Dataflow에 파티션 변환을 추가하여 유효한 데이터와 손상된 데이터를 분리합니다.

C. 요소가 손상되었을 경우 부울 값을 반환하는 SideInput을 추가합니다.

D. Cloud Dataflow에 GroupByKey 변환을 추가하여 모든 유효한 데이터를 그룹화하고 나머지는 삭제합니다.

Professional-Data-Engineer 문제 210

의류 추천을 위한 모델을 구축하고 있습니다. 사용자의 패션 선호도는 시간이 지남에 따라 바뀔 가능성이 높으므로 새로운 데이터가 제공되면 모델로 다시 스트리밍하는 데이터 파이프라인을 구축합니다. 이 데이터를 사용하여 모델을 학습하려면 어떻게 해야 합니까?

A. 기존 데이터를 테스트 세트로 사용하면서 새 데이터로 훈련합니다.

B. 새 데이터를 테스트 세트로 사용하면서 기존 데이터로 훈련합니다.

C. 새로운 데이터로만 모델을 지속적으로 다시 학습시킵니다.

D. 기존 데이터와 새 데이터를 조합하여 모델을 지속적으로 다시 학습시킵니다.

다른 버전: 1167Google.Professional-Data-Engineer.v2024-08-24.q281; 1310Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2611Google.Professional-Data-Engineer.v2022-09-06.q248; 2054Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 109TheBerylInstitute.CPXP.v2026-06-06.q56; 131ACAMS.CAMS7-KR.v2026-06-05.q213; 155PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 128NLN.NEX.v2026-06-04.q54; 177Microsoft.AZ-500-KR.v2026-06-04.q213; 160Microsoft.DP-600-KR.v2026-06-04.q98; 181Microsoft.AZ-204-KR.v2026-06-04.q237; 163Microsoft.PL-600-KR.v2026-06-04.q112; 225Microsoft.SC-300-KR.v2026-06-03.q151; 192Microsoft.DP-600-KR.v2026-06-03.q70