Professional-Data-Engineer 문제 181

여러분은 3개 병원의 수백 명의 환자를 대상으로 시범 프로젝트로 환자 기록 데이터베이스를 설계했습니다.
귀하의 디자인은 모든 환자와 방문을 나타내는 단일 데이터베이스 테이블을 사용했으며, 셀프 조인을 사용하여 보고서를 생성했습니다. 서버 리소스 사용률은 50%였습니다. 그 이후로 프로젝트 범위가 확장되었습니다. 데이터베이스는 이제 100배 더 많은 환자 기록을 저장해야 합니다. 너무 오래 걸리거나 컴퓨팅 리소스가 부족하여 오류가 발생하기 때문에 더 이상 보고서를 실행할 수 없습니다. 데이터베이스 디자인을 어떻게 조정해야 합니까?

Professional-Data-Engineer 문제 182

제품 판매 데이터를 저장하는 Cloud Spanner에서 새 거래 테이블을 만들어야 합니다. 기본 키로 무엇을 사용할지 결정하고 있습니다. 성과 관점에서 어떤 전략을 선택해야 할까요?

Professional-Data-Engineer 문제 183

Cloud Dataproc은 _____ 청구를 통해 실제로 사용한 만큼만 요금을 청구합니다.

Professional-Data-Engineer 문제 184

모바일 애플리케이션, 즉 미디어 스트리밍 서비스를 위한 새로운 저장 시스템을 배포하고 있습니다.
가장 적합한 것이 Google Cloud Datastore라고 결정합니다. 여러 속성을 가진 엔터티가 있으며, 그 중 일부는 여러 값을 가질 수 있습니다. 예를 들어, 엔터티 `Movie`에서 속성 `actors`와 속성
`tags'는 여러 값을 갖지만 `date released' 속성은 그렇지 않습니다. 일반적인 쿼리는 actor=<actorname>인 모든 영화를 date_released 순으로 정렬하거나 tag=Comedy인 모든 영화를 date_released 순으로 정렬합니다. 인덱스 수의 조합적 폭발을 어떻게 피해야 할까요?

Professional-Data-Engineer 문제 185

BigQuery ML에서 선형 회귀 모델을 작업하여 고객이 귀사의 제품을 구매할 가능성을 예측하고 있습니다. 귀사의 모델은 도시 이름 변수를 주요 예측 구성 요소로 사용하여 모델을 훈련하고 제공하고자 하며, 데이터는 열로 구성되어야 합니다. 예측 가능한 변수를 유지하면서 최소한의 코딩으로 데이터를 준비하려고 합니다. 어떻게 해야 할까요?