Professional-Data-Engineer 문제 291

당신은 경제 동향을 실시간으로 파악하도록 돕는 경제 컨설팅 회사에서 일합니다. 분석의 일환으로 Google BigQuery를 사용하여 고객 데이터를 빵, 가솔린, 우유 등 가장 많이 판매되는 100가지 상품의 평균 가격과 연관시킵니다. 이러한 상품의 평균 가격은 30분마다 업데이트됩니다. 이 데이터를 최신 상태로 유지하여 BigQuery의 다른 데이터와 가능한 한 저렴하게 결합하고자 합니다. 어떻게 해야 할까요?

Professional-Data-Engineer 문제 292

다음 중 Dataflow 파이프라인에 대해 사실이 아닌 것은 무엇입니까?

Professional-Data-Engineer 문제 293

Compute Engine 가상 머신(n2-standard -32)에서 TensorFlow 머신 러닝 모델을 프레이밍하는 데 이틀이 걸립니다. 이 모델에는 CPU에서 부분적으로 실행해야 하는 사용자 지정 TensorFlow 작업이 있습니다. 비용 효율적인 방식으로 학습 시간을 줄이고 싶습니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 294

귀사는 Google Cloud Dataflow에서 학습 알고리즘에 대한 데이터 전처리를 수행하고 있습니다. 이 단계에서 수많은 데이터 로그가 생성되고 있으며, 팀은 이를 분석하려고 합니다. 캠페인의 동적 특성으로 인해 데이터가 매시간 기하급수적으로 증가하고 있습니다.
데이터 과학자는 로그에서 새로운 주요 기능에 대한 데이터를 읽기 위해 다음 코드를 작성했습니다.
BigQueryIO.읽기
.named("ReadLogData")
.from("클라우드데이터플로우-읽기전용:샘플.로그_데이터")
이 데이터 읽기의 성능을 개선하고 싶습니다. 무엇을 해야 할까요?

Professional-Data-Engineer 문제 295

귀하의 신경망 모델은 훈련하는 데 며칠이 걸립니다. 훈련 속도를 높이고 싶습니다. 무엇을 할 수 있습니까?