Professional-Data-Engineer 문제 21

BigQuery 데이터 웨어하우스의 기본 인벤토리 테이블을 읽는 실시간에 가까운 인벤토리 대시보드를 만들어야 합니다. 과거 재고 데이터는 품목 및 위치별로 재고 잔고로 저장됩니다. 매시간 인벤토리에 수천 개의 업데이트가 있습니다. 대시보드의 성능을 최대화하고 데이터가 정확한지 확인하려고 합니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 22

Cloud Dataproc 클러스터를 관리하고 있습니다. 클러스터에서 진행 중인 작업을 잃지 않고 비용을 최소화하면서 작업 실행 속도를 높여야 합니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 23

범주 기능에서 범주 간의 관계에 대해 학습하기 위해 신경망을 어떻게 얻을 수 있습니까?

Professional-Data-Engineer 문제 24

배송 회사에는 실시간으로 Apache Kafka 스트림으로 전송되는 실시간 패키지 추적 데이터가 있습니다. 그런 다음 BigQuery에 로드됩니다. 회사의 분석가가 BigQuery의 추적 데이터를 쿼리하여 패키지 수명 주기의 지리 공간적 추세를 분석하려고 합니다. 이 테이블은 원래 수집 날짜 분할로 생성되었습니다. 시간이 지남에 따라 쿼리 처리 시간이 증가했습니다. BigQuery에서 쿼리 성능을 개선하는 변경 사항을 구현해야 합니다. 어떻게 해야 합니까?

Professional-Data-Engineer 문제 25

기계 학습 데이터 세트를 학습 데이터와 테스트 데이터로 분할해야 하는 이유는 무엇입니까?