Professional-Data-Engineer 문제 6

BigQuery 캐싱에 대한 다음 설명 중 참인 것은 무엇인가요?

Professional-Data-Engineer 문제 7

귀하의 회사는 독점 시스템을 사용하여 6시간마다 재고 데이터를 클라우드의 데이터 수집 서비스로 보냅니다. 전송된 데이터에는 여러 필드의 페이로드와 전송 타임스탬프가 포함됩니다. 전송에 문제가 있는 경우 시스템은 해당 데이터를 다시 전송합니다.
ㅏ. 가장 효율적으로 데이터 중복을 제거하려면 어떻게 해야 합니까?

Professional-Data-Engineer 문제 8

데이터 과학자가 BigQuery ML 모델을 생성하고 예측을 제공할 ML 파이프라인을 생성해 달라고 요청했습니다.
지연 시간이 100밀리초 미만인 개별 사용자 ID에 대한 예측을 제공해야 하는 REST API 애플리케이션이 있습니다. 다음 쿼리를 사용하여 예측을 생성합니다. SELECT Predicted_label, user_id FROM ML.PREDICT (MODEL 'dataset.model', table user_features). ML 파이프라인을 어떻게 생성해야 합니까?

Professional-Data-Engineer 문제 9

Cloud Pub/Sub에서 Cloud Dataflow를 통해 BigQuery로 IoT 데이터를 스트리밍하기 위해 Google Cloud에 새 파이프라인을 만들고 있습니다. 데이터를 미리 보는 동안 데이터의 약 2%가 손상된 것으로 나타납니다. 이 손상된 데이터를 필터링하려면 Cloud Dataflow 파이프라인을 수정해야 합니다. 당신은 무엇을 해야 합니까?

Professional-Data-Engineer 문제 10

다음 중 분할된 테이블에 데이터를 넣는 데 지원되는 방법이 아닌 것은 무엇입니까?