Professional-Data-Engineer 문제 41
제품 판매 데이터를 저장하는 Cloud Spanner에서 새 트랜잭션 테이블을 생성해야 합니다. 기본 키로 사용할 항목을 결정하고 있습니다. 성능 관점에서 어떤 전략을 선택해야 합니까?
Professional-Data-Engineer 문제 42
분석 팀은 몇 가지 다른 메트릭을 기반으로 회사와 다시 협력할 가능성이 가장 높은 고객을 결정하기 위해 간단한 통계 모델을 구축하려고 합니다. 그들은 Google Cloud Storage에 저장된 데이터를 사용하여 Apache Spark에서 모델을 실행하기를 원하며 Google Cloud Dataproc을 사용하여 이 작업을 실행하도록 권장했습니다. 테스트에 따르면 이 워크로드는 15개 노드 클러스터에서 약 30분 안에 실행되어 결과를 Google BigQuery로 출력할 수 있습니다. 계획은 이 워크로드를 매주 실행하는 것입니다. 비용 대비 클러스터를 어떻게 최적화해야 합니까?
Professional-Data-Engineer 문제 43
소프트웨어는 모든 메시지에 간단한 JSON 형식을 사용합니다. 이러한 메시지는 Google Cloud Pub/Sub에 게시된 다음 Google Cloud Dataflow로 처리되어 CFO를 위한 실시간 대시보드를 만듭니다.
테스트하는 동안 대시보드에서 일부 메시지가 누락되었음을 알 수 있습니다. 로그를 확인하면 모든 메시지가 Cloud Pub/Sub에 성공적으로 게시되고 있습니다. 다음에 무엇을 해야 합니까?
테스트하는 동안 대시보드에서 일부 메시지가 누락되었음을 알 수 있습니다. 로그를 확인하면 모든 메시지가 Cloud Pub/Sub에 성공적으로 게시되고 있습니다. 다음에 무엇을 해야 합니까?
Professional-Data-Engineer 문제 44
Cloud Machine Learning Engine을 사용하여 자신의 컴퓨터에서 TensorFlow 학습 작업을 실행하려면 명령을 무엇으로 시작해야 할까요?
Professional-Data-Engineer 문제 45
귀하의 회사는 최근에 빠르게 성장했으며 현재 이전보다 훨씬 더 빠른 속도로 데이터를 수집하고 있습니다.
이전에. Apache Hadoop에서 일일 배치 MapReduce 분석 작업을 관리합니다. 그러나, 그
최근 데이터 증가로 인해 일괄 작업이 뒤쳐지고 있습니다. 방법을 추천해 달라는 요청을 받았습니다.
개발 팀은 비용 증가 없이 분석의 응답성을 높일 수 있습니다. 뭐
당신은 그들이 할 것을 권장해야합니까?
이전에. Apache Hadoop에서 일일 배치 MapReduce 분석 작업을 관리합니다. 그러나, 그
최근 데이터 증가로 인해 일괄 작업이 뒤쳐지고 있습니다. 방법을 추천해 달라는 요청을 받았습니다.
개발 팀은 비용 증가 없이 분석의 응답성을 높일 수 있습니다. 뭐
당신은 그들이 할 것을 권장해야합니까?
