Professional-Machine-Learning-Engineer 문제 1
데이터 과학자는 고속 실시간 스트리밍 데이터를 위한 서버리스 수집 및 분석 솔루션을 만들어야 합니다.
수집 프로세스는 JSON에서 들어오는 레코드를 데이터 손실 없이 쿼리에 최적화된 열 형식으로 버퍼링하고 변환해야 합니다. 출력 데이터 저장소는 가용성이 높아야 하며 분석가는 데이터에 대해 SQL 쿼리를 실행하고 기존 비즈니스 인텔리전스 대시보드에 연결할 수 있어야 합니다.
데이터 과학자는 요구 사항을 충족하기 위해 어떤 솔루션을 구축해야 합니까?
수집 프로세스는 JSON에서 들어오는 레코드를 데이터 손실 없이 쿼리에 최적화된 열 형식으로 버퍼링하고 변환해야 합니다. 출력 데이터 저장소는 가용성이 높아야 하며 분석가는 데이터에 대해 SQL 쿼리를 실행하고 기존 비즈니스 인텔리전스 대시보드에 연결할 수 있어야 합니다.
데이터 과학자는 요구 사항을 충족하기 위해 어떤 솔루션을 구축해야 합니까?
Professional-Machine-Learning-Engineer 문제 2
당신은 산업 장비 제조 회사의 데이터 과학자입니다. 모든 공장에서 수집한 센서 데이터를 기반으로 회사 제조 공장의 전력 소비를 추정하기 위한 회귀 모델을 개발하고 있습니다. 센서는 매일 수천만 건의 기록을 수집합니다. 현재 날짜까지 수집된 모든 데이터를 사용하는 모델에 대한 일일 교육 실행을 예약해야 합니다. 모델이 원활하게 확장되고 최소한의 개발 작업만 필요하기를 원합니다. 당신은 무엇을 해야 합니까?
Professional-Machine-Learning-Engineer 문제 3
클라우드 기반 백엔드 시스템을 사용하여 훈련 작업을 제출하는 데이터 과학자 팀을 관리합니다. 이 시스템은 관리하기가 매우 어려워졌으며 대신 관리형 서비스를 사용하고 싶습니다. 함께 작업하는 데이터 과학자들은 Keras, PyTorch, theano를 비롯한 다양한 프레임워크를 사용합니다. Scikit 팀 및 사용자 정의 라이브러리. 당신은 무엇을 해야 합니까?
Professional-Machine-Learning-Engineer 문제 4
귀하는 회사가 더욱 타겟이 명확한 온라인 광고 캠페인을 만드는 데 도움이 되는 모델을 개발하고 있습니다. 모델을 훈련하는 데 사용할 데이터 세트를 생성해야 합니다. 모델에서 불공정한 편향을 생성하거나 강화하는 것을 피하고 싶습니다. 당신은 무엇을 해야 합니까?
답변 2개 선택
답변 2개 선택
Professional-Machine-Learning-Engineer 문제 5
모델 학습 및 예측에 앞서 Dataflow를 사용하여 원시 데이터를 사전 처리하는 수요 예측 파이프라인이 프로덕션에 있습니다. 사전 처리 중에 BigQuery에 저장된 데이터에 Z 점수 정규화를 적용하고 이를 다시 BigQuery에 씁니다. 매주 새로운 훈련 데이터가 추가됩니다. 계산 시간과 수동 개입을 최소화하여 프로세스를 보다 효율적으로 만들고 싶습니다. 당신은 무엇을 해야 합니까?