Professional-Machine-Learning-Engineer 문제 1

두 단계가 포함된 Vertex Al 파이프라인을 만들었습니다. 첫 번째 단계에서는 10TB 데이터 전처리가 약 1시간 안에 완료되고 그 결과를 Cloud Storage 버킷에 저장합니다. 두 번째 단계에서는 처리된 데이터를 사용하여 모델을 학습합니다. 다양한 알고리즘을 테스트할 수 있도록 모델의 코드를 업데이트해야 합니다. 파이프라인 실행 시간과 비용을 줄이는 동시에 파이프라인 변경도 최소화합니다. 무엇을 해야 합니까?

Professional-Machine-Learning-Engineer 문제 2

당신은 자동차 회사의 AI팀에서 일하고 있으며 TensorFlow와 Keras를 사용하여 시각적 결함 감지 모델을 개발하고 있습니다. 모델 성능을 향상하려면 변환, 자르기, 대비 조정과 같은 일부 이미지 확대 기능을 통합하려고 합니다. 이러한 기능을 각 훈련 배치에 무작위로 적용합니다. 런타임 및 컴퓨팅 리소스 활용도를 위해 데이터 처리 파이프라인을 최적화하려고 합니다. 당신은 무엇을 해야 합니까?

Professional-Machine-Learning-Engineer 문제 3

데이터 세트를 정리하고 Cloud Storage 버킷에 저장하는 파이프라인을 개발한 데이터 엔지니어링팀과 협력합니다. ML 모델을 생성했으며 새 데이터가 제공되는 즉시 해당 데이터를 사용하여 모델을 새로 고치려고 합니다. CI/CD 워크플로의 일부로 Google Kubernetes Engine(GKE)에서 Kubeflow Pipelines 학습 작업을 자동으로 실행하려고 합니다. 이 워크플로우를 어떻게 설계해야 합니까?

Professional-Machine-Learning-Engineer 문제 4

당신은 자동차 회사의 AI팀에서 일하고 있으며 TensorFlow와 Keras를 사용하여 시각적 결함 감지 모델을 개발하고 있습니다. 모델 성능을 향상하려면 변환, 자르기, 대비 조정과 같은 일부 이미지 확대 기능을 통합하려고 합니다. 이러한 기능을 각 훈련 배치에 무작위로 적용합니다. 런타임 및 컴퓨팅 리소스 활용도를 위해 데이터 처리 파이프라인을 최적화하려고 합니다. 당신은 무엇을 해야 합니까?

Professional-Machine-Learning-Engineer 문제 5

팀에서는 이미지에 운전면허증, 여권 또는 신용카드가 포함되어 있는지 예측하는 모델을 구축해야 합니다. 데이터 엔지니어링 팀은 이미 파이프라인을 구축하고 운전면허증이 포함된 이미지 10,000개, 여권이 포함된 이미지 1,000개, 신용카드가 포함된 이미지 1,000개로 구성된 데이터 세트를 생성했습니다. 이제 ['driversjicense', 'passport', 'credit_card'] 라벨 맵을 사용하여 모델을 훈련해야 합니다. 어떤 손실 함수를 사용해야 합니까?