Professional-Data-Engineer 문제 146

Google Cloud에서 데이터 파이프라인을 구축 중입니다. 기계 학습 프로세스를 위해 캐주얼한 방법을 사용하여 데이터를 준비해야 합니다. 로지스틱 회귀 모델을 지원하려고 합니다. 또한 실제 값으로 유지되어야 하고 제거할 수 없는 null 값을 모니터링하고 조정해야 합니다. 당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 147

다음 중 피쳐 엔지니어링 기법에 해당하는 것은? (2개 답변 선택)

Professional-Data-Engineer 문제 148

귀하의 팀은 이진 분류 문제를 해결하기 위해 노력하고 있습니다. 기본 매개변수를 사용하여 지원 벡터 머신(SVM) 분류기를 훈련했으며 검증 세트에서 곡선 아래 영역(AUC) 0.87을 받았습니다.
모델의 AUC를 늘리려고 합니다. 당신은 무엇을해야합니까?

Professional-Data-Engineer 문제 149

주식 거래를 저장하는 데이터베이스와 조정 가능한 기간 동안 주어진 회사의 평균 주가를 검색하는 애플리케이션을 운영합니다. 데이터는 주식 거래의 날짜/시간이 row key의 시작인 Cloud Bigtable에 저장됩니다. 애플리케이션에 수천 명의 동시 사용자가 있으며 더 많은 주식이 추가됨에 따라 성능이 저하되기 시작했습니다. 애플리케이션의 성능을 향상시키려면 어떻게 해야 합니까?

Professional-Data-Engineer 문제 150

전자 상거래 회사의 장바구니 포기 시스템을 설계하고 있습니다. 시스템이 보낼 것입니다
다음 규칙에 따라 사용자에게 메시지:
1시간 동안 사이트에서 사용자의 상호 작용 없음

장바구니에 $30 이상의 제품을 추가했습니다.

거래가 완료되지 않았습니다

Google Cloud Dataflow를 사용하여 데이터를 처리하고 메시지를 보내야 하는지 여부를 결정합니다. 어떻게 해야
파이프라인을 설계합니까?