Databricks-Certified-Professional-Data-Scientist 문제 21

Amazon.com에서 책을 추천하기 위한 모델을 생성 중입니다. 다음 추천 시스템 중 콜드 스타트 ​​문제가 발생하지 않는 추천 시스템은 무엇입니까?

Databricks-Certified-Professional-Data-Scientist 문제 22

질문-3: 기계 학습에서 해싱 트릭(커널 트릭과 유사)이라고도 하는 기능 해싱은 기능(예: 언어의 단어)을 벡터화하는 빠르고 공간 효율적인 방법입니다. 임의의 기능을 벡터 또는 행렬의 인덱스로 변환합니다. 연관 배열에서 인덱스를 찾는 대신 기능에 해시 함수를 적용하고 해당 해시 값을 모듈로 기능 수를 직접 인덱스로 사용하여 작동합니다. 분류기를 구축하기 위한 해싱 트릭의 주된 이유는 무엇입니까?

Databricks-Certified-Professional-Data-Scientist 문제 23

아래 문제를 풀기 위해 어떤 기술을 사용하시겠습니까? "개인 고객이 대출금을 상환하지 않을 확률은 얼마입니까?"

Databricks-Certified-Professional-Data-Scientist 문제 24

RMSE는 정확도를 측정하는 좋은 방법이지만 규모에 따라 달라지므로 ______에 대한 여러 모델의 예측 오류를 비교하기 위한 용도로만 사용됩니다.

Databricks-Certified-Professional-Data-Scientist 문제 25

고객 데이터 세트의 클러스터링 솔루션으로 작업하고 있습니다. 각 고객에 대해 거의 40개의 변수를 사용할 수 있으며 거의 ​​100,000개의 고객 데이터를 사용할 수 있습니다. 클러스터링을 위한 변수의 수를 줄이려면 어떻게 하시겠습니까?