Databricks-Certified-Professional-Data-Scientist 문제 46
RMSE는 정확도를 측정하는 좋은 방법이지만 규모에 따라 달라지므로 ______에 대한 여러 모델의 예측 오류를 비교하기 위한 용도로만 사용됩니다.
Databricks-Certified-Professional-Data-Scientist 문제 47
전시 참조

전시에서 x축은 차용인이 대출을 불이행할 확률을 나타냅니다. 또한 전시에서 분홍색은 채무 불이행이 아닌 것으로 알려진 차용인을 나타내고 파란색은 채무 불이행으로 알려진 차용인을 나타냅니다. 이 전시회를 구축하는 데 필요한 확률을 생성할 수 있는 분석 방법은 무엇입니까?

전시에서 x축은 차용인이 대출을 불이행할 확률을 나타냅니다. 또한 전시에서 분홍색은 채무 불이행이 아닌 것으로 알려진 차용인을 나타내고 파란색은 채무 불이행으로 알려진 차용인을 나타냅니다. 이 전시회를 구축하는 데 필요한 확률을 생성할 수 있는 분석 방법은 무엇입니까?
Databricks-Certified-Professional-Data-Scientist 문제 48
특정 식료품점에서 구매하는 10,000명의 데이터가 있습니다. 또한 데이터에 소득 세부 정보가 있습니다. 이 데이터를 사용하여 5개의 클러스터를 만들었습니다. 그러나 클러스터 중 하나에서는 30명만 30, 2400, 2600, 2700, 2270 등으로 떨어지는 것을 볼 수 있습니다." 이 경우 어떻게 하시겠습니까?
