Databricks-Certified-Professional-Data-Scientist 문제 46

당신은 게임 회사에서 데이터 과학 컨설턴트로 일하고 있습니다. 3명의 멤버 팀이 있고 다른 모든 이해 관계자는 프로젝트 관리자 및 프로젝트 후원, 데이터 팀 등과 같은 회사 자체에서 왔습니다.
토론 중에 관리되는 프로젝트는 사용 중인 모델이 충분히 강력하다고 언제 말할 수 있는지 물었습니다. 어느 단계 후에 이 질문에 대한 답변을 고려할 수 있습니까?

Databricks-Certified-Professional-Data-Scientist 문제 47

특정 식료품점에서 구매하는 10,000명의 데이터가 있습니다. 또한 데이터에 소득 세부 정보가 있습니다. 이 데이터를 사용하여 5개의 클러스터를 만들었습니다. 그러나 클러스터 중 하나에서는 30명만 30, 2400, 2600, 2700, 2270 등으로 떨어지는 것을 볼 수 있습니다." 이 경우 어떻게 하시겠습니까?

Databricks-Certified-Professional-Data-Scientist 문제 48

다음 중 주성분 분석을 가장 잘 설명한 것은?

Databricks-Certified-Professional-Data-Scientist 문제 49

전시 참조

고객이 제공한 데이터 세트를 사용하여 특정 변수가 고객의 판매에 미치는 영향에 대한 보고서를 작성하라는 요청을 받았습니다. 데이터에는 고객이 판매와 직접 관련이 있다고 보는 15개의 변수가 포함되어 있으며 이러한 변수로만 제한됩니다. 1. 사전 데이터 분석을 통해 다음과 같은 결과를 얻었다.
변수 2에서는 다중 공선성이 문제가 되지 않습니다. A, B, C의 세 가지 변수만 매출과 유의한 상관 관계가 있습니다. 독립 변수 A, B, C를 사용하여 매출의 종속 변수에 선형 회귀 모델을 만듭니다.
회귀 결과는 전시회에서 볼 수 있습니다. 추가 데이터를 요청할 수 없습니다. 인위적으로 부풀리지 않고 모델의 R2를 증가시킬 수 있는 방법은 무엇입니까?