D-DS-FN-23 문제 51

귀사는 회사의 고객 이탈을 예측하기 위해 로지스틱 회귀 모델을 만들었습니다. 회사의 마케팅 부서는 귀사의 모델을 사용하여 위험 고객을 파악하고 이탈을 막기 위한 인센티브를 제공하고자 합니다.

모델에 두 개의 서로 다른 임계값을 사용하면 그래픽에 표시된 두 개의 혼동 행렬이 제공됩니다.
마케팅은 위험에 처한 고객을 놓치는 것과 위험에 처하지 않은 고객에게 인센티브를 제공하는 것의 상대적 비용을 이해합니다. 따라서 이탈 모델에 적절한 임계값을 설정하는 방법에 대한 조언이 필요합니다.
마케팅 팀과 회의를 합니다. 회의에서 "임계값을 0.5에서 0.75로 높이면 불필요한 인센티브 제공 횟수가 줄어들지만, 이탈한 고객을 더 많이 놓치게 됩니다."라고 말할 계획입니다. 이 진술을 강화하는 데 가장 적합한 시각적 표현은 무엇입니까?

D-DS-FN-23 문제 52

데이터 과학자가 프로젝트에 가장 많은 시간을 할애하는 단계는 데이터 분석 라이프사이클의 어느 단계입니까?

D-DS-FN-23 문제 53

Hadoop과 함께 사용할 수 있는 쿼리 언어를 지원하는 두 가지 도구는 무엇입니까?

D-DS-FN-23 문제 54

4개의 거래가 있는 데이터베이스를 생각해 보세요.
거래 1: {치즈, 빵, 우유}
거래 2: {소다, 빵, 우유}
거래 3: {치즈, 빵}
거래 4: {치즈, 소다, 주스}
최소 지지율은 25%입니다.
어느 규칙의 신뢰도가 50%입니까?

D-DS-FN-23 문제 55

비즈니스 질문과 사용 가능한 데이터 세트에 대한 설명 외에 분석 계획에는 무엇이 더 포함됩니까?