AIP-210 문제 36
종속 변수를 분류하는 데 사용하는 여러 특성이 포함된 데이터 세트가 있습니다. 표본 크기가 작아 과적합이 우려됩니다. 과적합을 방지하는 데 가장 적합한 알고리즘은 무엇입니까?
AIP-210 문제 37
머신 러닝 파이프라인을 위한 워크플로 설계 패턴:
AIP-210 문제 38
누군가가 특정 유형의 질병을 앓고 있는지 여부를 예측하기 위해 분류기가 구현되었습니다.
데이터 집합에 있는 인구의 1%만이 이 질병을 앓고 있다는 점을 고려할 때, 이 모델을 평가하는 데 가장 효과적인 측정 방법은 무엇일까요?
데이터 집합에 있는 인구의 1%만이 이 질병을 앓고 있다는 점을 고려할 때, 이 모델을 평가하는 데 가장 효과적인 측정 방법은 무엇일까요?
AIP-210 문제 39
종속 변수 데이터는 비율입니다. 데이터의 관측 범위는 0.01에서 0.99입니다. 종속 변수 데이터를 생성하는 데 사용된 도구는 0에 가까우거나 1에 가까운 값에 대해 품질이 낮은 데이터를 생성하는 것으로 알려져 있습니다. 동료가 선형 회귀 분석을 수행하기 전에 데이터에 로짓 변환을 수행해 보라고 제안했습니다. 다음 중 이 접근 방식의 문제점은 무엇입니까?
로짓 변환의 정의
p가 비율인 경우: logit(p)=log(p/(lp))
로짓 변환의 정의
p가 비율인 경우: logit(p)=log(p/(lp))
AIP-210 문제 40
모델 성능을 이해하는 것 외에, 편향과 분산을 지속적으로 모니터링하는 것은 ML 엔지니어가 무엇을 하는 데 도움이 될까요?
