DP-100 문제 251

Azure Machine Learning Studio에서 실험을 만듭니다. 10,000개의 행이 포함된 훈련 데이터 세트를 추가합니다. 처음 9,000개의 행은 클래스 0(90%)을 나타냅니다.
나머지 1,000개 행은 클래스 1(10%)을 나타냅니다.
훈련 세트는 두 클래스 간의 불균형입니다. 5개의 데이터 행을 사용하여 클래스 1에 대한 학습 예제의 수를 4,000개로 늘려야 합니다. 실험에 SMOTE(Synthetic Minority Oversampling Technique) 모듈을 추가합니다.
모듈을 구성해야 합니다.
어떤 값을 사용해야 합니까? 응답하려면 응답 영역의 대화 상자에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-100 문제 252

10,000개의 데이터 포인트와 150개의 기능이 있는 정규화된 숫자 기능 세트를 포함하는 다중 클래스 분류 작업을 위해 생성된 데이터 세트가 있습니다.
데이터 포인트의 75%를 교육에 사용하고 25%를 테스트에 사용합니다. Python에서 scikit-learn 기계 학습 라이브러리를 사용하고 있습니다. X를 사용하여 기능 세트를 나타내고 Y를 사용하여 클래스 레이블을 나타냅니다.
다음 Python 데이터 프레임을 만듭니다.

학습 세트와 테스트 세트 모두에서 기능 세트의 차원을 10개 기능으로 줄이려면 PCA(주성분 분석) 방법을 적용해야 합니다.
코드 세그먼트를 어떻게 완성해야 합니까? 응답하려면 응답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-100 문제 253

참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 둘 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
scripts라는 로컬 폴더에 train.py라는 Python 스크립트가 있습니다. 스크립트는 scikit-learn을 사용하여 회귀 모델을 훈련합니다. 스크립트에는 scripts 폴더에도 있는 교육 데이터 파일을 로드하는 코드가 포함되어 있습니다.
aml-compute라는 컴퓨팅 클러스터에서 Azure ML 실험으로 스크립트를 실행해야 합니다.
환경에 모델 교육에 필요한 패키지가 포함되도록 실행을 구성해야 합니다. 대상 컴퓨팅 클러스터를 참조하는 aml-compute라는 변수를 인스턴스화했습니다.
솔루션: 다음 코드를 실행합니다.

솔루션이 목표를 충족합니까?

DP-100 문제 254

정리가 필요한 원시 데이터 세트를 분석하고 있습니다.
Azure Machine Learning Studio를 사용하여 변환 및 조작을 수행해야 합니다.
변환을 수행하려면 올바른 모듈을 식별해야 합니다.
어떤 모듈을 선택해야 합니까? 대답하려면 적절한 모듈을 올바른 시나리오로 끌어다 놓습니다. 각 모듈은 한 번, 두 번 이상 또는 전혀 사용되지 않을 수 있습니다.
콘텐츠를 보려면 창 사이의 분할 막대를 드래그하거나 스크롤해야 할 수 있습니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

DP-100 문제 255

통계 분포에서 비대칭을 분석하고 있습니다.
다음 이미지에는 두 데이터 세트의 확률 분포를 보여주는 두 개의 밀도 곡선이 포함되어 있습니다.

드롭다운 메뉴를 사용하여 그래픽에 표시된 정보를 기반으로 각 질문에 대한 답변을 선택합니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.