NCP-ADS 문제 1

NVIDIA 기술을 사용하여 MLOps 배포 시 필요한 메모리와 GPU에서 사용 가능한 메모리를 비교할 때, 대규모 모델 학습 중 메모리 사용량을 최적화하는 가장 좋은 방법은 다음 중 무엇입니까?

NCP-ADS 문제 2

당신은 방대한 데이터셋을 처리해야 하는 데이터 과학 프로젝트를 진행하고 있습니다.
5억 개의 레코드가 있습니다. GPU 가속이 성능을 크게 향상시킬 수 있는지 여부를 확인하고 싶습니다.
다음 중 어떤 요소가 RAPIDS와 같은 가속 컴퓨팅 솔루션을 사용해야 함을 가장 잘 나타냅니까?

NCP-ADS 문제 3

당신은 클라우드 환경에서 딥러닝 모델을 위한 대규모 데이터셋을 다루고 있습니다. 이 데이터셋은 수치 값, 범주형 데이터, 타임스탬프 등 여러 특징으로 구성되어 있습니다.
각 특징에 대한 최적의 데이터 유형을 결정할 때 GPU 및 클라우드 리소스를 가장 효율적으로 사용하는 방법은 다음 중 어느 것입니까? (세 가지를 선택하십시오)

NCP-ADS 문제 4

당신은 연산 속도를 높이기 위해 여러 개의 GPU를 사용하여 대규모 데이터 세트를 처리하는 임무를 맡았습니다. GPU 활용도를 극대화하기 위해 NVIDIA의 RAPIDS 프레임워크와 함께 Dask를 사용하여 데이터 병렬 처리를 구현하기로 결정했습니다.
Dask에서 여러 GPU에 작업 부하를 효율적으로 분산하기 위해 다음 단계 중 필수적인 단계는 무엇입니까?

NCP-ADS 문제 5

데이터 엔지니어는 Apache Parquet 형식으로 저장된 5TB 규모의 데이터셋을 처리해야 합니다. 이 데이터셋은 사용자 활동 로그로 구성되어 있으며, 머신러닝 모델 학습 전에 필터링, 집계 및 특징 추출 과정을 거쳐야 합니다. 엔지니어는 Dask와 Apache Spark 중에서 어떤 도구를 사용할지 고민하고 있습니다.
다음 중 두 프레임워크의 주요 차이점을 가장 잘 설명하는 문장은 무엇입니까?