NCP-ADS 문제 21

머신러닝 팀은 분산 스토리지 시스템에 저장된 테라바이트 규모의 이미지 메타데이터를 처리해야 합니다. 이들은 GPU 가속을 활용하여 전처리 및 변환 속도를 높이는 동시에 효율적인 병렬 접근을 보장하고자 합니다.
다음 중 NVIDIA의 가속 데이터 과학 생태계와 가장 잘 부합하는 접근 방식은 무엇입니까?

NCP-ADS 문제 22

데이터 과학자가 수백만 건의 제품 리뷰가 포함된 데이터 세트에 대한 탐색적 데이터 분석(EDA)의 일환으로 NVIDIA RAPIDS를 사용하여 통계 분석을 수행하고 있습니다. 평균, 중앙값, 분산과 같은 기본적인 기술 통계량을 효율적으로 계산해야 합니다.
다음 방법 중 GPU에서 이러한 계산을 수행하는 데 가장 적합한 방법은 무엇입니까?

NCP-ADS 문제 23

클라우드 기반 GPU를 사용하여 Parquet 형식으로 저장된 대규모 데이터 세트(테라바이트 규모)를 처리하고 있습니다. 데이터 세트의 한 열은 고유 식별자(예: 제품 ID)를 나타내며, 1부터 100,000까지의 양의 정수만 포함합니다.
다음 데이터 유형 중 메모리 효율성과 성능 면에서 가장 균형이 잘 잡힌 것은 무엇입니까?

NCP-ADS 문제 24

데이터 과학자가 NVIDIA 지원 시스템에서 여러 GPU를 사용하여 대규모 데이터 세트를 처리하려고 합니다. 이를 위해 병렬 처리를 가능하게 하는 Dask를 사용하기로 결정했습니다.
Dask를 활용하여 멀티 GPU 확장을 구현하는 데 있어 다음 단계 중 가장 필수적인 것은 무엇입니까?

NCP-ADS 문제 25

수백만 개의 레코드가 포함된 데이터 세트에 대한 학습 및 추론 측면에서 NVIDIA RAPIDS cuML, TensorFlow 및 PyTorch의 성능을 비교하고 있습니다.
공정하고 효과적인 기준을 설계하려면 어떤 접근 방식을 취해야 할까요?