Professional-Data-Engineer 문제 221

YARN ResourceManager 및 HDFS NameNode 인터페이스는 Cloud Dataproc 클러스터에서 사용할 수 있습니다.
____.

Professional-Data-Engineer 문제 222

Cloud Bigtable은 Google의 ______ 빅데이터 데이터베이스 서비스입니다.

Professional-Data-Engineer 문제 223

다음 중 특성 엔지니어링 기술은 무엇입니까? (답변 2개 선택)

Professional-Data-Engineer 문제 224

귀하의 회사는 매시간 20,000개의 파일을 생성합니다. 각 데이터 파일은 4KB 미만의 CSV(쉼표로 구분된 값) 파일 형식으로 지정됩니다. 모든 파일은 처리되기 전에 Google Cloud Platform에서 수집되어야 합니다. 회사 사이트의 Google Cloud 지연 시간은 200ms이고 인터넷 연결 대역폭은 50Mbps로 제한됩니다. 현재 데이터 수집 지점으로 Google Compute Engine의 가상 머신에 보안 FTP(SFTP) 서버를 배포하고 있습니다. 로컬 SFTP 클라이언트는 전용 시스템에서 실행되어 CSV 파일을 있는 그대로 전송합니다. 목표는 전날의 데이터가 포함된 보고서를 다음과 같이 경영진에게 제공하는 것입니다.
매일 오전 10시. 이 디자인은 대역폭 활용도가 다소 낮음에도 불구하고 현재 볼륨을 거의 따라잡을 수 없습니다.
계절적 요인으로 인해 회사에서는 향후 3개월 동안 파일 수가 두 배로 늘어날 것으로 예상한다는 말을 들었습니다. 어떤 두 가지 조치를 취해야 합니까? (2개를 선택하세요.)

Professional-Data-Engineer 문제 225

Dataflow 프로그램을 로컬에서 실행하는 데 사용할 수 있는 자바 SDK 클래스는 무엇인가요?