Professional-Data-Engineer 문제 226

자연어 처리 도메인에서 회귀 문제를 다루고 있으며 데이터 세트에 레이블이 지정된 예제가 1억 개 있습니다. 데이터를 무작위로 섞고 데이터 세트를 학습 및 테스트 샘플로 분할했습니다(90/10 비율). 신경망을 학습하고 테스트 세트에서 모델을 평가한 후 모델의 평균 제곱근 오차(RMSE)가 테스트 세트보다 학습 세트에서 두 배 더 높다는 것을 발견했습니다. 모델 성능을 어떻게 개선해야 할까요?

Professional-Data-Engineer 문제 227

Google Cloud Bigtable 인스턴스에서 SSD와 HDD 스토리지를 전환하기 위해 권장되는 작업은 무엇입니까?

Professional-Data-Engineer 문제 228

특정 기준이 충족되는 경우 창의 내용을 출력해야 하는 시점을 결정하는 데이터 흐름 개념은 무엇입니까?

Professional-Data-Engineer 문제 229

Google Cloud Platform에서 실행되는 POS 애플리케이션에서 결제 거래를 처리하려고 합니다. 사용자 기반은 기하급수적으로 증가할 수 있지만 인프라 확장을 관리하고 싶지 않습니다.
어떤 Google 데이터베이스 서비스를 사용해야 합니까?

Professional-Data-Engineer 문제 230

Google의 Dataflow SDK를 사용하여 소프트웨어 애플리케이션을 개발하고 있으며 조건부, for 루프 및 기타 복잡한 프로그래밍 구조를 사용하여 분기 파이프라인을 만들고 싶습니다. 데이터 처리 작업에 어떤 구성 요소를 사용할까요?