Professional-Data-Engineer 문제 76
회사에서 WILDCARD 테이블을 사용하여 유사한 이름을 가진 여러 테이블에서 데이터를 쿼리하고 있습니다. SQL 문이 현재 다음 오류와 함께 실패하고 있습니다.
# 구문 오류: 명령문의 끝이 예상되지만 [4:11]에 "-"가 표시됨
나이 선택
에서
bigquery-public-data.noaa_gsod.gsod
어디
나이 != 99
AND_TABLE_SUFFIX = '1929'
주문
나이 DESC
SQL 문이 올바르게 작동하도록 하는 테이블 이름은 무엇입니까?
# 구문 오류: 명령문의 끝이 예상되지만 [4:11]에 "-"가 표시됨
나이 선택
에서
bigquery-public-data.noaa_gsod.gsod
어디
나이 != 99
AND_TABLE_SUFFIX = '1929'
주문
나이 DESC
SQL 문이 올바르게 작동하도록 하는 테이블 이름은 무엇입니까?
Professional-Data-Engineer 문제 77
최근 가격 이력을 기반으로 특정 주식의 가격을 예측하는 기계 학습 모델을 만들고 싶다면 어떤 유형의 추정기를 사용해야 할까요?
Professional-Data-Engineer 문제 78
귀하의 회사는 매시간 20,000개의 파일을 생성합니다. 각 데이터 파일은 4KB 미만인 CSV(쉼표로 구분된 값) 파일로 형식이 지정됩니다. 모든 파일은 처리되기 전에 Google Cloud Platform에서 수집되어야 합니다. 회사 사이트의 GCP 지연 시간은 200ms이며 인터넷 연결 대역폭은 50Mbps로 제한됩니다. 현재 데이터 수집 지점으로 Google Compute Engine의 가상 머신에 보안 FTP(SFTP) 서버를 배포하고 있습니다. 로컬 SFTP 클라이언트는 CSV 파일을 있는 그대로 전송하기 위해 전용 시스템에서 실행됩니다. 목표는 전날의 데이터가 포함된 보고서를 경영진이 사용할 수 있도록 하는 것입니다.
매일 오전 10시. 이 디자인은 대역폭 활용이 다소 낮음에도 불구하고 현재 볼륨을 간신히 따라갈 수 있습니다.
회사에서는 계절성으로 인해 향후 3개월 동안 파일 수가 두 배로 증가할 것으로 예상한다고 들었습니다. 어떤 두 가지 조치를 취해야 합니까? (두 가지를 선택하십시오.)
매일 오전 10시. 이 디자인은 대역폭 활용이 다소 낮음에도 불구하고 현재 볼륨을 간신히 따라갈 수 있습니다.
회사에서는 계절성으로 인해 향후 3개월 동안 파일 수가 두 배로 증가할 것으로 예상한다고 들었습니다. 어떤 두 가지 조치를 취해야 합니까? (두 가지를 선택하십시오.)
Professional-Data-Engineer 문제 79
귀사는 많은 수의 뉴런과 레이어가 있는 TensorFlow 중립 네트워크 모델을 구축했습니다. 모델은 훈련 데이터에 잘 맞습니다. 그러나 새 데이터에 대해 테스트할 때 성능이 좋지 않습니다. 이 문제를 해결하기 위해 어떤 방법을 사용할 수 있습니까?
Professional-Data-Engineer 문제 80
개인 사용자 데이터와 관련된 민감한 프로젝트를 진행 중입니다. Google Cloud Platform에 프로젝트를 설정하여 작업을 내부에 보관했습니다. 외부 컨설턴트가 프로젝트의 Google Cloud Dataflow 파이프라인에서 복잡한 변환을 코딩하는 데 도움을 줄 것입니다. 사용자의 개인 정보를 어떻게 유지해야 합니까?
