Professional-Data-Engineer 문제 231
각각 인간의 얼굴이 포함되어 있는지 여부에 대한 레이블이 지정된 이미지 데이터 세트가 있다고 가정해 보겠습니다. 이 레이블이 지정된 데이터 세트를 사용하여 이미지에서 인간의 얼굴을 인식하는 신경망을 만들려면 어떤 접근 방식이 가장 효과적일까요?
Professional-Data-Engineer 문제 232
BigQuery에서 실행하기 위해 ETL 작업을 마이그레이션한 후 마이그레이션된 작업의 출력이 원본의 출력과 동일한지 확인해야 합니다. 원본 작업의 출력이 포함된 테이블을 로드했고 마이그레이션된 작업의 출력과 내용을 비교하여 동일함을 보여주고자 합니다. 테이블에는 비교를 위해 함께 조인할 수 있는 기본 키 열이 없습니다.
어떻게 해야 할까요?
어떻게 해야 할까요?
Professional-Data-Engineer 문제 233
timestamp 및 ID 열에 WHERE 절을 사용하여 BigQuery 테이블을 필터링하는 쿼리가 있습니다. bq query - -dry_run을 사용하면 timestamp 및 ID에 대한 필터가 전체 데이터의 아주 작은 부분만 선택하더라도 쿼리가 테이블의 전체 스캔을 트리거한다는 것을 알 수 있습니다. 기존 SQL 쿼리를 최소한으로 변경하여 BigQuery에서 스캔하는 데이터 양을 줄이려고 합니다. 어떻게 해야 할까요?
Professional-Data-Engineer 문제 234
Google Cloud에서 10TB 데이터베이스의 일부인 두 개의 관계형 테이블에 대한 저장소를 설계하고 있습니다. 수평적으로 확장되는 트랜잭션을 지원하려고 합니다. 또한 키가 아닌 열에 대한 범위 쿼리에 대한 데이터를 최적화하려고 합니다. 무엇을 해야 할까요?
Professional-Data-Engineer 문제 235
50,000개 센서의 분 단위 해상도 데이터를 BigQuery 테이블에 삽입해야 합니다. 데이터 볼륨이 크게 증가할 것으로 예상되며, 집계된 추세의 실시간 분석을 위해 수집 후 1분 이내에 데이터를 사용할 수 있어야 합니다. 어떻게 해야 할까요?
