Professional-Data-Engineer 문제 221
매일 수십만 개의 소셜 미디어 게시물을 가장 낮은 비용과 가장 적은 단계로 분석하고 싶습니다.
다음과 같은 요구 사항을 충족합니다.
* 하루에 한 번씩 게시물을 일괄 로드하여 Cloud Natural Language API를 통해 실행합니다.
* 게시물에서 주제와 감정을 추출합니다.
* 보관 및 재처리를 위해 원시 게시물을 저장해야 합니다.
* 조직 내부 및 외부의 사람들과 공유할 수 있는 대시보드를 만듭니다.
분석을 수행하기 위해 API에서 추출한 데이터와 과거 보관을 위한 원시 소셜 미디어 게시물을 모두 저장해야 합니다. 어떻게 해야 할까요?
다음과 같은 요구 사항을 충족합니다.
* 하루에 한 번씩 게시물을 일괄 로드하여 Cloud Natural Language API를 통해 실행합니다.
* 게시물에서 주제와 감정을 추출합니다.
* 보관 및 재처리를 위해 원시 게시물을 저장해야 합니다.
* 조직 내부 및 외부의 사람들과 공유할 수 있는 대시보드를 만듭니다.
분석을 수행하기 위해 API에서 추출한 데이터와 과거 보관을 위한 원시 소셜 미디어 게시물을 모두 저장해야 합니다. 어떻게 해야 할까요?
Professional-Data-Engineer 문제 222
특정 기준이 충족되는 경우 창의 내용을 출력해야 하는 시점을 결정하는 데이터 흐름 개념은 무엇입니까?
Professional-Data-Engineer 문제 223
귀하의 날씨 앱은 15분마다 데이터베이스를 쿼리하여 현재 온도를 얻습니다. 프런트엔드는 Google App Engine에서 구동되며 수백만 명의 사용자를 처리합니다. 데이터베이스 오류에 대응하기 위해 프런트엔드를 어떻게 설계해야 할까요?
Professional-Data-Engineer 문제 224
BigQuery를 중앙 분석 플랫폼으로 사용합니다. 매일 새로운 데이터가 로드되고 ETL 파이프라인이 원본 데이터를 수정하여 최종 사용자를 위해 준비합니다. 이 ETL 파이프라인은 정기적으로 수정되고 오류가 발생할 수 있지만 때로는 2주 후에야 오류가 감지됩니다. 이러한 오류에서 복구할 방법을 제공해야 하며 백업은 저장 비용에 맞게 최적화되어야 합니다. BigQuery에서 데이터를 어떻게 구성하고 백업을 저장해야 합니까?
Professional-Data-Engineer 문제 225
어떤 행 키가 Bigtable 클러스터의 특정 노드에서 읽기 및/또는 쓰기를 불균형적으로 많이 발생시킬 가능성이 있습니까?(답변 2개 선택)
