Professional-Data-Engineer 문제 106
MJTelco 사례 연구
회사 개요
MJTelco는 전 세계에서 빠르게 성장하고 서비스가 부족한 시장에 네트워크를 구축할 계획인 신생 기업입니다.
이 회사는 혁신적인 광통신 하드웨어에 대한 특허를 보유하고 있습니다. 이러한 특허를 기반으로 저렴한 하드웨어로 안정적인 고속 백본 링크를 많이 만들 수 있습니다.
회사 배경
경험이 풍부한 통신 경영진이 설립한 MJTelco는 원래 우주에서 통신 문제를 극복하기 위해 개발된 기술을 사용합니다. 운영의 기본은 실시간 분석을 주도하고 기계 학습을 통합하여 토폴로지를 지속적으로 최적화하는 분산 데이터 인프라를 구축해야 합니다. 하드웨어가 저렴하기 때문에 위치 가용성 및 비용에 대한 역동적인 지역 정치의 영향을 설명할 수 있도록 네트워크를 과도하게 배포할 계획입니다.
그들의 관리 및 운영 팀은 데이터 소비자 사이의 다 대 다 관계를 생성하고 시스템에서 제공하는 전 세계에 위치하고 있습니다. 신중한 고려 끝에 그들은 퍼블릭 클라우드가 그들의 요구를 지원하는 완벽한 환경이라고 결정했습니다.
솔루션 개념
MJTelco는 자체 연구실에서 성공적인 개념 증명(PoC) 프로젝트를 실행하고 있습니다. 그들은 두 가지 기본 요구 사항이 있습니다.
* PoC를 확장하고 강화하여 50,000개 이상의 설치로 진입할 때 생성되는 훨씬 더 많은 데이터 흐름을 지원합니다.
* 기계 학습 주기를 조정하여 토폴로지 정의를 제어하는 데 사용하는 동적 모델을 확인하고 개선합니다.
MJTelco는 또한 개발/테스트, 스테이징 및 프로덕션의 세 가지 개별 운영 환경을 사용하여 실험 실행, 새로운 기능 배포 및 프로덕션 고객 서비스 요구를 충족할 것입니다.
비즈니스 요구 사항
* 최소한의 비용으로 프로덕션 환경을 확장하고 예측할 수 없는 분산 통신 사용자 커뮤니티에서 필요할 때 언제 어디서나 리소스를 인스턴스화합니다.
* 최첨단 기계 학습 및 분석을 보호하기 위해 독점 데이터의 보안을 보장합니다.
* 분산된 연구 작업자의 분석을 위해 데이터에 대한 안정적이고 시기 적절한 액세스 제공
* 고객에게 영향을 주지 않고 기계 학습 모델의 신속한 반복을 지원하는 격리된 환경을 유지합니다.
기술 요구 사항
* 원격 측정 데이터의 안전하고 효율적인 전송 및 저장 보장* 인스턴스를 빠르게 확장하여 각각 여러 흐름이 있는
10,000~10,000개의 데이터 공급자를 지원합니다 .
* 약 2년 동안 저장된 데이터를 추적하는 데이터 테이블에 대한 분석 및 프레젠테이션 허용
100m 레코드/일
* 원격 측정 흐름과 프로덕션 학습 주기 모두에서 데이터 파이프라인 문제 인식에 초점을 맞춘 모니터링 인프라의 신속한 반복을 지원합니다.
CEO 성명서
우리의 비즈니스 모델은 특허, 분석 및 동적 기계 학습에 의존합니다. 우리의 저렴한 하드웨어는 매우 안정적으로 구성되어 비용상의 이점을 제공합니다. 안정성 및 용량 약속을 충족하려면 대규모 분산 데이터 파이프라인을 신속하게 안정화해야 합니다.
CTO 선언문
우리의 퍼블릭 클라우드 서비스는 광고된 대로 작동해야 합니다. 데이터를 확장하고 안전하게 유지하는 리소스가 필요합니다. 또한 데이터 과학자가 모델을 신중하게 연구하고 신속하게 조정할 수 있는 환경도 필요합니다. 우리는 데이터를 처리하기 위해 자동화에 의존하기 때문에 반복하면서 작동할 개발 및 테스트 환경도 필요합니다.
CFO 선언문
데이터 및 분석에 필요한 하드웨어와 소프트웨어를 유지 관리하기에는 프로젝트가 너무 큽니다. 또한 많은 데이터 피드를 모니터링하기 위해 운영 팀에 인력을 배치할 여력이 없으므로 자동화 및 인프라에 의존할 것입니다. Google Cloud의 기계 학습을 통해 정량적 연구원은 데이터 파이프라인 문제가 아니라 가치가 높은 문제를 해결할 수 있습니다.
Google Data Studio 360에서 대규모 팀을 위한 새 보고서를 만듭니다. 이 보고서는 Google BigQuery를 데이터 소스로 사용합니다. 직원이 자신의 지역과 관련된 데이터만 볼 수 있도록 하는 것이 회사 정책이므로 각 지역에 대한 테이블을 만들고 채웁니다. 데이터에 대한 지역 액세스 정책을 적용해야 합니다.
어떤 두 가지 조치를 취해야 합니까? (두 가지를 선택하세요.)
회사 개요
MJTelco는 전 세계에서 빠르게 성장하고 서비스가 부족한 시장에 네트워크를 구축할 계획인 신생 기업입니다.
이 회사는 혁신적인 광통신 하드웨어에 대한 특허를 보유하고 있습니다. 이러한 특허를 기반으로 저렴한 하드웨어로 안정적인 고속 백본 링크를 많이 만들 수 있습니다.
회사 배경
경험이 풍부한 통신 경영진이 설립한 MJTelco는 원래 우주에서 통신 문제를 극복하기 위해 개발된 기술을 사용합니다. 운영의 기본은 실시간 분석을 주도하고 기계 학습을 통합하여 토폴로지를 지속적으로 최적화하는 분산 데이터 인프라를 구축해야 합니다. 하드웨어가 저렴하기 때문에 위치 가용성 및 비용에 대한 역동적인 지역 정치의 영향을 설명할 수 있도록 네트워크를 과도하게 배포할 계획입니다.
그들의 관리 및 운영 팀은 데이터 소비자 사이의 다 대 다 관계를 생성하고 시스템에서 제공하는 전 세계에 위치하고 있습니다. 신중한 고려 끝에 그들은 퍼블릭 클라우드가 그들의 요구를 지원하는 완벽한 환경이라고 결정했습니다.
솔루션 개념
MJTelco는 자체 연구실에서 성공적인 개념 증명(PoC) 프로젝트를 실행하고 있습니다. 그들은 두 가지 기본 요구 사항이 있습니다.
* PoC를 확장하고 강화하여 50,000개 이상의 설치로 진입할 때 생성되는 훨씬 더 많은 데이터 흐름을 지원합니다.
* 기계 학습 주기를 조정하여 토폴로지 정의를 제어하는 데 사용하는 동적 모델을 확인하고 개선합니다.
MJTelco는 또한 개발/테스트, 스테이징 및 프로덕션의 세 가지 개별 운영 환경을 사용하여 실험 실행, 새로운 기능 배포 및 프로덕션 고객 서비스 요구를 충족할 것입니다.
비즈니스 요구 사항
* 최소한의 비용으로 프로덕션 환경을 확장하고 예측할 수 없는 분산 통신 사용자 커뮤니티에서 필요할 때 언제 어디서나 리소스를 인스턴스화합니다.
* 최첨단 기계 학습 및 분석을 보호하기 위해 독점 데이터의 보안을 보장합니다.
* 분산된 연구 작업자의 분석을 위해 데이터에 대한 안정적이고 시기 적절한 액세스 제공
* 고객에게 영향을 주지 않고 기계 학습 모델의 신속한 반복을 지원하는 격리된 환경을 유지합니다.
기술 요구 사항
* 원격 측정 데이터의 안전하고 효율적인 전송 및 저장 보장* 인스턴스를 빠르게 확장하여 각각 여러 흐름이 있는
10,000~10,000개의 데이터 공급자를 지원합니다 .
* 약 2년 동안 저장된 데이터를 추적하는 데이터 테이블에 대한 분석 및 프레젠테이션 허용
100m 레코드/일
* 원격 측정 흐름과 프로덕션 학습 주기 모두에서 데이터 파이프라인 문제 인식에 초점을 맞춘 모니터링 인프라의 신속한 반복을 지원합니다.
CEO 성명서
우리의 비즈니스 모델은 특허, 분석 및 동적 기계 학습에 의존합니다. 우리의 저렴한 하드웨어는 매우 안정적으로 구성되어 비용상의 이점을 제공합니다. 안정성 및 용량 약속을 충족하려면 대규모 분산 데이터 파이프라인을 신속하게 안정화해야 합니다.
CTO 선언문
우리의 퍼블릭 클라우드 서비스는 광고된 대로 작동해야 합니다. 데이터를 확장하고 안전하게 유지하는 리소스가 필요합니다. 또한 데이터 과학자가 모델을 신중하게 연구하고 신속하게 조정할 수 있는 환경도 필요합니다. 우리는 데이터를 처리하기 위해 자동화에 의존하기 때문에 반복하면서 작동할 개발 및 테스트 환경도 필요합니다.
CFO 선언문
데이터 및 분석에 필요한 하드웨어와 소프트웨어를 유지 관리하기에는 프로젝트가 너무 큽니다. 또한 많은 데이터 피드를 모니터링하기 위해 운영 팀에 인력을 배치할 여력이 없으므로 자동화 및 인프라에 의존할 것입니다. Google Cloud의 기계 학습을 통해 정량적 연구원은 데이터 파이프라인 문제가 아니라 가치가 높은 문제를 해결할 수 있습니다.
Google Data Studio 360에서 대규모 팀을 위한 새 보고서를 만듭니다. 이 보고서는 Google BigQuery를 데이터 소스로 사용합니다. 직원이 자신의 지역과 관련된 데이터만 볼 수 있도록 하는 것이 회사 정책이므로 각 지역에 대한 테이블을 만들고 채웁니다. 데이터에 대한 지역 액세스 정책을 적용해야 합니다.
어떤 두 가지 조치를 취해야 합니까? (두 가지를 선택하세요.)
Professional-Data-Engineer 문제 107
다음 중 BigQuery로 데이터를 로드할 수 없는 소스는 무엇인가요?
Professional-Data-Engineer 문제 108
회사에서 쉼표로 구분된 값(CSV) 파일을 Google BigQuery에 로드하고 있습니다. 데이터를 성공적으로 완전히 가져왔습니다. 그러나 가져온 데이터는 소스 파일과 바이트 단위로 일치하지 않습니다.
이 문제의 가장 가능성 있는 원인은 무엇입니까?
이 문제의 가장 가능성 있는 원인은 무엇입니까?
Professional-Data-Engineer 문제 109
Google Cloud에서 실행되는 다단계 데이터 파이프라인의 실행을 자동화하려고 합니다. 파이프라인에는 서로 여러 종속성이 있는 Cloud Dataproc 및 Cloud Dataflow 작업이 포함됩니다. 가능한 경우 관리형 서비스를 사용하려고 하며 파이프라인은 매일 실행됩니다. 어떤 도구를 사용해야 합니까?
Professional-Data-Engineer 문제 110
실시간 애플리케이션에 Bigtable을 사용하고 있으며 읽기와 쓰기가 혼합된 로드가 많습니다.
최근 추가 사용 사례를 확인했으며 전체 데이터베이스에서 특정 통계를 계산하기 위해 매시간 분석 작업을 수행해야 합니다. 프로덕션 애플리케이션의 안정성과 분석 워크로드를 모두 보장해야 합니다.
어떻게 해야 합니까?
최근 추가 사용 사례를 확인했으며 전체 데이터베이스에서 특정 통계를 계산하기 위해 매시간 분석 작업을 수행해야 합니다. 프로덕션 애플리케이션의 안정성과 분석 워크로드를 모두 보장해야 합니다.
어떻게 해야 합니까?
