Professional-Data-Engineer 문제 156
사용자에게 테이블의 처음 세 열에 대해서만 읽기 권한을 부여하려면 어떤 액세스 제어 방법을 사용하시겠습니까?
Professional-Data-Engineer 문제 157
귀하는 차량 수요가 높은 지역을 식별하여 수요를 충족하기 위해 이용 가능한 운전자의 경로를 효과적으로 변경하는 차량 호출 앱용 실시간 시스템을 설계하고 있습니다. 시스템은 여러 소스의 데이터를 Pub/Sub로 수집합니다. 데이터를 처리하고 결과를 실시간 대시보드에 시각화 및 분석하기 위해 저장합니다. 데이터 소스에는 5초마다 업데이트되는 운전자 위치 업데이트와 라이더의 앱 기반 예약 이벤트가 포함됩니다. 데이터 처리에는 지난 30초 동안, 매 2초 동안 공급 및 수요 데이터를 실시간으로 집계하고 시각화를 위해 지연 시간이 짧은 시스템에 결과를 저장하는 작업이 포함됩니다. 당신은 무엇을 해야 합니까?
Professional-Data-Engineer 문제 158
흐름학적 사례 연구
회사 개요
Flowlogistic은 선도적인 물류 및 공급망 제공업체입니다. 이들은 전 세계 기업이 자원을 관리하고 최종 목적지까지 운송할 수 있도록 돕습니다. 회사는 빠르게 성장하여 철도, 트럭, 항공기 및 해상 운송을 포함하도록 서비스를 확장했습니다.
회사 배경
이 회사는 지역 트럭 운송 회사로 시작하여 다른 물류 시장으로 확장했습니다. 인프라를 업데이트하지 않았기 때문에 주문과 배송을 관리하고 추적하는 데 병목 현상이 발생했습니다. 운영을 개선하기 위해 Flowlogistic은 소포 수준에서 실시간으로 배송을 추적하는 독점 기술을 개발했습니다. 그러나 Apache Kafka 기반의 기술 스택이 처리량을 지원할 수 없기 때문에 배포할 수 없습니다. 또한 Flowlogistic은 주문과 배송을 추가로 분석하여 리소스를 가장 잘 배포할 수 있는 방법을 결정하려고 합니다.
솔루션 컨셉
Flowlogistic은 클라우드를 사용하여 두 가지 개념을 구현하려고 합니다.
* 적재 위치를 나타내는 실시간 재고 추적 시스템에서 독점 기술을 사용합니다.
* 구조화된 데이터와 구조화되지 않은 데이터가 모두 포함된 모든 주문 및 배송 로그에 대한 분석을 수행하여 리소스를 배치하는 최선의 방법과 정보를 확장할 시장을 결정합니다. 또한 예측 분석을 사용하여 배송이 지연되는 시기를 조기에 파악하고 싶어합니다.
기존 기술 환경
Flowlogistic 아키텍처는 단일 데이터 센터에 상주합니다.
* 데이터베이스
* 2개의 클러스터에 8개의 물리적 서버
* SQL Server - 사용자 데이터, 인벤토리, 정적 데이터
* 물리적 서버 3대
* Cassandra - 메타데이터, 메시지 추적
10개의 Kafka 서버 - 메시지 집계 및 일괄 삽입 추적
* 애플리케이션 서버 - 고객 프론트엔드, 주문/통관을 위한 미들웨어
* 20개의 물리적 서버에 60개의 가상 머신
* Tomcat - 자바 서비스
* Nginx - 정적 콘텐츠
* 배치 서버
저장 장치
* 가상 머신(VM) 호스트용 iSCSI
* 파이버 채널 스토리지 영역 네트워크(FC SAN) - SQL 서버 스토리지
* NAS(Network Attached Storage) 이미지 저장, 로그, 백업
* 10개의 Apache Hadoop/Spark 서버
* 핵심 데이터 레이크
* 데이터 분석 워크로드
* 20개의 기타 서버
* Jenkins, 모니터링, 요새 호스트,
비즈니스 요구 사항
* 대규모 생산 팬티로 안정적이고 재현 가능한 환경을 구축하십시오.
* 분석을 위해 중앙 집중식 데이터 레이크에 데이터 집계
* 과거 데이터를 사용하여 향후 배송에 대한 예측 분석을 수행합니다.
* 독점 기술을 사용하여 전 세계 모든 배송을 정확하게 추적합니다.
* 새로운 리소스의 신속한 제공을 통해 비즈니스 민첩성과 혁신 속도를 향상시킵니다.
* 클라우드 성능을 위한 아키텍처 분석 및 최적화
* 다른 모든 요구 사항이 충족되면 클라우드로 완전히 마이그레이션하세요.
기술 요구 사항
* 스트리밍 및 배치 데이터를 모두 처리
* 기존 Hadoop 워크로드 마이그레이션
* 회사의 변화하는 요구 사항을 충족할 수 있도록 아키텍처가 확장 가능하고 탄력적인지 확인하십시오.
* 가능하면 관리형 서비스를 사용하세요.
* 데이터 비행 및 저장 데이터 암호화
* 프로덕션 데이터 센터와 클라우드 환경 간 VPN 연결 SEO 성명 우리는 너무 빠르게 성장했기 때문에 인프라를 업그레이드할 수 없는 것이 실제로 더 이상의 성장과 효율성을 방해하고 있습니다. 우리는 전 세계로 배송물을 효율적으로 이동하지만 데이터를 이동하는 데는 비효율적입니다.
우리는 고객이 어디에 있는지, 무엇을 배송하는지 더 쉽게 이해할 수 있도록 정보를 정리해야 합니다.
CTO 성명서
IT는 우리에게 우선 순위가 아니었습니다. 따라서 데이터가 증가함에 따라 기술에 충분히 투자하지 않았습니다. IT를 관리할 수 있는 훌륭한 직원이 있지만 인프라 관리에 너무 바빠서 데이터 정리, 분석 구축, CFO 구현 방법 파악 등 정말 중요한 작업을 수행하도록 할 수 없습니다. 추적 기술.
CFO 성명서
우리의 경쟁 우위 중 하나는 배송 지연 및 배달에 대해 처벌을 받는다는 것입니다. 선적이 어디에 있는지 항상 아는 것은 우리의 수익과 수익성에 직접적인 상관관계가 있습니다. 또한 서버 환경 구축에 자본을 투자하고 싶지 않습니다.
Flowlogistic의 경영진은 현재 Apache Kafka 서버가 실시간 재고 추적 시스템에 대한 데이터 볼륨을 처리할 수 없다고 판단했습니다. 독점 추적 소프트웨어를 제공할 새로운 시스템을 Google Cloud Platform(GCP)에 구축해야 합니다. 시스템은 다양한 글로벌 소스로부터 데이터를 수집하고 실시간으로 처리 및 쿼리하고 데이터를 안정적으로 저장할 수 있어야 합니다. 어떤 GCP 제품 조합을 선택해야 합니까?
회사 개요
Flowlogistic은 선도적인 물류 및 공급망 제공업체입니다. 이들은 전 세계 기업이 자원을 관리하고 최종 목적지까지 운송할 수 있도록 돕습니다. 회사는 빠르게 성장하여 철도, 트럭, 항공기 및 해상 운송을 포함하도록 서비스를 확장했습니다.
회사 배경
이 회사는 지역 트럭 운송 회사로 시작하여 다른 물류 시장으로 확장했습니다. 인프라를 업데이트하지 않았기 때문에 주문과 배송을 관리하고 추적하는 데 병목 현상이 발생했습니다. 운영을 개선하기 위해 Flowlogistic은 소포 수준에서 실시간으로 배송을 추적하는 독점 기술을 개발했습니다. 그러나 Apache Kafka 기반의 기술 스택이 처리량을 지원할 수 없기 때문에 배포할 수 없습니다. 또한 Flowlogistic은 주문과 배송을 추가로 분석하여 리소스를 가장 잘 배포할 수 있는 방법을 결정하려고 합니다.
솔루션 컨셉
Flowlogistic은 클라우드를 사용하여 두 가지 개념을 구현하려고 합니다.
* 적재 위치를 나타내는 실시간 재고 추적 시스템에서 독점 기술을 사용합니다.
* 구조화된 데이터와 구조화되지 않은 데이터가 모두 포함된 모든 주문 및 배송 로그에 대한 분석을 수행하여 리소스를 배치하는 최선의 방법과 정보를 확장할 시장을 결정합니다. 또한 예측 분석을 사용하여 배송이 지연되는 시기를 조기에 파악하고 싶어합니다.
기존 기술 환경
Flowlogistic 아키텍처는 단일 데이터 센터에 상주합니다.
* 데이터베이스
* 2개의 클러스터에 8개의 물리적 서버
* SQL Server - 사용자 데이터, 인벤토리, 정적 데이터
* 물리적 서버 3대
* Cassandra - 메타데이터, 메시지 추적
10개의 Kafka 서버 - 메시지 집계 및 일괄 삽입 추적
* 애플리케이션 서버 - 고객 프론트엔드, 주문/통관을 위한 미들웨어
* 20개의 물리적 서버에 60개의 가상 머신
* Tomcat - 자바 서비스
* Nginx - 정적 콘텐츠
* 배치 서버
저장 장치
* 가상 머신(VM) 호스트용 iSCSI
* 파이버 채널 스토리지 영역 네트워크(FC SAN) - SQL 서버 스토리지
* NAS(Network Attached Storage) 이미지 저장, 로그, 백업
* 10개의 Apache Hadoop/Spark 서버
* 핵심 데이터 레이크
* 데이터 분석 워크로드
* 20개의 기타 서버
* Jenkins, 모니터링, 요새 호스트,
비즈니스 요구 사항
* 대규모 생산 팬티로 안정적이고 재현 가능한 환경을 구축하십시오.
* 분석을 위해 중앙 집중식 데이터 레이크에 데이터 집계
* 과거 데이터를 사용하여 향후 배송에 대한 예측 분석을 수행합니다.
* 독점 기술을 사용하여 전 세계 모든 배송을 정확하게 추적합니다.
* 새로운 리소스의 신속한 제공을 통해 비즈니스 민첩성과 혁신 속도를 향상시킵니다.
* 클라우드 성능을 위한 아키텍처 분석 및 최적화
* 다른 모든 요구 사항이 충족되면 클라우드로 완전히 마이그레이션하세요.
기술 요구 사항
* 스트리밍 및 배치 데이터를 모두 처리
* 기존 Hadoop 워크로드 마이그레이션
* 회사의 변화하는 요구 사항을 충족할 수 있도록 아키텍처가 확장 가능하고 탄력적인지 확인하십시오.
* 가능하면 관리형 서비스를 사용하세요.
* 데이터 비행 및 저장 데이터 암호화
* 프로덕션 데이터 센터와 클라우드 환경 간 VPN 연결 SEO 성명 우리는 너무 빠르게 성장했기 때문에 인프라를 업그레이드할 수 없는 것이 실제로 더 이상의 성장과 효율성을 방해하고 있습니다. 우리는 전 세계로 배송물을 효율적으로 이동하지만 데이터를 이동하는 데는 비효율적입니다.
우리는 고객이 어디에 있는지, 무엇을 배송하는지 더 쉽게 이해할 수 있도록 정보를 정리해야 합니다.
CTO 성명서
IT는 우리에게 우선 순위가 아니었습니다. 따라서 데이터가 증가함에 따라 기술에 충분히 투자하지 않았습니다. IT를 관리할 수 있는 훌륭한 직원이 있지만 인프라 관리에 너무 바빠서 데이터 정리, 분석 구축, CFO 구현 방법 파악 등 정말 중요한 작업을 수행하도록 할 수 없습니다. 추적 기술.
CFO 성명서
우리의 경쟁 우위 중 하나는 배송 지연 및 배달에 대해 처벌을 받는다는 것입니다. 선적이 어디에 있는지 항상 아는 것은 우리의 수익과 수익성에 직접적인 상관관계가 있습니다. 또한 서버 환경 구축에 자본을 투자하고 싶지 않습니다.
Flowlogistic의 경영진은 현재 Apache Kafka 서버가 실시간 재고 추적 시스템에 대한 데이터 볼륨을 처리할 수 없다고 판단했습니다. 독점 추적 소프트웨어를 제공할 새로운 시스템을 Google Cloud Platform(GCP)에 구축해야 합니다. 시스템은 다양한 글로벌 소스로부터 데이터를 수집하고 실시간으로 처리 및 쿼리하고 데이터를 안정적으로 저장할 수 있어야 합니다. 어떤 GCP 제품 조합을 선택해야 합니까?
Professional-Data-Engineer 문제 159
Cloud Storage에 이전 데이터를 저장합니다. 과거 데이터에 대한 분석을 수행해야 합니다.
ㅏ. 잘못된 데이터 항목을 감지하고 프로그래밍이나 SQL 지식이 필요하지 않은 데이터 변환을 수행하는 솔루션을 사용하려고 합니다.
당신은 무엇을 해야 합니까?
ㅏ. 잘못된 데이터 항목을 감지하고 프로그래밍이나 SQL 지식이 필요하지 않은 데이터 변환을 수행하는 솔루션을 사용하려고 합니다.
당신은 무엇을 해야 합니까?
Professional-Data-Engineer 문제 160
귀사에서는 BigQuery를 사용하여 데이터 웨어하우스를 구현 중이며 귀하는 데이터 모델 설계를 담당했습니다. 스타 데이터 스키마가 포함된 온프레미스 판매 데이터 웨어하우스를 BigQuery로 이동했지만 지난 30일 동안의 데이터를 쿼리할 때 성능 문제가 발견되었습니다. Google의 권장 사례, 저장 비용을 늘리지 않고 쿼리 속도를 높이려면 어떻게 해야 할까요?
프리미엄 번들
DumpTop 에서 공유하는 최신 Professional-Data-Engineer 시험 덤프는 Professional-Data-Engineer 시험패스를 도와드릴수 있습니다! DumpTop 은 최근 업데이트된 Professional-Data-Engineer 시험자료를 제공해드립니다. DumpTop Professional-Data-Engineer 덤프도 시험문제 변경에 따라 업데이트되었으며 오답도 수정되었습니다. DumpTop Professional-Data-Engineer 덤프 최신버전을 공유받아보세요.
(403 Q&As 덤프, 30%OFF할인코드: KrDump)
