무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-12-06.q306 모의 시험 (Page 57)

Professional-Data-Engineer 문제 276

조직에서 사용자 수준 데이터가 있는 테이블이 포함된 Google BigQuery 데이터 세트를 유지 관리합니다. 그들은 사용자 수준 데이터에 대한 액세스를 제어하는 동시에 이 데이터의 집계를 다른 Google Cloud 프로젝트에 노출하려고 합니다. 또한 전체 스토리지 비용을 최소화하고 다른 프로젝트의 분석 비용이 해당 프로젝트에 할당되도록 해야 합니다. 그들은 무엇을 해야 할까요?

A. 집계 결과를 제공하는 승인된 뷰를 만들고 공유합니다.

B. 집계 결과를 제공하는 새로운 데이터 세트와 보기를 만들고 공유합니다.

C. 집계 결과가 포함된 새 데이터 세트와 테이블을 만들고 공유합니다.

D. 데이터 세트에 대한 dataViewer Identity and Access Management(IAM) 역할을 생성하여 공유를 활성화합니다.

Professional-Data-Engineer 문제 277

고객의 거리 주소가 포함된 BigQuery 데이터 세트가 하나 있습니다. 데이터 세트에서 거리 주소의 모든 발생을 검색하려고 합니다. 어떻게 해야 합니까?

A. Cloud Data Loss Prevention을 사용하여 데이터 세트의 각 테이블에 대한 심층 검사 작업을 만들고 STREET_ADDRESS infoType을 포함하는 검사 템플릿을 만듭니다.

B. Cloud Data Loss Prevention에서 익명화 작업을 만들고 마스킹 변환을 사용합니다.

C. 데이터 세트의 모든 테이블에 REGEXP_CONTAINS를 사용하여 BigQuery에서 SQL 쿼리를 작성하여 "street"라는 단어가 나타나는 행을 찾습니다.

D. Cloud Data Loss Prevention을 사용하여 조직에서 검색 검사 구성을 만들고 검사 템플릿을 만듭니다.

정답: A

STREET_ADDRESS infoType을 포함합니다.
설명:
BigQuery 데이터세트에서 거리 주소의 모든 발생을 검색하려면 가장 효과적이고 포괄적인 방법은 Cloud Data Loss Prevention(DLP)을 사용하는 것입니다. 옵션 A가 가장 좋은 선택인 이유는 다음과 같습니다.
클라우드 데이터 유출 방지(DLP):
Cloud DLP는 민감한 정보를 발견, 분류 및 보호하도록 설계되었습니다. 여기에는 거리 주소를 포함한 다양한 종류의 민감한 데이터에 대한 사전 정의된 infoType이 포함됩니다.
Cloud DLP를 사용하면 고급 패턴 인식 및 상황 분석을 기반으로 도로 주소를 철저하고 정확하게 감지할 수 있습니다.
심층 검사 작업:
심층 검사 작업을 통해 전체 테이블을 스캔하여 중요한 정보를 찾을 수 있습니다.
STREET_ADDRESS infoType을 포함하는 검사 템플릿을 만들면 데이터 세트에서 모든 거리 주소 인스턴스가 감지되는지 확인할 수 있습니다.
확장성 및 정확성:
Cloud DLP는 확장성이 뛰어나 대규모 데이터 세트를 효율적으로 처리할 수 있습니다.
이 기술은 민감한 데이터를 식별하는 데 높은 수준의 정확도를 제공하여 발생 사항을 놓칠 위험을 줄여줍니다.
구현 단계:
클라우드 DLP 설정:
Google Cloud 프로젝트에서 Cloud DLP API를 활성화합니다.
검사 템플릿 만들기:
STREET_ADDRESS infoType을 포함하는 Cloud DLP에서 검사 템플릿을 만듭니다.
심층 검사 작업 실행:
검사 템플릿을 사용하여 데이터 세트의 각 테이블에 대한 심층 검사 작업을 만들고 실행합니다.
검사 작업 결과를 검토하여 모든 거리 주소 발생 사항을 검색합니다.
참조:
클라우드 DLP 문서
검사 작업 생성
주제 2, MJTelco 사례 연구
회사 개요
MJTelco는 전 세계적으로 빠르게 성장하고 서비스가 부족한 시장에 네트워크를 구축할 계획인 신생 기업입니다. 이 회사는 혁신적인 광 통신 하드웨어에 대한 특허를 보유하고 있습니다. 이러한 특허를 기반으로 저렴한 하드웨어로 많은 안정적이고 고속 백본 링크를 만들 수 있습니다.
회사 배경
경험이 풍부한 통신 임원이 설립한 MJTelco는 원래 우주에서 통신 문제를 극복하기 위해 개발된 기술을 사용합니다. 운영의 기본은 실시간 분석을 구동하고 머신 러닝을 통합하여 토폴로지를 지속적으로 최적화하는 분산 데이터 인프라를 구축해야 한다는 것입니다. 하드웨어가 저렴하기 때문에 네트워크를 과도하게 구축하여 역동적인 지역 정치가 위치 가용성과 비용에 미치는 영향을 설명할 계획입니다.
그들의 관리 및 운영 팀은 전 세계에 위치하고 있으며, 데이터 소비자와 시스템 제공자 간에 다대다 관계를 구축하고 있습니다. 신중한 고려 끝에 그들은 퍼블릭 클라우드가 그들의 요구를 지원하기에 완벽한 환경이라고 결정했습니다.
솔루션 컨셉
MJTelco는 실험실에서 성공적인 개념 증명(PoC) 프로젝트를 진행하고 있습니다. 그들에게는 두 가지 주요 요구 사항이 있습니다.
50,000개가 넘는 설치로 증가하면 생성되는 훨씬 더 많은 데이터 흐름을 지원하기 위해 PoC를 확장하고 강화합니다.
토폴로지 정의를 제어하는 데 사용하는 동적 모델을 검증하고 개선하기 위해 머신 러닝 주기를 세부적으로 조정합니다.
MJTelco는 실험 실행, 새로운 기능 배포, 프로덕션 고객 서비스 제공의 요구 사항을 충족하기 위해 개발/테스트, 스테이징, 프로덕션이라는 세 가지 별도의 운영 환경을 사용할 것입니다.
비즈니스 요구 사항
예측 불가능하고 분산된 통신 사용자 커뮤니티에서 필요할 때 필요한 곳에 리소스를 인스턴스화하여 최소한의 비용으로 생산 환경을 확장합니다.
최첨단 머신 러닝과 분석을 보호하기 위해 독점 데이터의 보안을 보장합니다.
분산된 연구 인력이 분석할 수 있도록 안정적이고 시기적절한 데이터 액세스를 제공합니다. 고객에게 영향을 미치지 않으면서 머신 러닝 모델의 빠른 반복을 지원하는 격리된 환경을 유지합니다.
기술적 요구 사항
원격 측정 데이터의 안전하고 효율적인 전송 및 저장을 보장합니다.
여러 흐름을 사용하는 10,000~100,000개의 데이터 공급자를 지원하도록 인스턴스를 빠르게 확장합니다.
약 1억 개의 레코드/일을 저장하고 최대 2년 분의 데이터를 추적하는 데이터 테이블에 대한 분석 및 프레젠테이션을 허용합니다. 원격 측정 흐름과 프로덕션 학습 주기 모두에서 데이터 파이프라인 문제에 대한 인식에 초점을 맞춘 모니터링 인프라의 신속한 반복을 지원합니다.
CEO 성명
저희의 사업 모델은 저희의 특허, 분석 및 역동적인 머신 러닝에 의존합니다. 저희의 저렴한 하드웨어는 매우 신뢰할 수 있도록 구성되어 있어 비용상 이점이 있습니다. 저희는 신뢰성과 용량 약속을 충족하기 위해 대규모 분산 데이터 파이프라인을 신속하게 안정화해야 합니다.
CTO 성명
당사의 퍼블릭 클라우드 서비스는 광고된 대로 작동해야 합니다. 확장 가능하고 데이터를 안전하게 유지하는 리소스가 필요합니다. 또한 데이터 과학자가 모델을 신중하게 연구하고 빠르게 조정할 수 있는 환경도 필요합니다. 당사는 자동화에 의존하여 데이터를 처리하기 때문에 반복 작업을 수행하는 동안 개발 및 테스트 환경도 작동해야 합니다.
CFO 성명
이 프로젝트는 데이터와 분석에 필요한 하드웨어와 소프트웨어를 유지하기에는 너무 큽니다. 또한, 우리는 너무 많은 데이터 피드를 모니터링할 운영팀을 고용할 여유가 없으므로 자동화와 인프라에 의존할 것입니다. Google Cloud의 머신 러닝을 통해 양적 연구자들은 데이터 파이프라인의 문제 대신 고가치 문제를 해결할 수 있습니다.

Professional-Data-Engineer 문제 278

기본적으로 Dataflow는 다음 중 어떤 윈도잉 동작을 무제한 데이터 세트에 적용합니까?

A. 100MB의 데이터마다 Windows

B. 단일, 글로벌 창

C. 1분마다 창

D. 10분마다 창

Professional-Data-Engineer 문제 279

Cloud Dataproc 클러스터를 관리하고 있습니다. 클러스터에서 진행 중인 작업을 잃지 않으면서 비용을 최소화하면서 작업을 더 빠르게 실행해야 합니다. 어떻게 해야 합니까?

A. 비선점형 작업자를 더 많이 추가하여 클러스터 크기를 늘립니다.

B. 선점형 워커 노드로 클러스터 크기를 늘리고, 이를 강제로 해제하도록 구성합니다.

C. 선점형 작업자 노드로 클러스터 크기를 늘리고 Cloud Stackdriver를 사용하여 작업을 보존하는 스크립트를 트리거합니다.

D. 선점형 워커 노드로 클러스터 크기를 늘리고, 이를 통해 우아한 폐기를 사용하도록 구성합니다.

Professional-Data-Engineer 문제 280

일정에 따라 실행해야 하는 여러 배치 작업을 구현하고 있습니다. 이러한 작업에는 특정 순서로 실행해야 하는 많은 상호 종속 단계가 있습니다. 작업의 일부는 셸 스크립트 실행, Hadoop 작업 실행 및 BigQuery에서 쿼리 실행을 포함합니다. 작업은 몇 분에서 몇 시간까지 실행될 것으로 예상됩니다. 단계가 실패하면 고정된 횟수만큼 다시 시도해야 합니다. 이러한 작업의 실행을 관리하기 위해 어떤 서비스를 사용해야 합니까?

A. 클라우드 데이터 흐름

B. 클라우드 컴포저

C. 클라우드 스케줄러

D. 클라우드 함수

다른 버전: 1259Google.Professional-Data-Engineer.v2024-08-24.q281; 1368Google.Professional-Data-Engineer.v2023-06-24.q151; 1835Google.Professional-Data-Engineer.v2023-04-17.q208; 2637Google.Professional-Data-Engineer.v2022-09-06.q248; 2066Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 105WGU.Data-Driven-Decision-Making.v2026-06-17.q46; 128HP.HPE7-A05.v2026-06-17.q115; 107HP.HPE7-A02.v2026-06-17.q96; 107SAP.C_S4PM_2601.v2026-06-17.q38; 108Oracle.1Z0-1072-25.v2026-06-17.q18; 156VMware.6V0-22.25.v2026-06-16.q98; 149NetworkAppliance.NS0-901.v2026-06-16.q35; 145Cisco.300-220.v2026-06-16.q145; 134Huawei.H20-923_V1.0.v2026-06-16.q21; 160Google.Professional-Cloud-DevOps-Engineer.v2026-06-16.q142