무료 온라인 액세스 Google.Professional-Data-Engineer.v2024-12-06.q306 모의 시험 (Page 25)

Professional-Data-Engineer 문제 116

AI 모델을 제공하기 위해 광고 데이터가 필요하고, 분석을 위한 과거 데이터인 롱테일 및 이상치 데이터 포인트를 식별해야 합니다. AI 모델에 데이터를 실행하기 전에 거의 릴 시간 동안 데이터를 정리해야 합니다. 무엇을 해야 할까요?

A. Cloud Composer를 사용하여 롱테일 및 이상치 데이터 포인트를 식별한 다음 사용 가능한 데이터 세트를 BigQuery에 출력합니다.

B. Dataflow를 사용하여 BigQuery를 싱크로 사용하여 롱테일 및 아웃버 데이터 포인트를 프로그래밍 방식으로 식별합니다.

C. Cloud Storage를 데이터웨어하우스 셸 스크립트로 사용하여 처리하고 BigQuery를 사용하여 원하는 데이터세트에 대한 뷰를 만듭니다.

D. BigQuery를 사용하여 데이터를 수집하고 준비한 다음 분석하고 쿼리를 실행하여 뷰를 만듭니다.

Professional-Data-Engineer 문제 117

귀사의 데이터 플랫폼은 업스트림 소스에서 예약 및 사용자 프로필 데이터의 CSV 파일 덤프를 Cloud Storage로 수집합니다. 데이터 분석가 팀은 두 데이터 세트에서 사용 가능한 이메일 필드에 이러한 데이터 세트를 조인하여 분석을 수행하려고 합니다. 그러나 개인 식별 정보(PII)는 분석가가 액세스할 수 없어야 합니다. 분석가를 위해 BigQuery에 로드하기 전에 두 데이터 세트의 이메일 필드를 식별 해제해야 합니다. 어떻게 해야 합니까?

A. 1. Cloud Data Loss Prevention(Cloud DLP)의 recordTransformations를 사용하여 이메일 필드의 식별 정보를 삭제하는 파이프라인을 만들고, 마스크 처리를 식별 정보 삭제 변환 유형으로 사용합니다.
2. 예약 및 사용자 프로필 데이터를 BigQuery 테이블에 로드합니다.

B. 1. FFX를 익명화 변환 유형으로 사용하고 형식 보존 암호화를 사용하여 Cloud DLP의 recordTransformations를 사용하여 이메일 필드의 익명화를 위한 파이프라인을 만듭니다.
2. 예약 및 사용자 프로필 데이터를 BigQuery 테이블에 로드합니다.

C. 1. Cloud Storage에서 CSV 파일을 BigQuery 테이블에 로드하고 동적 데이터 마스킹을 활성화합니다.
2. 이메일 마스크를 데이터 마스킹 규칙으로 사용하여 정책 태그를 만듭니다.
3. 두 테이블의 이메일 필드에 정책을 할당합니다. A
4. 분석가에게 BigQuery 테이블에 대한 Identity and Access Management bigquerydatapolicy.maskedReader 역할을 할당합니다.

D. 1. Cloud Storage에서 CSV 파일을 BigQuery 테이블에 로드하고 동적 데이터 마스킹을 활성화합니다.
2. 기본 마스킹 값을 데이터 마스킹 규칙으로 사용하여 정책 태그를 만듭니다.
3. 두 테이블의 이메일 필드에 정책을 할당합니다.
4. BigQuery 테이블에 대한 ID 및 액세스 관리 bigquerydatapolicy.maskedReader 역할을 분석가에게 할당합니다.

Professional-Data-Engineer 문제 118

데이터 처리 파이프라인을 설계하고 있습니다. 파이프라인은 부하가 증가함에 따라 자동으로 확장할 수 있어야 합니다. 메시지는 최소한 한 번은 처리되어야 하며 1시간의 윈도우 내에서 정렬되어야 합니다. 솔루션을 어떻게 설계해야 합니까?

A. 메시지 수집에는 Cloud Pub/Sub을 사용하고 스트리밍 분석에는 Cloud Dataflow를 사용합니다.

B. 메시지 수집에는 Apache Kafka를 사용하고 스트리밍 분석에는 Cloud Dataproc을 사용합니다.

C. 메시지 수집에는 Cloud Pub/Sub을 사용하고 스트리밍 분석에는 Cloud Dataproc을 사용합니다.

D. 메시지 수집에는 Apache Kafka를 사용하고 스트리밍 분석에는 Cloud Dataflow를 사용합니다.

Professional-Data-Engineer 문제 119

귀사는 독점 시스템을 사용하여 6시간마다 클라우드의 데이터 수집 서비스로 재고 데이터를 전송합니다. 전송된 데이터에는 여러 필드의 페이로드와 전송 타임스탬프가 포함됩니다. 전송에 대한 우려가 있는 경우 시스템은 데이터를 다시 전송합니다. 가장 효율적으로 데이터를 중복 제거하려면 어떻게 해야 합니까?

A. 각 데이터 항목을 별도의 데이터베이스에 기본 키로 저장하고 인덱스를 적용합니다.

B. 각 데이터 항목의 해시 값을 계산하고, 이를 모든 과거 데이터와 비교합니다.

C. 각 데이터 항목에 대한 해시 값과 기타 메타데이터를 저장하기 위해 데이터베이스 테이블을 유지 관리합니다.

D. 각 데이터 항목에 전역 고유 식별자(GUID)를 할당합니다.

Professional-Data-Engineer 문제 120

Dataproc 클러스터에는 많은 구성 파일이 포함되어 있습니다. 이러한 파일을 업데이트하려면 --properties 옵션을 사용해야 합니다. 옵션의 형식은 file_prefix:property=_____입니다.

A. 세부 정보

B. 값

C. 널(null)

D. 아이디

다른 버전: 1172Google.Professional-Data-Engineer.v2024-08-24.q281; 1321Google.Professional-Data-Engineer.v2023-06-24.q151; 1831Google.Professional-Data-Engineer.v2023-04-17.q208; 2619Google.Professional-Data-Engineer.v2022-09-06.q248; 2057Google.Professional-Data-Engineer.v2022-05-24.q174

최근 업로드: 118TheBerylInstitute.CPXP.v2026-06-06.q56; 154ACAMS.CAMS7-KR.v2026-06-05.q213; 168PaloAltoNetworks.XSIAM-Analyst.v2026-06-04.q72; 150NLN.NEX.v2026-06-04.q54; 191Microsoft.AZ-500-KR.v2026-06-04.q213; 179Microsoft.DP-600-KR.v2026-06-04.q98; 194Microsoft.AZ-204-KR.v2026-06-04.q237; 179Microsoft.PL-600-KR.v2026-06-04.q112; 238Microsoft.SC-300-KR.v2026-06-03.q151; 208Microsoft.DP-600-KR.v2026-06-03.q70