DEA-C01 문제 76
데이터 엔지니어는 AWS로 실시간 스트리밍 데이터를 수집하는 작업을 관리해야 합니다. 이 엔지니어는 최대 30분 기간 동안 시간 기반 집계를 사용하여 수신되는 스트리밍 데이터에 대한 실시간 분석을 수행하고자 합니다. 또한, 데이터 엔지니어는 높은 내결함성을 갖춘 솔루션을 필요로 합니다.
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?
어떤 솔루션이 운영 부담을 최소화하면서 이러한 요구 사항을 충족할까요?
DEA-C01 문제 77
세션 매개변수 USE_CACHED_RESULT가 false로 설정되어 있다고 가정할 때, Snowpark 사용 측면에서 Snowflake 가상 웨어하우스의 특징은 무엇입니까?
DEA-C01 문제 78
한 회사가 고객 연락처 정보가 저장된 데이터 레이크를 관리하기 위해 Amazon S3와 AWS Glue Data Catalog를 사용합니다. 이 회사는 PySpark와 DynamicFrame을 사용하는 AWS Glue 작업을 통해 데이터 레이크 내의 데이터를 처리하는 워크플로우를 실행합니다.
데이터 엔지니어는 고객 우편번호가 데이터 레이크에 저장되는 방식 때문에 워크플로에서 오류가 발생하는 것을 발견했습니다. 일부 우편번호에는 불필요한 숫자나 유효하지 않은 문자가 포함되어 있습니다.
데이터 엔지니어는 데이터 레이크에서 오류를 해결하고 우편번호를 수정할 수 있는 솔루션이 필요합니다.
데이터 엔지니어는 고객 우편번호가 데이터 레이크에 저장되는 방식 때문에 워크플로에서 오류가 발생하는 것을 발견했습니다. 일부 우편번호에는 불필요한 숫자나 유효하지 않은 문자가 포함되어 있습니다.
데이터 엔지니어는 데이터 레이크에서 오류를 해결하고 우편번호를 수정할 수 있는 솔루션이 필요합니다.
DEA-C01 문제 79
한 회사가 아마존 S3 버킷에 원시 클릭스트림 데이터를 저장하고 있습니다. 이 회사는 자체 개발한 라이브러리를 사용하는 복잡한 PySpark 변환을 통해 매일 데이터를 처리해야 합니다. 변환이 완료된 데이터는 분석을 위해 아마존 레드시프트에 저장해야 합니다. 또한, 대규모 데이터 워크로드를 처리할 수 있도록 높은 확장성을 갖춰야 합니다. 이러한 요구 사항을 충족하면서 운영 오버헤드를 최소화하는 솔루션은 무엇일까요?
DEA-C01 문제 80
온프레미스 서버에서 매일 약 1TB 크기의 CSV 파일이 생성됩니다. 해당 데이터에 대한 테이블, 내부 스테이지 및 파일 형식이 이미 Snowflake에 생성되어 데이터 로딩 프로세스를 용이하게 합니다. 운영 오버헤드를 최소화하면서 CSV 파일을 Snowflake로 가져오는 프로세스를 자동화하는 방법은 무엇일까요?
