DEA-C01 문제 6
한 대학교에서 학생들의 에세이를 분석하는 교육용 애플리케이션을 개발 중입니다. 이 애플리케이션은 대학 교재를 정확하게 인용하여 개인 맞춤형 피드백을 제공합니다.
해당 애플리케이션은 여러 언어로 작성된 에세이를 처리해야 합니다. 지원서 답변에는 강의 자료의 특정 부분을 직접 참조해야 하며, 학생이 선택한 언어로 작성되어야 합니다. 이러한 요구 사항을 충족하면서 운영 부담을 최소화하는 솔루션은 무엇일까요?
해당 애플리케이션은 여러 언어로 작성된 에세이를 처리해야 합니다. 지원서 답변에는 강의 자료의 특정 부분을 직접 참조해야 하며, 학생이 선택한 언어로 작성되어야 합니다. 이러한 요구 사항을 충족하면서 운영 부담을 최소화하는 솔루션은 무엇일까요?
DEA-C01 문제 7
데이터 엔지니어가 VARIANT 데이터 형식을 가진 테이블 t1을 생성했습니다.
테이블 t1을 생성 또는 교체합니다(cl 변형);
엔지니어가 4가지 노트북 모델에 대한 정보가 담긴 다음 JSON 데이터 세트를 테이블에 로드했습니다.

엔지니어는 이제 해당 데이터 세트를 쿼리하여 결과를 일반적인 구조화된 데이터 형식으로 표시하려고 합니다. 결과는 JSON 데이터의 데이터 요소들을 둘러싼 큰따옴표 없이 4행 4열 형식이어야 합니다.
결과는 데이터가 문자열 데이터 형식의 열(model__id, model, manufacturer, =iccisi_r.an=)을 가진 일반 관계형 테이블 z2에서 선택된 경우와 유사해야 합니다. 이때 SQL 절 `select * from t2;`를 사용하여 쿼리합니다. 어떤 SELECT 명령이 올바른 결과를 생성할까요?
테이블 t1을 생성 또는 교체합니다(cl 변형);
엔지니어가 4가지 노트북 모델에 대한 정보가 담긴 다음 JSON 데이터 세트를 테이블에 로드했습니다.

엔지니어는 이제 해당 데이터 세트를 쿼리하여 결과를 일반적인 구조화된 데이터 형식으로 표시하려고 합니다. 결과는 JSON 데이터의 데이터 요소들을 둘러싼 큰따옴표 없이 4행 4열 형식이어야 합니다.
결과는 데이터가 문자열 데이터 형식의 열(model__id, model, manufacturer, =iccisi_r.an=)을 가진 일반 관계형 테이블 z2에서 선택된 경우와 유사해야 합니다. 이때 SQL 절 `select * from t2;`를 사용하여 쿼리합니다. 어떤 SELECT 명령이 올바른 결과를 생성할까요?
DEA-C01 문제 8
한 회사의 애플리케이션은 거의 실시간으로 데이터를 검색하고 분석해야 합니다. 이 애플리케이션은 초당 최대 1,000건의 요청을 처리해야 하며, 쿼리 지연 시간도 최소화해야 합니다. 회사는 각 데이터 팀이 소유하고 구성하여 비용 및 성능 최적화 요구 사항을 충족할 수 있는 솔루션을 원합니다. 이러한 요구 사항을 모두 충족하는 솔루션은 무엇일까요?
DEA-C01 문제 9
한 회사가 .csv 파일을 아마존 S3 버킷에 업로드합니다. 이 회사의 데이터 플랫폼 팀은 데이터 검색 및 테이블과 스키마 생성을 위해 AWS Glue 크롤러를 설정했습니다.
AWS Glue 작업은 처리된 데이터를 테이블에서 Amazon Redshift 데이터베이스로 기록합니다. AWS Glue 작업은 열 매핑을 처리하고 Redshift 데이터베이스에 적절한 테이블을 생성합니다.
만약 회사가 어떤 이유로든 AWS Glue 작업을 다시 실행하면 Amazon Redshift 테이블에 중복 레코드가 추가됩니다. 회사는 중복 없이 Redshift 테이블을 업데이트할 수 있는 솔루션이 필요합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
AWS Glue 작업은 처리된 데이터를 테이블에서 Amazon Redshift 데이터베이스로 기록합니다. AWS Glue 작업은 열 매핑을 처리하고 Redshift 데이터베이스에 적절한 테이블을 생성합니다.
만약 회사가 어떤 이유로든 AWS Glue 작업을 다시 실행하면 Amazon Redshift 테이블에 중복 레코드가 추가됩니다. 회사는 중복 없이 Redshift 테이블을 업데이트할 수 있는 솔루션이 필요합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
DEA-C01 문제 10
데이터 엔지니어는 여러 데이터베이스에서 새로운 데이터를 검색하고 발견된 데이터를 처리하는 완전 자동화 솔루션이 필요합니다. 이 솔루션은 매시간 실행되어야 하며, Amazon RDS, Amazon DynamoDB 및 Amazon OpenSearch Service와 호환되어야 합니다. 또한, 한 번에 최대 10MB의 데이터를 처리할 수 있어야 하며, 비용 및 운영 오버헤드를 최적화하고 강력한 오류 처리 기능을 갖춰야 합니다.
어떤 솔루션이 이러한 요구 사항을 충족할까요?
어떤 솔루션이 이러한 요구 사항을 충족할까요?
