Databricks-Certified-Data-Engineer-Professional 문제 1
데이터 엔지니어는 데이터 레이크에서 대량의 원시 JSON 로그를 가져와 보고용 Delta 테이블로 처리하는 야간 배치 ETL 파이프라인을 구축해야 합니다. 데이터는 하루에 한 번 대량으로 유입되며, 파이프라인 처리에는 몇 시간이 소요됩니다. 비용 효율성도 중요하지만, 파이프라인 완료의 성능과 안정성이 최우선 과제입니다. 데이터 엔지니어는 어떤 유형의 Databricks 클러스터를 구성해야 할까요?
Databricks-Certified-Data-Engineer-Professional 문제 2
user_ltv라는 테이블은 여러 팀의 데이터 분석가들이 사용할 뷰를 생성하는 데 사용됩니다. 워크스페이스의 사용자들은 그룹으로 구성되어 있으며, 이러한 그룹은 ACL을 사용하여 데이터 접근 권한을 설정하는 데 사용됩니다.
user_ltv 테이블은 다음과 같은 스키마를 가지고 있습니다.
이메일 문자열, 나이 정수, 장기 고객 기간 정수
다음 뷰 정의가 실행됩니다.

감사 그룹의 구성원이 아닌 분석가가 다음 쿼리를 실행합니다.
SELECT * FROM user_ltv_no_minors
다음 중 이 쿼리의 결과를 가장 잘 설명하는 문장은 무엇입니까?
user_ltv 테이블은 다음과 같은 스키마를 가지고 있습니다.
이메일 문자열, 나이 정수, 장기 고객 기간 정수
다음 뷰 정의가 실행됩니다.

감사 그룹의 구성원이 아닌 분석가가 다음 쿼리를 실행합니다.
SELECT * FROM user_ltv_no_minors
다음 중 이 쿼리의 결과를 가장 잘 설명하는 문장은 무엇입니까?
Databricks-Certified-Data-Engineer-Professional 문제 3
필요한 모듈을 찾을 때 검색할 디렉터리 목록을 담고 있는 파이썬 변수는 무엇입니까?
Databricks-Certified-Data-Engineer-Professional 문제 4
데이터 거버넌스 팀은 GDPR 준수를 위해 레코드 삭제에 사용되는 코드를 검토하고 있습니다. 그들은 Delta Lake의 users라는 테이블에서 레코드를 삭제하는 데 다음과 같은 로직이 사용된다는 것을 확인했습니다.

user_id가 고유 식별 키이고 delete_requests에 삭제를 요청한 모든 사용자가 포함되어 있다고 가정할 때, 위의 로직을 성공적으로 실행하면 삭제될 레코드에 더 이상 접근할 수 없다는 것이 보장되는지 여부를 설명하는 문장은 무엇이며, 그 이유는 무엇입니까?

user_id가 고유 식별 키이고 delete_requests에 삭제를 요청한 모든 사용자가 포함되어 있다고 가정할 때, 위의 로직을 성공적으로 실행하면 삭제될 레코드에 더 이상 접근할 수 없다는 것이 보장되는지 여부를 설명하는 문장은 무엇이며, 그 이유는 무엇입니까?
Databricks-Certified-Data-Engineer-Professional 문제 5
신입 데이터 엔지니어가 관계형 데이터베이스 시스템의 워크로드를 Databricks Lakehouse로 마이그레이션하고 있습니다. 소스 시스템은 스타 스키마를 사용하며, 외래 키 제약 조건과 다중 테이블 삽입을 활용하여 레코드 쓰기 시 유효성을 검사합니다.
이 워크로드를 마이그레이션하는 동안 엔지니어의 결정에 영향을 미치는 고려 사항은 무엇입니까?
이 워크로드를 마이그레이션하는 동안 엔지니어의 결정에 영향을 미치는 고려 사항은 무엇입니까?
