Professional-Cloud-DevOps-Engineer 문제 6
많은 수의 종속 시스템이 있는 인프라 서비스에 대한 대기 중입니다. 서비스가 대부분의 요청을 처리하는 데 실패하고 수십만 명의 사용자가 있는 모든 종속 시스템이 영향을 받는다는 경고를 수신합니다. SRE(Site Reliability Engineering) 사고 관리 프로토콜의 일부로 자신을 사고 지휘관(IC)으로 선언하고 팀에서 두 명의 숙련된 인력을 운영 책임자(OLJ 및 커뮤니케이션 책임자(CL))로 끌어들입니다. 다음에 무엇을 해야 합니까?
Professional-Cloud-DevOps-Engineer 문제 7
마이크로서비스 아키텍처로 트래픽이 많은 웹 애플리케이션을 지원합니다. 애플리케이션의 홈 페이지에는 현재 날씨, 주가 및 뉴스 헤드라인과 같은 콘텐츠가 포함된 여러 위젯이 표시됩니다. 메인 서빙 스레드는 각 위젯에 대한 전용 마이크로 서비스를 호출한 다음 사용자를 위한 홈페이지를 레이아웃합니다. 마이크로서비스는 때때로 실패합니다. 이 경우 서비스 스레드는 일부 누락된 콘텐츠가 있는 홈페이지를 제공합니다. 이 저하된 모드가 너무 자주 발생하면 애플리케이션 사용자는 불만을 갖지만 콘텐츠가 전혀 제공되지 않는 대신 일부 콘텐츠가 제공되기를 원합니다. 사용자 경험이 너무 저하되지 않도록 SLO(서비스 수준 목표)를 설정하려고 합니다. 이를 측정하기 위해 어떤 서비스 수준 지표(SLI)를 사용해야 합니까?
Professional-Cloud-DevOps-Engineer 문제 8
귀하의 제품은 현재 3개의 GCP(Google Cloud Platform) 영역에 배포되어 있으며 사용자는 영역 간에 나누어져 있습니다. 한 영역에서 다른 영역으로 장애 조치할 수 있지만 영향을 받는 사용자에게 10분 서비스 중단이 발생합니다. 일반적으로 분기마다 한 번씩 데이터베이스 오류가 발생하며 5분 이내에 이를 감지할 수 있습니다. 제품에 대한 새로운 실시간 채팅 기능의 안정성 위험을 분류하고 있습니다. 각 위험에 대해 다음 정보를 분류합니다.
* 평균 감지 시간(MUD}(분)
* 평균 수리 시간(MTTR)(분)
* 평균 고장 간격(MTBF)(일)
* 사용자 영향 비율
채팅 기능을 사용하려면 영역 간에 성공적으로 장애 조치하는 데 두 배의 시간이 걸리는 새로운 데이터베이스 시스템이 필요합니다. 한 영역에서 새 데이터베이스가 실패할 위험을 고려하려고 합니다. 새 시스템에서 데이터베이스 장애 조치의 위험에 대한 값은 무엇입니까?
* 평균 감지 시간(MUD}(분)
* 평균 수리 시간(MTTR)(분)
* 평균 고장 간격(MTBF)(일)
* 사용자 영향 비율
채팅 기능을 사용하려면 영역 간에 성공적으로 장애 조치하는 데 두 배의 시간이 걸리는 새로운 데이터베이스 시스템이 필요합니다. 한 영역에서 새 데이터베이스가 실패할 위험을 고려하려고 합니다. 새 시스템에서 데이터베이스 장애 조치의 위험에 대한 값은 무엇입니까?
Professional-Cloud-DevOps-Engineer 문제 9
귀사는 프로덕션 시스템에서 버그, 중단 및 속도 저하를 경험합니다. 개발자는 새로운 기능 개발 및 버그 수정을 위해 프로덕션 환경을 사용합니다. 구성 및 실험은 프로덕션 환경에서 수행되므로 사용자에게 중단이 발생합니다. 테스터는 부하 테스트를 위해 프로덕션 환경을 사용하므로 프로덕션 시스템이 느려지는 경우가 많습니다. 프로덕션 환경의 버그 및 중단 수를 줄이고 테스터가 새로운 기능을 테스트할 수 있도록 환경을 재설계해야 합니다. 당신은 무엇을해야합니까?
Professional-Cloud-DevOps-Engineer 문제 10
애플리케이션 서비스는 Google Kubernetes Engine(GKE)에서 실행됩니다. 개발 시간을 최소화하면서 altostrat-images 프로젝트의 중앙에서 관리되는 GCR(Google Container Registry) 이미지 레지스트리의 이미지만 클러스터에 배포할 수 있도록 하려고 합니다. 당신은 무엇을해야합니까?
