[번역] vSphere 7 – A Closer Look at the VM DRS Score

출처 : https://blogs.vmware.com/vsphere/2020/05/vsphere-7-a-closer-look-at-the-vm-drs-score.html

vSphere 7에서 크게 개선된 DRS(Distributed Resource Scheduler) 로직을 출시했다. 고객들로부터 VM DRS 점수에 대한 더 많은 정보를 제공해 달라는 요청을 받았다. 이 블로그 게시물에는 VM DRS Score에 초점을 맞춘 새로운 DRS 알고리즘이 자세히 설명되어 있다.

DRS는 클러스터의 모든 워크로드가 만족스러운지 확인하기 위해 작동한다. 'Happy'는 워크로드가 자신에게 부여된 리소스를 소비할 수 있다는 것을 의미한다. 이는 클러스터 크기 조정, ESXi 호스트 활용률, 워크로드 특성, 컴퓨팅(vCPU/Memory) 및 네트워크 리소스에 초점을 맞춘 가상 시스템(VM) 구성과 같은 많은 요인에 따라 달라진다. DRS는 클러스터 전반에서 지능형 워크로드 배치 및 워크로드 밸런싱을 계산하고 실행하여 VM의 행복을 실현한다.

clusterwide-deviation2.png

이전 vSphere 릴리스에서 DRS는 위의 다이어그램에 표시된 것처럼 워크로드 '행복'을 최적화하기 위해 클러스터 전반의 표준 편차 모델 측정을 사용했다. 본질적으로 이는 DRS가 DRS 마이그레이션 임계값을 사용하여 구성할 수 있는 특정 임계값 범위인 ESXi 호스트 활용률 기준선에 초점을 맞췄다는 것을 의미한다. 재검증된 DRS 논리는 이전 DRS 논리와는 매우 다른 접근방식을 취한다. VM 행복을 측정하여 VM 행복을 최적화한다!

VM DRS Score

vSphere 7에서 DRS는 VM당 VM DRS 점수를 계산하여 VM 행복을 측정한다. 지정된 VM/워크로드에 대한 VM DRS 점수는 클러스터의 모든 ESXi 호스트에서 매 분마다 계산된다. DRS 계산 사이의 시간만 단축됨(1분, 이전 vSphere 릴리스의 5분 대비)으로 워크로드 밸런싱에 훨씬 더 세분화된 접근 방식을 제공 다른 ESXi 호스트가 VM에 더 나은 점수를 제공할 수 있는 경우 DRS 설정에 따라 DRS가 실시간 마이그레이션을 권장하고 실행할 수 있다. DRS가 완전히 자동화된 모드에서 작동하는 경우 DRS는 워크로드를 실시간 마이그레이션하기 위해 vMotion을 시작할 수 있다. DRS가 수동 또는 부분적으로 자동화되도록 구성된 경우 DRS를 실행하거나 DRS 권장 사항을 적용하기 위한 수동 작업이 필요하다.

VM-DRS-Score2.png

VM DRS 점수는 vSphere 7에서 DRS의 선량(goodness) 모델을 기반으로 계산된다. 선량 모델링은 DRS가 클러스터의 지정된 호스트에 있는 VM의 선량(행복도)을 계산할 수 있도록 한다. VM DRS 점수를 자세히 살펴보면, 백분율로 표현되는 것은 단순히 현재 호스트에 있는 VM의 장점일 뿐이다. DRS가 VM DRS 점수를 계산하는 방법을 이해하려면 vSphere 7의 선량 모델링 수준을 이해해야 한다.


Goodness (actual throughput) = Demand (ideal throughput) – Cost (loss of throughput)

Efficiency = Goodness (actual throughput) / Demand (ideal throughput)

Total efficiency = EfficiencyCPU * EfficiencyMemory * EfficiencyNetwork

Total efficiency on host = VM DRS score


즉, VM DRS 점수가 각 리소스의 효율성의 조합이라는 것을 의미한다. 자원의 효율성을 결정하기 위해 우리가 계산해야 할 것은 자원 비용이다. 비용에 기여하는 몇 가지 요인들이 있다. 이러한 비용은 각 자원에 대해 아래에 설명되어 있다.

CPU Costs

모든 비용은 VM에 청구된다. CPU 리소스의 비용에는 다음이 포함된다.

  • CPU 캐시 비용 – CPU 캐시 경합이 발생할 수 있으므로 VM의 공동 스케줄링을 모니터링한다.
  • CPU 준비 비용 – 호스트가 오버 커밋되어 호스트에서 VM의 CPU 요구량을 충족할 수 없는 경우 VM은 CPU 준비 시간(%RDY)이 더 높은 상태로 실행될 수 있다.
  • CPU 세금 비용 – VM이 호스트 CPU의 오버 커밋을 유발하는 경우. 예를 들어 VM이 해당 호스트에 없으면 호스트가 오버 커밋되지 않을 경우 비용에 영향을 미치게 된다.

총 CPU 비용은 위의 비용을 합한 것이다.

Memory Costs

메모리 비용은 다음을 포함한다.

  • 메모리 버스트성 비용 – 호스트에 메모리 헤드룸이 부족하여 메모리 수요 증가를 수용할 수 없는 경우 호스트에서 실행되는 VM에 비용을 청구한다. 헤드룸이 줄어들수록 비용은 증가한다.
  • 메모리 회수 비용 – 호스트가 오버 커밋되어 호스트에서 VM의 메모리 요구량을 충족할 수 없는 경우 VM은 페이지를 디스크로 스와핑하게 된다. DRS는 이를 VM에 대한 비용으로 청구함.
  • 메모리 세금 비용 – VM이 호스트 메모리의 오버 커밋을 유발하는 경우(즉, 해당 호스트에 VM이 없는 경우 호스트가 오버 커밋되지 않음), 여기에 비용을 청구한다.

총 메모리 비용은 위의 비용을 합한 것이다.

Networking Cost

  • 네트워크 활용 비용 – VM의 네트워킹 대역폭 요구량이 높고 호스트의 네트워크 사용량이 임계값을 초과하는 경우 VM에 비용을 청구한다. 비용은 호스트 네트워크 활용도가 증가함에 따라 선형적으로 증가한다.

마이그레이션 비용

DRS가 다른 호스트가 더 나은 VM DRS 점수를 제공할 수 있다고 판단하는 경우 실시간 마이그레이션을 권장하고 실행하기 전의 마지막 단계는 VM에 대한 마이그레이션 비용을 확인하는 것이다. 전체 예측 vMotion 시간은 VM DRS 스코어의 이득에 반영된다. 전체 vMotion 시간이 길어질수록 VM DRS 점수의 잠재적 이득(이익)이 짧아진다. 이는 VM에 대한 마이그레이션을 권장하는 DRS에 영향을 줄 수 있다.

VM을 다른 호스트로 실시간 마이그레이션하여 밸런싱 작업의 비용 이점을 확인하기 위해 DRS는 실시간 마이그레이션을 수행하는 데 필요한 CPU 사이클 양만큼 마이그레이션 비용을 계산한다. vMotion 프로세스의 일부로 복사해야 하는 메모리가 많을수록 추적 화재 및 데이터(네트워크) 와이어에 더 많은 CPU 사이클이 소요된다.

이로 인해 다른 ESXi 호스트가 더 나은 VM DRS 점수를 제공할 수 있지만 마이그레이션 비용이 높기 때문에 이점이 무효화되는 상황이 발생할 수 있다. DRS가 이 VM에 대해 실시간 마이그레이션을 권장하지 않는다.

viewallvms.png

맺음말

인프라에 vSphere 7을 업그레이드하거나 설치하면 새로워지고 향상된 DRS 로직의 이점을 즉시 누리십시오! 새로운 VM DRS 스코어 구조를 자세히 살펴봤지만 DRS의 장점은 고객이 이 기능을 활용할 수 있는 노하우를 거의 또는 전혀 필요로 하지 않는다는 점이다. 클러스터에서 DRS만 사용하도록 설정하면 즉시 사용 가능한 환경을 통해 워크로드를 최대한 최적 상태로 실행할 수 있으므로 워크로드 성능이 향상된다!

(정보를 제공해 준 DRS 엔지니어링 팀에 특별히 감사드립니다)