[번역] "There is no more space for virtual disk .vmdk" error when starting vSAN VM (2146613)

출처 : https://kb.vmware.com/s/article/2146613

제목 : vSAN VM을 시작할 때 "There is no more space for virtual disk .vmdk" 오류 (2146613)

증상

vSAN 가상 시스템을 시작할 수 없으며 다음과 같은 증상이 발생하는 경우:

  • vSAN 데이터스토어가 가상머신을 프로비저닝하기에 충분한 총 사용 가능한 공간을 보고한다.
  • vSAN 클러스터 ESXi 호스트에서 사용 중인 Capacity Tier 디스크의 크기가 255GB보다 크다.
  • vSphere Web Client에 다음과 유사한 오류가 나타난다 경우:

There is no more space for virtual disk <VM name>.vmdk. You might be able to continue this session by freeing disk space on the relevant volume and clicking retry.

목적

이 문서의 목적은 가상 디스크 오류에 대해 공간이 더 이상 없는 원인과 이 문제를 해결하기 위한 정보를 설명하는 것이다.

원인

VM 스토리지 정책의 비준수로 인해 오브젝트 생성이 실패한다.

해결

이 문제를 해결하려면 오브젝트에 스트라이핑 정책을 적용할 때 가용성 및 스트라이핑 요구 사항을 모두 충족할 수 있는 공간이 충분한지 확인한다.

보고된 총 여유 공간은 물리적 용량이다.

필요한 공간을 계산하려면 새 오브젝트에 적용할 스토리지 정책을 고려해야 한다.

vSAN 기본 스토리지 정책에서:

  • Failures To Tolerate(FTT) = 1
  • StripeWidth = 1
  • Object Space Reservation=0

사용 가능한 보고된 원시(raw) 여유 공간은 새 오브젝트 크기와 약간의 작은 메타데이터 오버헤드의 두 배 미만이다. 이 크기보다 큰 개체를 만들려고 하면 오류가 발생하여 실패한다.

예를 들면 다음과 같다.

  • Raw free capacity = 3000 GB.
  • Required VM disk size = 250 GB.
  • Required raw free space = 500 GB + overhead.

그러나 오브젝트 공간 예약이 0(씬 프로비저닝됨)이기 때문에 용량을 오버 커밋할 수 있다. 이로 인해 프로비저닝된 개체가 증가함에 따라 용량 계층 공간이 부족해질 위험이 발생한다.

기본 정책을 사용하여 크기가 255GB보다 작거나 같은 오브젝트체에 별도의 vSAN 호스트에 2개의 구성 요소(복제)가 배치되는지 확인한다. 스트라이프 너비가 1이기 때문에, 이 물체의 구성요소는 더 작은 청크로 분할되지 않는다. 그러나 어떤 용량 계층 디스크에서 사용 가능한 최소 여유 공간이 개체 크기보다 작을 경우, 이 경우 CLOMD는 한번 이상의 반복을 시도하여 용량 계층 디스크의 여유 공간에 가장 잘 맞는 더 작은 동일한 스트라이프로 복제본을 분할한다.

고려해야 할 요인은 용량 계층 디스크에서 구성 요소가 얼마나 잘 균형을 이루느냐 하는 것이다. 일부 Disk가 다른 Disk보다 많이 활용되면 사용 가능한 공간이 용량 계층 Disk에 클러스터 간에 균등하게 분산되지 않는다. 따라서 최소 공통 분모에 맞도록 더 작은 스트라이프를 만들 수 있으며, 동일한 Disk에 다른 Disk보다 사용 가능한 공간이 더 많은 경우 일부 스트립이 있을 수 있다. 스트라이프는 성능 최적화가 아닌 최적의 공간 할당을 위한 것이기 때문에 스트라이프가 동일한 용량 계층 디스크에 함께 배치되는 것이 허용된다.

예 : 노드당 디스크 그룹이 하나씩 있는 3개 노드 클러스터가 있다고 가정한다.

  • 각 디스크 그룹에는 4개의 용량 계층 디스크가 있다.
  • 각 디스크의 사용 가능한 공간은 50GB이다.
  • 이로써 총 RAW 용량은 600GB(디스크 그룹당 디스크 4개 x 디스크당 50GB x 노드 3개)가 된다.
  • 250GB 객체에 가장 적합한 것은 스트라이프당 50GB 미만이 될 것이다(메타데이터 오버헤드를 감안).

이 계산의 문제는 RAID-1의 미러 2개가 동일한 호스트에 있을 수 없다는 것이다. 따라서 첫 번째 복제본이 2개 노드에 걸쳐 분산된 경우, 미러는 충분한 공간이 없는 세 번째 노드에만 존재해야 한다. 이는 vSAN의 모범 사례가 최소 요구사항이 3개 노드임에도 4노드 클러스터를 사용하는 이유 중 하나이다.

구강사의 추가 해설 : 50G 크기로 스트라이프될 경우, 250G 를 저장하기 위해서 5개의 캐패시티 티어 디스크가 필요해진다. 즉, 1대의 호스트의 디스크로 부족하기 때문에 2개의 호스트가 사용되게 된다. FTT 1을 구현하기 위해서 또 다시 5개의 디스크가 필요해진다. 그러나 남은 호스트는 1대뿐...

요약하면, 보고된 원시 여유 공간은 모든 호스트의 모든 용량 계층 디스크에서 사용 가능한 모든 공간을 조합한 것으로, 이 공간이 반드시 사용 가능함을 의미하지는 않는다.

관련 정보

MD <255GB인 경우, 참조 : Using small magnetic disks for vSAN might result in VM failures