[번역] vSAN Design Considerations – Using Large Capacity Storage Devices

출처 : https://blogs.vmware.com/virtualblocks/2020/06/09/vsan-design-considerations-using-large-capacity-storage-devices/

vSAN을 기반으로 하는 vSAN 및 VMware Cloud Foundation 환경은 뛰어난 확장성을 제공한다. 호스트에 디바이스를 추가하여 용량을 확장하거나 호스트를 추가하여 용량을 확장할 수 있다. vSAN 7에 최대 32TB의 용량 디바이스를 지원하는 기능이 도입되었을 때 초대형 플래시 디바이스를 사용하는 것이 설계에 어떤 영향을 미치는가? 고려사항을 좀 더 자세히 살펴보자.

더 많은 스토리지 용량이 I/O에 대한 더 많은 잠재력

많은 양의 데이터를 유휴 상태로 저장하는 것은 소량의 데이터를 저장하는 것과 크게 다르지 않다. 차이점은 공유 스토리지 환경에서 더 많은 데이터(일반적으로 VM 형태)가 읽기 및 쓰기 형태의 액세스 가능성을 높일 수 있다는 점이다.

HCI 및 3계층 아키텍처 모두에서 용량 증가는 예기치 않은 방식으로 성능 병목 현상을 전환할 수 있다. 예를 들어, 3계층 아키텍처는 원시 스토리지 증가에 따라 스토리지 컨트롤러에 더 많은 스트레스를 주는 경우가 많다. HCI 아키텍처는 물리적 호스트당 더 많은 수의 VM에서 쓰기 작업으로 인해 네트워크에 대한 스트레스가 증가할 수 있다.

상대적으로 성능이 낮은 고밀도 장치는 TB당 가격이 좋다는 착각을 일으킬 수 있지만, 데이터를 소비하는 워크로드의 성능 요구를 지원하지 못할 수도 있다. 용량은 기술적으로 사용할 수 있지만 예상 성능 수준에서 사용할 수 없을 가능성이 있다. vSAN을 기반으로 하는 vSAN 및 VCF 환경의 경우 이를 수용할 수 있는 방법이 있다.

디바이스 버스 및 프로토콜 고려 사항

많은 고밀도 스토리지 장치는 "가치" 기반이며, 이는 엔터프라이즈 환경에서 흔히 요구되는 수준의 성능과 일관성을 제공하지 않는다는 것을 의미한다. 이 범주에 맞는 SATA 인터페이스를 사용하는 플래시 스토리지 장치. 이들은 반이중 신호, 단일 명령 대기열, I/O당 더 높은 CPU 처리 등 프로토콜의 다양한 한계로 인해 성능과 일관성에 어려움을 겪고 있다. SATA는 로드맵에 계획된 개선 없이 소비자 공간에 훨씬 더 적합하다. SATA의 특성은 단순히 공유 스토리지의 양방향 동시 액세스 요구와 잘 일치하지 않는다.

대용량 디바이스를 고려할 때는 최소한 SAS 기반 플래시 디바이스를 고려하기 바란다. NVMe가 우수한 표준이며, 이 훨씬 우수한 버스 프로토콜이 기업을 인수하는 것은 시간문제라는 점에 유의한다. NAND 플래시 또는 3D XPpoint를 사용하는 NVMe 장치는 캐싱 및 버퍼링 장치와 같은 보다 성능 중심적인 영역에서 이미 우위를 차지하고 있다.

고밀도 장치는 또한 그들을 제어하는 오프 디바이스, 공유 HBA에 더 많은 스트레스를 줄 수 있다. SAS는 SATA보다 이 문제를 더 잘 처리하지만, 트래픽 증가에 따라 공유 컨트롤러의 병목 현상이 발생할 가능성이 더 높다. 각 NVME 장치에는 자체 컨트롤러가 포함되어 있으므로 NVMe 장치는 이러한 문제를 겪지 않는다.

권장 사항: 대용량 디바이스의 경우 최소한 SAS 기반 디바이스가 사용되며 NVMe가 이상적인 기본 설정이다.

디스크 그룹 설계 고려 사항

훨씬 더 큰 용량의 기기를 사용하면 더 많은 작업 부하가 발생할 가능성이 버퍼링 계층에 추가적인 부담을 줄 수 있다. 어떻게 이런 일이 일어날까? 추가 VM에서 더 많은 저장된 데이터는 일반적으로 클러스터의 호스트 전체에서 집계 작업 세트 크기를 증가시킨다. 일반적으로 워크로드가 많을수록 핫 데이터가 많아진다. vSAN 설계 및 싸이징 가이드는 성능 입력을 기반으로 All-Flash 환경에서 버퍼 계층의 싸이징에 대해 설명하지만, 더 많은 버퍼 용량을 사용하여 더 많은 워크로드를 수용할 수 있도록 지원하는 것은 성능의 일관성을 위한 신중한 단계다.

Figure1.gif

그림 1 : 종합 작업 세트로 핫 데이터의 양 증가

각 호스트에 더 많은 디스크 그룹을 추가하면 사용할 수 있는 버퍼 디바이스가 더 많아져 추가 워크로드를 수용하는 데 사용할 수 있는 버퍼 용량이 증가한다. 마찬가지로 중요한 것은 더 많은 디스크 그룹이 발생할 수 있는 병렬 I/O 작업 수를 증가시킨다는 것이다.
Figure2.png

그림 2. 추가 디스크 그룹이 더 많은 버퍼 용량을 제공

권장 사항: 호스트당 더 많은 디스크 그룹을 사용하여 병렬화를 개선하고 더 많은 활성/핫 데이터의 가능성을 지원하려면 버퍼 캐시의 전체 용량을 늘리십시오.

특히 호스트당 용량을 늘릴 때 용량 계층의 성능 요구를 수용하는 것은 간과되는 경우가 많다. 버퍼 계층은 I/O의 최대 버스트 속도를 제공하지만, 용량 계층은 I/O의 최대 정상 상태 속도를 제공한다. 용량 계층의 성능이 충분하지 않은 경우, 높은 수준의 지속적인 쓰기가 버퍼의 기능을 압도할 수 있다. 버퍼의 디스테이징 속도는 용량 계층의 성능 능력에 의해 가장 자주(그러나 항상은 아님) 구속된다. 이럴 경우 더 빠른 플래시 디바이스 등을 사용함으로써 용량 계층의 성능을 향상시킬 수 있다. 이렇게 하면 데이터를 더 빨리 디스테이징하여 추가 대기 시간이 게스트 VM으로 밀리지 않도록 함으로써 버퍼 계층에 대한 부담을 줄일 수 있다.

Figure3.gif

그림 3. 용량 계층의 성능 향상

중복제거 및 압축을 사용하지 않도록 설정하는 것도 용량 계층의 성능을 향상시키는 옵션이다. 중복제거 및 압축은 소멸 시간 동안 노력이 필요한 프로세스로서, 소멸 비율을 효과적으로 감소시킨다. 클러스터에 도입된 더 큰 장치는 기능을 활성화할 필요 없이 필요한 용량 요건을 제공할 수 있다.

권장 사항: 용량 계층의 성능에 관심이 있는 경우, 용량 계층에 고성능 SAS 또는 NVMe 장치를 사용한다.

대피(Evacuation) 및 수리(Repair) 시간 고려 사항

네트워크와 장치 성능이 동일하다고 가정할 때 더 많은 잠재적 용량은 대피 시간이 길어진다는 것을 의미한다.

Figure4.gif

그림 4. 호스트 디바이스 및 네트워크의 성능에 따라 바인딩된 호스트 제거 및 복구 시간

현재 이전 구성과 같은 4, 8 또는 12배 용량의 디바이스를 사용하고 있는 호스트에 사용되는 동일한 10GB 네트워크는 결국 각 호스트의 VM 밀도에 충분하지 않을 수 있다. 자세한 내용은 vSAN 설계 고려 사항 - 고속 스토리지 디바이스 대 고속 네트워킹을 참조하십시오. 충분한 크기의 vSAN 클러스터에는 지정된 규정 준수 수준을 유지하는 데 도움이 되는 오브젝트 데이터의 잠재적인 재동기화를 위해 항상 사용 가능한 호스트가 있어야 한다. 프로세스가 자동화되어 있고 관리자에게 투명하다. 그러나 그것이 수행되는 속도는 네트워크와 사용되는 저장 장치의 성능에 달려 있다. 호스트 철수 및 수리 시간에 대한 고려는 지속적인 호스트 장애가 발생할 경우 호스트 용량을 한 호스트에서 다른 호스트로 재구축하거나 이동하는 데 걸리는 시간의 편안함 수준으로 내려간다.

권장 사항: 전체 호스트 대피 테스트를 수행하여 총 대피 시간을 결정하고 호스트 용량을 크게 늘릴 경우 추정치를 추정하십시오. 이러한 수치가 요구 사항을 충족하지 못할 경우 스토리지 장치와 관련 스위치 패브릭의 기능을 평가하는 것이 순서다.

호스트 수 고려 사항

고밀도 장치는 더 적은 수의 장치 및/또는 호스트로 동일하거나 더 많은 용량을 달성할 가능성을 의미하기 때문에 도발적이다. 정의된 수준의 복원력을 유지하는 데 필요한 최소 호스트. 또한 각 호스트는 각각의 용량을 기여하지만 I/O 처리를 위해 자체 RAM과 CPU도 기여한다는 점을 기억하십시오. 클러스터에서 이러한 리소스를 빼는 것은 성능 병목 현상에 기여하는 경우 어느 정도 영향을 미칠 수 있다.

권장 사항: vSAN 클러스터의 호스트 수가 필요한 복원력 수준을 지원하기에 충분한 크기를 유지하는지 확인하십시오.

요약

고밀도 스토리지 디바이스가 vSAN 호스트에 새로운 기능을 제공함 아키텍처의 유연성 덕분에 거의 모든 vSAN 기반 환경에서 신속하게 채택할 수 있다. 또한 클러스터가 예상되는 전체 성능 기능을 지원할 수 있도록 설계 시 고려사항을 소개한다. 고밀도 스토리지 장치가 설계에 어떤 영향을 미칠 수 있는지 이해하는 데 약간의 시간이 걸리면 보다 현명한 구매 결정과 보다 예측 가능한 성능 결과를 얻을 수 있다.