[번역] vSAN Design Considerations – Fast Storage Devices Versus Fast Networking

출처 : https://blogs.vmware.com/virtualblocks/2020/01/28/vsan-design-considerations-fast-storage-devices-vs-fast-networking/

데이터 센터에서 가장 높은 수준의 성능을 제공하는 것은 많은 측면을 가진 도전이다. 어떤 개별적인 하드웨어나 소프트웨어 구성요소를 결정하는 것이 가장 중요한지, 아니면 모든 변수가 서로 지워지지 않는 결속력을 가지고 있기 때문에 잠재적인 병목현상을 결정하는 것은 대답하기 어렵다. 이것이 내가 이러한 영향 요인을 분해하는 프레임워크를 사용하여 Troubleshooting vSAN Performance를 구성한 이유 중 하나이다.

많은 사람들에게, 하이퍼 컨버전스 아키텍처를 중심으로 구축된 아키텍처들은 이 미스터리를 더한다. 성능 중심의 vSAN 클러스터에 더 중요한 요소: 빠른 스토리지 장치 또는 빠른 네트워킹? 이것은 일반적인 질문이며, 답은 둘 다 중요하지만, 환경에 미치는 영향이 어떻게 다른지 더 잘 이해하기 위해서는 어느 정도 정교함이 필요하다.

vSAN의 I/O 처리

vSphere의 장점 중 하나는 우선 순위를 매기는 능력이다. 하이퍼바이저에 내장된 스케줄러의 정렬은 vSAN, 스토리지 I/O와 마찬가지로 호스트 CPU 프로세스, 수신 및 송신 네트워크 작업을 관리한다. 커널 수준의 공정이기 때문에, 그것은 비상한 효율로 수행된다.

vSAN은 자체 스케줄러를 사용하여 스택에서 실행되는 다양한 유형의 스토리지 I/O를 식별하고 우선 순위를 정한다. 이는 부분적으로 vSAN 6.7에 도입된 적응형 Adaptive Resync 기능을 매우 효과적으로 만드는 것이다. 이러한 메커니즘은 호스트에 로컬인 I/O 작업의 우선 순위를 지정하는 데 도움이 된다는 점에 유의한다.

저장 장치

논의 내용을 솔리드 스테이트로 제한하더라도 스토리지 장치의 물리적 성능은 상당히 다양하다. SATA, SAS 및 NVMe 장치는 일관성과 더불어 최고의 성능에서 극적인 차이를 보인다. 3D XPoint(예: Intel Optane)와 같은 최신 기술이 NAND와 관련된 장애물 중 일부를 극복했기 때문에 NAND 플래시를 사용하는 가장 빠른 NVMe 장치도 성능 언덕의 왕이 아니다. 업계는 빠르게 움직이지만 vSAN의 아키텍처 덕분에 이러한 기술을 시장 및 데이터 센터의 수요에 따라 점진적으로 도입할 수 있다.

고성능 vSAN 클러스터를 계획할 때는 버퍼 계층 및 용량 계층에서 고속 스토리지 디바이스가 필수 사항이다. 저장 장치는 데이터 경로의 "최종 마일"에 속하며, 성능이 낮은 장치는 필요한 성능 기대치를 충족할 수 있는 능력을 손상시킬 수 있다.

네트워킹

네트워크 스위치와 그것에 연결되는 인터페이스 카드는 모든 것을 함께 접착하는 것이다. 네트워킹은 많은 I/O 활동이 로컬 호스트 이상으로 확장되어야 할 수 있기 때문에 HCI에서 특히 중요한 역할을 한다. 불행히도, 최대 포트 속도로 스위치 사양을 참조하는 업계 관행은 스위치 기어에 관한 모든 중요한 세부사항을 무시한다. 스위치 기능은 백플레인 대역폭, 스위치에서 사용할 수 있는 포트 버퍼링의 양, 그리고 ASIC가 환경의 "초당 패킷" 처리 요건을 충족할 만큼 강력하고 풍부한지와 같은 다른 요인에 의존한다. 다른 사람들이 그들의 성능 문제의 원인을 정확히 지적하는 것을 도울 때, 그리고 나는 그들의 교환기에 대해 물어볼 때, 불행하게도, 그 반응은 종종 "10 기가비트"보다 길지 않다. 존 니콜슨은 이 주제에 대해 언급하는 일련의 좋은 글들을 가지고 있으며 그와 브록 얀다가 제시한 VMworld 세션을 보는 것도 당신의 시간을 들일 가치가 있다.

스위치기어의 또 다른 과제는 일반적인 생산 수명이 데이터 센터의 다른 자산보다 길다는 것이다. 수명이 길어진다는 것은 미래의 요구를 더 잘 알고 아마도 당신이 원하는 것보다 더 빨리 그것에 투자해야 한다는 것을 의미한다.

서로 관계를 유지하는 방법

vSAN과 같은 호스트 기반 스케줄러는 호스트에 의해 생성되거나 호스트의 하드웨어 스택으로 유입될 때 I/O의 우선 순위를 정한다. 그것은 네트워크 인식 기능을 가지고 있지 않으며 호스트로 전송되기를 기다리는 에테르에는 다른 패킷이 없다고 가정한다. 그러나 크기가 작거나 성능이 좋지 않은 스위치의 경우, 이러한 현상이 발생할 수 있다. 네트워크가 어떤 형태로 포화상태(대역폭, 처리 및 버퍼링 한계 등)를 경험하고 있는 경우, TCP의 규칙을 따를 수 있다. 패킷 감소율이 증가하여 패킷 재전송도 증가한다. TCP는 강력하지만, 포화 상태를 처리하는 단계는 성능과 일관성을 최대로 높이는데 비용이 많이 든다. 더욱 심각한 것은 이러한 포화 상태가 스위치에 연결된 모든 시스템에 영향을 미칠 수 있다는 것이다.

더 높은 성능의 네트워킹으로 전환하는 것을 고려하는 일부 사람들은 즉각적인 이익을 얻고 방금 지불한 모든 대역폭 기능을 즉시 사용할 것을 원한다. CPU, 네트워킹 또는 스토리지의 리소스 활용률이 그렇게 작동하는 경우는 거의 없기 때문에, 그렇게 보는 것은 잘못된 방법이다. vSAN 환경의 경우 적절한 크기의 스위치에 투자하면 네트워크 포화로 인한 스위치 병목현상으로 인한 vSAN의 일관성 없는 스토리지 성능 저하를 최소화하거나 제거할 수 있다.

예를 들어 고객이 현재 적당한 10Gb 스위치를 사용하고 있고 25/100Gb를 고려하고 있다면, 그 가치는 스위치의 활용률에서 오는 것이 아니라, 네트워크가 경합 지점이 되는 것을 막고, 호스트가 이러한 가능성에 도달하지 못하게 하는 것이다. 호스트의 성능 기능이 증가함에 따라 네트워크도 증가해야 한다는 점을 기억해야 한다.

요약

성능 최적화는 병목 현상을 식별하고 제어하기 가장 쉬운 위치로 옮기는 경우가 많다. 더 높은 품질의 더 빠른 성능의 스위치 기어에 투자하면 복잡한 스케줄러를 통해 더 쉽게 제어할 수 있고 더 빠른 스토리지 장치를 통해 잠재적 경합이 호스트로 다시 전환될 수 있다. 양호한 스위치는 실제로 초기 비용을 가지고 있지만 vSAN이 더 빠르고 새로운 하드웨어를 쉽게 수용할 수 있는 기능과 더 긴 스위치의 수명주기를 고려할 때, 데이터 센터 설계에 있어 현명한 단계다.