2-Node Storage Spaces Direct Cluster beim Kunden

Vorab: S2D ist eines der unterschätzten Microsoft-Features. Es liefert Hyperconverged-Setups, die mit deutlich teureren Lösungen wie Nutanix konkurrieren können, und das auf Basis von Windows Server Datacenter, das in vielen Umgebungen ohnehin lizenziert ist.

01 WARUM 2 KNOTEN

Der Kunde, ein mittelständischer Produktionsbetrieb, hatte rund 40 VMs in zwei klassischen Hypervisoren am End-of-Life. Cloud war keine Option (regulatorisch, Latency zur Produktions-IT). Drei oder mehr Nodes wären überdimensioniert. Zwei Knoten mit File Share Witness in unserem Datacenter treffen den Sweet-Spot.

02 HARDWARE-AUSWAHL

Dell PowerEdge R760xs pro Knoten: 2× Intel Xeon Gold, 512 GB RAM
9× NVMe-SSDs pro Knoten als Mixed-Use Storage Pool
2× 25 GbE Mellanox für RDMA-Direktverbindung (RoCE)
2× 10 GbE für Client-Traffic (Trunk)
iDRAC + redundante Netzteile (Standard)

Die Direktverbindung der zwei Knoten ohne Zwischenswitch war eine bewusste Entscheidung: weniger Latency, keine Switch-Failover-Probleme, einfachere Konfiguration. Bei mehr als drei Knoten geht das nicht; bei zweien ist es perfekt.

03 KONFIGURATION

Storage Pool als Two-Way-Mirror, weil bei zwei Knoten Three-Way nicht geht. Das heißt: jeder Block existiert genau zweimal, auf beiden Nodes. Resilienz gegen Komplett-Ausfall eines Nodes ist gegeben, gegen Doppel-Fehler nicht. Der Trade-Off ist klar: 50 % der Brutto-Kapazität ist nutzbar, dafür eine extrem einfache Topologie.

Quorum löst der File Share Witness in unserem DC Wien. Damit haben wir den klassischen Split-Brain-Schutz, ohne einen dritten Knoten irgendwo aufstellen zu müssen.

04 REALE IOPS-ERWARTUNGEN

Wir messen seit dem Go-Live regelmäßig. SQL-Workloads des Kunden (gemischt OLTP + Reporting) sehen typischerweise:

Read-IOPS: stabil über 200 000 (NVMe ist da konsequent)
Write-IOPS: ca. 80 000 sustained. Jeder Schreibvorgang landet wegen des Mirrors auf beiden Knoten, die effektive Schreibrate liegt also rund bei der Hälfte der Roh-Leistung.
Latency P99: unter 1 ms, entscheidend für die Reporting-Queries des Kunden

Wichtig: das sind Werte unter Produktionslast, nicht aus einem synthetischen Benchmark.

05 WAS WIR GELERNT HABEN

Failover-Cluster-Manager-Updates müssen geplant werden. Kein spontanes "Windows Update Tuesday".
S2D-Tooling in Windows Admin Center hat sich in den letzten Versionen stark verbessert. Lohnt sich.
NVMe-Firmware-Updates sind ein eigenes Kapitel. Wir orchestrieren das über Ansible.
Backup mit Veeam funktioniert ohne Überraschungen, wenn man die VMs cluster-aware konfiguriert.

Wenn Sie eine ähnliche Plattform brauchen, am eigenen Standort oder in unserem Datacenter, sprechen Sie mit uns: Kontakt-Seite oder telefonisch unter +43 (0)1 235 1277.

2-NODE S2D
CLUSTER
BEIM KUNDEN
VOR ORT.

01 WARUM 2 KNOTEN

02 HARDWARE-AUSWAHL

03 KONFIGURATION

04 REALE IOPS-ERWARTUNGEN

05 WAS WIR GELERNT HABEN

WEITERE ENGINEERING-NOTES.

2-NODE S2D CLUSTER BEIM KUNDEN VOR ORT.

01 WARUM 2 KNOTEN

02 HARDWARE-AUSWAHL

03 KONFIGURATION

04 REALE IOPS-ERWARTUNGEN

05 WAS WIR GELERNT HABEN

WEITERE ENGINEERING-NOTES.

MAC-BASIERTE ZUGANGSKONTROLLE

HARDWARE-PORTFOLIO ERWEITERT

ARGOCD IM PRODUKTIVBETRIEB

2-NODE S2D
CLUSTER
BEIM KUNDEN
VOR ORT.