HPC in der Cloud: Ein Rechenbeispiel im Juli 2010
In diesen Tagen ist auch im HPC-Umfeld der Begriff “Cloud-Computing” in aller Munde bzw. Blogs. Angefeuert wurde das durch “Amazons EC2 Cluster Compute”-Angebot. Neben den herkömmlichen virtualisierten Maschinen bietet Amazon jetzt auch HPC-Maschinen an. Die sind dann hardware-virtualisiert und haben 2 Nehalem-CPUs mit 23 GB Hauptspeicher. Vernetzt sind sie mit 10 Gbit/s-Ethernet.
Um das Angebot zu positionieren, hat Amazon einen Linpack-Lauf durchgeführt. Mit 880 nodes (7040 cores) sind sie auf fast 42 TFlop/s gekommen. Das wäre Platz 146 gewesen in der aktuellen Top500-Liste 2010.06. Aufgefallen ist mir die für Top500-Systeme recht geringe Effizienz von ca. 50%. Damit liegen sie am unteren Ende der Gigabit-Ethernet-Systeme. In den oberen Ebenen der Top500 wird inzwischen Infiniband als Netztechnik bevorzugt (damit ließe sich der Linpack-Wert mit ca. 4200 cores erreichen).
Die nächste Frage ist: Was kostet das eigentlich? Es gibt wohl zwei unterschiedliche Preismodelle: On-demand oder reserved. Bei beiden können über das Web-Interface maximal 8 nodes gebucht werden. Wer mehr will, kann über eine separate Bestellung auch mehr bekommen.
On-demand kostet eine CPU-Stunde $1,60. Reservieren kostet $4290 (1 Jahr) oder $6590 (3 Jahre) pro node plus $0,56 pro Stunde. Auf 1 Jahr kostet dann ein ausgelasteter node $9199 bei Reservierung oder $14026 on-demand.
Rechnen wir mal den Cluster mit 8 nodes und nehmen dabei eine Auslastung von 70% an, was für existierende Cluster eine gute Auslastung darstellt. Das sind also pro Node $4290 plus 70% von 8766 Stunden zu $0,56, macht ungefähr $7800. Mit 8 nodes sind das dann $62400. On-demand wäre das 70% von 8766 Stunden mal $1,60 mal 8 nodes: $79000. Wie man sieht, werden die Zahlen schnell größer. (Ich runde recht großzügig auf, es geht mir um die Größenordnung. Viele Nebenkosten wie Storage, Datentransfer, Erstellen der Images etc. sind unberücksichtigt).
Vergleichen wir das mit den Anschaffungskosten für einen Cluster: Ganz grob angenommen, kostet ein Twin-Computenode €5000, also $6500. Bei 8 nodes, die drei Jahre laufen werden, sind das $26000, $8700 pro Jahr. Um die laufenden Kosten nicht zu kompliziert zu machen, berücksichtigen wir nur die Stromkosten. Bei 750W pro Twin-Node (unter Volllast) sind das im Jahr 26300kWh, in der Größenordnung von $6800. Macht zusammen $15500. Aufpreis für Amazon: $46000.
Ob dieses Preis-/Leistungsverhältnis passt, muss jeder für sich selbst entscheiden. Der Knackpunkt an dem Angebot ist die Auslastung des Clusters. Ab einer Auslastung unter 20% (ganz, ganz ungefähr) ist Amazon billiger als eigene Hardware. Damit ist Amazon CCI aus Kostengründen für den kommerziellen Einsatz nicht mehr so interessant, da hier die Cluster meistens recht gut ausgelastet sind.
Eine Schwierigkeit für die Nutzung mit kommerzieller Software ist die Lizensierung. Bei Amazon werden bisher keine Lizenzen angeboten, und die üblichen Lizenzbedingungen verbieten das Übertragen der Lizenz auf den gehosteten Cluster.
Unterschied zu den bisherigen Anbietern mit HPC-artigen Systemen: Da gibt es derzeit zwei, Penguin Computing und sgi. Beide sind von den Preisen her höher, haben dafür aber ausgewiesene HPC-Kompetenz und bieten zusätzliche Leistungen an. Bei Penguin gibt es beispielsweise Infiniband, sgi kann zusätzlich Lizenzen für verschiedene Software-Pakete wie Gaussian, STAR-CCM+ und LS-DYNA anbieten.
Wie bei allen gehosteten Diensten gibt es noch weitere offene Fragen: Wie kommen eigentlich die Inputdaten in den Cluster und die Ergebnisse wieder zurück? Bei Berechnungen kommen da schnell mehrere Gigabyte zusammen. Und: Wie ist es denn um die Sicherheit der Daten bestellt? Gerade wenn die Daten in anderen Ländern landen, kann das problematisch werden.

abonnieren













[...] Angebot einsparen kann. Das Ergebnis: Man spart gar nichts, man zahlt sogar deutlich drauf. Ein Beispielcluster aus 8 Nodes, der zu 70% ausgelastet ist, kostet je nach Abrechnungsmodel bei Amazon zwischen 62.400 [...]
[...] die renommierte HPC-Gruppe hat das nachgerechnet und sich den (kostengünstigen) Marktführer AMAZON zur Brust [...]
[...] of Science + Computing, Julian found much to the contrary – you actually pay far more. Using a example cluster consisting of 8 nodes at 70% capacity, at Amazon you would pay US $62,400 – 79,000 per year. If [...]