Posts Tagged: ‘lob-cloud’

Cloud macht Analytics Beine

22. Oktober 2013 Posted by Philipp Boltze

 

Bild

Wer letzte Woche auf der IBM Business Connect in Mannheim war, wird meinen Vortrag mit gleichem Titel vielleicht schon gehört haben. Für alle Anderen möchte ich hier aber nochmals beschreiben, warum Cloud und Analytics so wunderbar zusammen passen ....

 

BildImmer mehr Leute ....  wollen immer mehr Daten .....  in immer anderen Formen  ....  immer schneller  .....   analysieren. So oder so ähnlich mag der Leiter Business Intelligence - Mr. B.I. -  eines großen Konzern gedacht haben, als er mit seinem Problem zu uns kam.
Aber das oben Beschriebene ist eigentlich gar nicht ein Problem an sich. Dumm ist nur, dass die dafür erforderliche IT Infrastruktur exponentiell wächst (2 x 2 x 2 x 2 = 16!). Und das noch Dümmere ist, dass so eine BI Umgebung ja nicht immer den gleichbleibenden IT Bedarf analog zu einer Glühbirne benötigt, sondern es Lastspitzen gibt und die Hardware muss so groß ausgelegt werden, dass auch die Lastspitzen abgefangen werden können. Ganz schön doof, ganz schön umflexibel und ganz schön teuer!

 

Tja, und wie können wir nun diesem armen Mann helfen? 

"Was wäre denn, wenn Sie unbegrenzte IT Ressourcen hätten und für diese auch nur so lange zahlen müssten, wie Sie sie benötigen?"    -   "EIN TRAUM!"

 

Der aufmerksame Leser wird sicher schon ahnen, was jetzt kommt:       Ab in die Cloud!

 

Schnell war klar, dass wir hier den Beweis antreten mussten. Ein Proof of Concept.

 

Und das Konzept war einfach: Lade Deinen Daten in unsere IBM Cloud. Wir bereiten ein DB2 und ein Cognos Image soweit vor und können nun beide so oft und so viel hoch- und runterfahren wie wir wollen. Also mal ein einzelner Cognos Server, mal 3 parallel. Je nachdem, was benötigt wird.

 

Die Ergebnisse konnten sich mehr als sehen lassen. 

Bild

Ich will sie auch gar nicht weiter kommentieren.

 

Ein wichtiger Punkt dabei ist es natürlich, wie ich dieses "Atmen" des Systems, also das Hinzufügen und Wegnehmen von Instanzen realisiere. Erst wenn ich das mache, kann ich die Vorteile der Cloud, z.B. stundenweise Abrechnung, nutzen. Wir haben uns dabei zwei mögliche Varianten angeschaut:

Bild

  1. Zeitgesteuert
    Aus Erfahrung weiß man, daß Montag früh z.B. viele Nutzer sich ihre Reports holen und dass am Mittwoch Nachmittag eher Saure-Gurken-Zeit ist. Basierend auf diesen Erfahrungswerten kann man, durch sog. Scripte gesteuert, Instanzen hinzufügen und wieder wegnehmen. Man kann damit allerdings nicht auf unvorhersehbare Ereignisse reagieren. Zumindest nicht automatisiert.
     
  2. Workload gesteuert
    Die andere Möglichkeit ist es, sich die Anfragen anzuschauen, und ähnlich wie an der Aldi Kasse einfach neue Instanzen (Kassen) hinzufügen, wenn die Schlange zu lang wird. Da das Hinzufügen eines neuen Servers allerdings einige Minute in Anspruch nimmt, muss man sich auch anschauen, wie viel im Einkaufskorb, respektiv wie umfangreich der Report ist und die Warteschlange entsprechend bewerten. Hier gehört durchaus etwas Intelligenz rein; man bekommt dann aber auch ein System, dass sehr schnell auch auf unerwartete Gegebenheiten reagiert.

 

 

Aber was haben wir daraus gelernt?

 

  • Clouds, zumindest wenn man sie sich mit Anderen teilt (shared), können zwar kaum Leistungsgarantien geben, aber zumindest die IBM Cloud hat trotzdem alle Erwartungen mehr als übertroffen.
    Wer jetzt noch auf Private Clouds geht, wie sie SoftLayer anbietet, der bekommt nicht nur eine stundengenaue Abrechnung, sondern muss sich die Leistung noch nicht mal mit Anderen teilen. (siehe dazu sich meine Blog zu SoftLayer)
     
  • Das Hinzufügen und Wegnehmen von zusätzlichen Cognos Instanzen geht sehr schnell und einfach
     
  • Es muss im Einzelfall geprüft werden, ob man die kostengünstigere, zeitgesteuerte Variante nehmen kann, oder doch den Aufwand betreiben muss, die Workload qualitativ zu bewerten.
     
  • Ganz entscheidend, und damit kommen wir zum berühmten Bottleneck der Lösung, ist die Verbindung zwischen dem Datenpool und der Cloud. Ich muss wissen, wie viele Daten in die Cloud transferiert werden müssen und vor allem auch welche Spitzenlast, also wie viele Daten in einem bestimmten Zeitraum übertragen werden müssen. Dies bestimmt dann die Verbindung: Entweder eine einfache VPN Verbindung oder doch eine Direktverbindung mit extrem hohem Datendurchsatz.
     
  • Und zum Thema Datenschutz muss sich natürlich jeder selbst Gedanken machen. Hier muss man aber vor allem prüfen, WELCHE Daten ich wirklich in die Cloud transferieren muss, um daraus Reports zu ziehen. Eine Versicherung ist sicher eher an der Auswertung der etwas unkritischeren Rechnungsdaten interessiert und nicht an der Krankenakte des Kunden.

 

Sie sehen an diesem Beispiel, wie einfach und sinnvoll es ist, Analytics in der Cloud zu betreiben. Sprechen Sie uns doch einfach mal an, wenn auch Sie an einem Test (PoC) interessiert sind.