Posts Tagged: ‘datenbank’

Informix Warehouse Accelerator: Ein Jahr im Rückblick (3)

11. Mai 2012 Posted by Martin Fuerderer


Icon: IWA Logo TruckMit den Themen Funktionalitätserweiterungen und Ausblick möchte ich nun die Serie (siehe auch Teil 1 und Teil 2) abschliessen.

Den Originaltext finden Sie (in englischer Sprache verfasst) auf developerWorks im Blog von Fred Ho.

Funktionalitätserweiterungen

Seit Erscheinen des Informix Warehouse Accelerators vor einem Jahr haben wir einige bedeutende Features hinzugefügt. Die wichtigsten sind folgend mit jeweils einer kurzen Beschreibung aufgelistet:

  • Workload Analysis Tool
    Ermöglicht die einfache Definition von Data Marts, die auf dem Accelerator anzulegen sind, ohne Detailswissen über die Workload zu erfordern. Man lässt einfach die normale Workload laufen (mit oder ohne tatsächliche Ausführung) und lässt das Tool die Abfragen analysieren und die Data Mart Definitionen im XML Format erzeugen. Diese werden dann benutzt, um die Data Marts anzulegen und mit den Daten zu laden.
  • Datenerneuerung bei kontinuierlicher Verfügbarkeit
    Obwohl eine Studie der IDUG zeigt, dass 90% der Data Warehouses nur einmal am Tag oder weniger oft aktualisiert werden, können Kunden, die ihr Daten öfter erneuern müssen, einen zweiten Data Mart (mit komprimierten Daten) aufbauen. Durch Umschalten zwischen den zwei Data Marts zur jeweils aktuelleren Kopie kann eine bessere Datenaktualität erzielt werden, ohne zwischendurch auf die Beschleunigung verzichten zu müssen.
  • Unterstützung für Cluster
    Der Informix Warehouse Accelerator kann sowohl auf einer Standard SMP Maschine laufen, als auch auf einem Cluster System, wie es z.B. typisch für eine Blade Server Konfiguration ist. Dies ermöglicht dem Accelerator die Nutzung von noch mehr CPU cores und Speicher der beteiligten Clusterknoten verglichen mit einem Einzelsystem. Der Accelerator partitioniert die Daten von Fakttabellen effizient über die Clusterknoten hinweg und repliziert die Dimensionstabellen für optimale Performance. Die Anzahl der Coordinator- und Workerknoten des Accelerator kann entsprechend skaliert werden.
  • Partition Refresh
    In der kommenden Version 11.70.FC5 wird es zwei bedeutende Funktionalitätserweiterungen geben. Mit der derzeitigen Version des Informix Warehouse Accelerators müssen die Daten komplett neu in den Data Mart geladen werden, wenn dieser nach Datenänderungen in der Informix Server Datenbank wieder auf den neuesten Stand gebracht werden soll. Das neue Partition Refresh Feature hingegen erlaubt dem Benutzer, die Daten einzelner Partitionen (bei Informix auch Fragmente genannt) im Data Mart zu erneuern. Wurde z.B. ein Data Warehouse in Terabytegrösse schon in den Accelerator geladen und danach nur eine kleine Datenmenge (z.B. einige GB) in bestimmten Tabellenfragmenten geändert, so können die den geänderten Tabellenfragmenten entsprechenden Partitionen aus dem Data Mart im Accelerator entfernt werden, um dann gezielt nur die geänderten Tabellenfragmente als neue Partitionen wieder zu laden. Dies verkürzt die Ladezeit erheblich. Bei anderen Systemen werden solche Verfahren oft Incremental Update oder Trickle Feed genannt.
  • Das Laden von Daten von einem Informix Mach11 Secondary Server aus
    Von den Vorteilen der Informix Replikation (auch unter dem Stichwort MACH11 bekannt) kann man auch mit dem Accelerator profitieren. Z.B. kann ein Secondary Informix Server in einem MACH11-Verbund mit dem Accelerator verbunden werden, damit zur Administration des Accelerators und seinen Data Marts benutzt werden, die Daten in den Accelerator laden, und ebenso Abfragen mit dem Accelerator beschleunigen. Solch ein Secondary Server kann ein Informix HDR, RSS oder auch ein SDS Knoten im MACH11-Verbund sein. Dadurch wird eine effektive Lastverteilung erreicht, denn der Primary Informix Server muss sich nicht um den Accelerator kümmern und steht mit all seinen Ressourcen für OLTP zur Verfügung. Die Möglichkeit, solche gemischten Arbeitslasten mit ein und demselben System zu bedienen, ist einer der heiligen Grale für Datenbankmanagement.
    • HDR = High availability Data Replication (Secondary)
    • RSS = Remote Standalone Secondary
    • SDS = Shared Disk Secondary
Ausblick

Unser Ziel ist, die Basis zu erweitern für unsere Informixkunden mit einem Bedarf für komplexe Datenanalyse. Natürlich wollen wir auch über Bestandskunden hinaus neue Kunden hinzugewinnen. Obwohl es im Information Management Portfolio der IBM überlappende Produkte gibt, sind wir der meinung, dass die fortschrittliche In-Memory Technoligie des Informix Warehouse Accelerators gepaart mit den Stärken des Informix Server im OLTP ein einzigartiges Angebot zu einem Preis wie kein zweites ist.

Weitere Informationen: Über einen Kommentar zu einem der blog-Einträge hier, oder auch (in englisch) bei Fred Ho direkt: hof@us.ibm.com .


Informix Warehouse Accelerator: Ein Jahr im Rückblick (2)

4. Mai 2012 Posted by Martin Fuerderer



Icon: IWA Logo Truck Nach dem ersten Teil des Jahresrückblicks mit dem Thema Technologie geht es diesmal um bisherige Verkäufe und um den Wettbewerb zum Informix Warehouse Accelerator.

Verkäufe

Der mit dem Informix Warehouse Accelerator im ersten Jahr erzielte Umsatz, das wichtigste Erfolgsmaß für jedes Produkt - speziell für ein neues Produkt innerhalb IBM-Information Management-Informix - war mehr als respektabel und auf jeden Fall im Millionenbereich (genaue Zahlen können hier jedoch nicht genannt werden). Es gibt schon eine Anzahl von Kunden, verteilt über verschiedene Geografien und verschiedene Industriezweige, einschliesslich Einzelhandel, Versicherungen, Hotelwesen, Energieversorgung, sowie im öffentlichen Bereich. Noch wichtiger ist, dass es Partner gibt, die mit ihrem eigenen Angebot auf Basis des Accelerators selbständig und erfolgreich Verkäufe abgeschlossen haben. Informix war schon immer ein sehr Partner-orientiertes Produkt und der Informix Warehouse Accelerator ist hier keine Ausnahme. Dies gilt besonders für Mittelstandskunden, wo geringe Kosten von größter Wichtigkeit sind. Mit einem aggressiven Zeitplan für eine Anzahl von Workshops und Bootcamps überall auf der Welt wurden unsere Partner geschult, was auch 2012 das ganze Jahr über weitergeführt wird.

Wettbewerb

Jeder Anbieter auf dem Markt scheint dieser Tage zu behaupten, dass er analytische Abfragen schnell durchführen kann. Schliesst man Angebote spaltenorientierter Datenbanken mit ein, sind es 10 bis 20 konkurrierende Produkte in diesem Bereich. Die meiste Aufmerksamkeit erhielt HANA von SAP, das viele Eigenschaften und Funktionalitäten mit dem Informix Warehouse Accelerator gemeinsam hat. Dies ist günstig für uns, denn durch das erhöhte Bewusstsein der Möglichkeiten einer in-memory Datenbank, speziell entwickelt für Data Warehousing im industriellen Einsatz, werden Kunden die Unterschiede zwischen Informix Warehouse Accelerator und HANA weiter untersuchen.

Wir haben schon Vergleichszahlen (basierend auf realen PoCs von Kunden) gegenüber Produkte anderer Anbieter, z.B. Teradata und SQL Server, und spaltenorientierter Datenbanken von Anbietern wie Greenplum und Ingres VectorWise. Wir können erfreut berichten, dass wir in diesen Vergleichen gut dastehen, sowohl bezüglich Performance als auf TCO. Daher sind uns solche Vergleiche willkommen.

Im nächsten blog-Eintrag betrachten wir die wichtigsten der vielen Funktionalitätserweiterungen, die der Informix Warehouse Accelerator schon im ersten Jahr erfahren hat.