Posts Tagged: ‘infosphere’

Teil 2 meiner Artikelserie über BigData

20. Dezember 2012 Posted by Romeo Kienzler

 Im zweiten Teil der Serie über BigData möchte ich einige interessante Usecases von IBM vorstellen.
 
IBM Watson:

Watson, der Supercomputer welcher Anfang 2011 die beiden Jeopardy - Champions geschlagen hat
vereint zwei der Paradigmen, welche für alle BigData Projekte gelten. Einen modernen und
fortschrittlichen Algorithmus und die technische Möglichkeit diesen Algorithmus in kurzer 
Zeit auf sehr grosse Datenmengen anzuwenden.

Der Algorithmus bei Watson ist ein System welches DeepQA genannt wird (http://www.research.ibm.com/deepqa/deepqa.shtml). Es handelt sich hierbei um eine Weiterentwicklung
klassischer QA (Question Answering) Systeme. Kern von DeepQA ist die Erweiterung der
klassischen, Wissensbasierten Systeme um eine statistische Komponente die die neusten Entwicklungen
der NLP (Natural Language Processing) Forschung einfliessen lässt. 

Um nun diesen Algorithmus in ausreichender Geschwindigkeit mit Daten zu füttern hat sich IBM der allerneusten Power -- Prozessortechnologie  http://www-03.ibm.com/systems/power/index.html bedient. Kern bei dieser Prozessorgeneration ist die Tatsache dass sich ein Teil des Hauptspeichers nun auf dem Prozessorkern selbst befindet. Durch Zusammenschaltung von 2880 solcher CPU Kernen war
es möglich den Text des gesamten englischsprachigen Internets (dedupliziert nur ca. 1 TB!) auf den CPU Kernen zu speichern und somit die Suchanfragen in einer Taktfrequenz von über 5 Ghz auszuführen.

Die Ergebnisse der Suchanfrage wurden von DeepQA ausgewählt und je nach statistischer Zuversichtlichkeit des Systems
als mögliche Antwort vorgeschlagen. Hier musste extrem auf den Echtzeit-Aspekt wert gelegt werden da die Kandidaten
den „Buzzer" auch im Millisekundenbereich gedrückt haben.


Vestas:

Vestas stellt u.a. Windkraftanlagen her, möchte aber seine Kunden auch optimal beraten, wo diese Windkraftanlagen
am besten aufgestellt werden. Hierfür haben sie ein auf 2.8 PB (PetaByte, 1000 TB = 1 PB) Daten basierendes System entwickelt welches für eine Berechnung drei Wochen benötigt hat. Mit dem IBM BigInsights System und 15000
CPU Kernen wurde die Antwortzeit auf 15 Minuten verringert. Das System kann ohne Software seitigen Anpassungen
vergrössert werden, Vestas möchte das System innerhalb der nächsten Zeit auf 20 PB vergrössern.
 
 
Datenüberwachung einer Neugeborenen Intensivstation:

Mittels der IBM InfoSphere Streams massive parallelen und In-Memory Dataprocessing Middleware werden 16 Sensor-Streams von Neugeborenen in Echtzeit überwacht. Mithilfe eines statistischen Modells kann das System eine
Infektion 24 Stunden vor einem menschlichen Experten vorhersagen. Dieser Zeitvorsprung kann lebensrettend sein.
 
 Video 
 
Im nächsten Teil werde ich noch einige interessante Nicht-IBM Usecases aufzeigen um dann in die Technik einzutauchen.

Ich wünsche allen frohe Weihnachten und einen guten Rutsch ins Jahr 2013.