Posts Tagged: ‘Spracherkennung’

Voice Search wird in 2020 erwachsen – Ich glaube nicht dran

15. Januar 2020 Posted by Stefan Pfeiffer

Die Propheten, die den Siegeszug von Sprache als ultimatives Interface für IT-Lösungen vorhersagen, gibt es schon lange. In dieses Horn stößt auch Dustin Coates auf CMSWire im Thema suchen per Sprache:

People are comfortable with voice and in five years, they will want this voice experience in their homes, in the store and everywhere in between (public and private spaces). Imagine walking into Home Depot and getting what you need — without ever speaking to a human. That day is coming.

Voice Search Will Mature in 2020

Und auch der DMEXCO Newsletter und Beitrag stößt in dieses Horn:

Laut einer aktuellen GfK-Studie im Auftrag von Mastercard Deutschland nutzen aktuell 34 Prozent der Deutschen digitale Sprachassistenten. 26 Prozent können sich zudem vorstellen, per Sprachbefehl einzukaufen. Verschiedene Prognosen gehen davon aus, dass bereits im nächsten Jahr mehr als die Hälfte aller Suchanfragen per Sprache erfolgen wird.

Das sind die Digital-Marketing-Trends 2020 I DMEXCO

Meine Erfahrungen sind anders, wie ich kürzlich geschrieben habe. Solange die Sprachassistenten uns – und es liegt diesmal, wie mir Freunde bestätigt haben, nicht nur an mir, meiner Aussprache und Stimme – nicht wirklich verstehen, sind sie unbefriedigend. Die Tage bin ich daran gescheitert, die Öffnungszeiten meines Sportfachgeschäfts einfach mal so zu recherchieren. Am Sonntagabend war mein HomePod nicht in der Lage, eine Playlist abzuspielen. Solange solch tägliche Dinge nicht einfach funzen, so lange wird es keinen generellen Siegeszug von Voice geben.

Zur Ehrenrettung: Angeregt durch LiveDirector Maurice diktiere ich jetzt immer mehr Nachrichten, die dann per Signal oder anderem Messenger verschickt werden. Ist wirklich komfortabel, auch wenn es zu mehr oder weniger witzigen Verwechselungen kommen kann. Wenn die Reise nach Rom zur Reise nach Rum wird, kann die Frage, ob ich was getrunken habe, durchaus kommen. Also lieber Korrektur lesen. Sollte man eh tun, wenn ich an die leidige Autokorrektur denke.

Und noch eine Bemerkung zu Dustin Coates: Für mich ist die Vision, in ein Geschäft zu gehen, und mit niemanden zu sprechen, nicht unbedingt die erstrebenswerte rosarote Zukunft.

Bild von Giacomo Zanni auf Pixabay

Zurück in die Zukunft: Text, Bilder und Sprache oder wo IBM Watson-Technologie Box im Dokumentenmanagement hilft

24. Mai 2019 Posted by Stefan Pfeiffer

Zurück in die Zukunft, in meine Dokumentenverwaltungs- und Enterprise Content Management-Vergangenheit: Quasi Heimspiel hatte ich am gestrigen 23. Mai im Gespräch mit Jord Arjen Sward von Box und Andreas Schönknecht von der IBM. Box als Anbieter von Dokumenten- und Dateimanagement für Unternehmen hat vor geraumer Zeit eine zehnjährige Partnerschaft mit der IBM geschlossen. Dies manifestiert sich nicht nur im gemeinsamen Vertrieb der Lösungen, im möglichen Hosting der Lösung in der IBM Cloud oder auch der IBM-internen Nutzung von Box – wir managen die Dateien für unser Livestudio-Projekt in Box -, sondern auch in der Integration von IBM Technologien wie IBM Watson über sogenannte Box Skills with Watson.

Jord demonstrierte uns, wie mit Hilfe  solcher Skills, mit Hilfe von künstlicher Intelligenz „powered by IBM Watson“, in Box verschiedenartige Dateien von Word-Dokumenten (über Watson Natural Language Understanding) bis zu Bildern (über Watson Visual Recognition) automatisch verschlagwortet und klassifiziert werden können. Solche Skills gibt es auch für Spracherkennung über Watson Speech-to-Text.

Damit adressiert man eine der wesentlichen Schmerzen der Anwender: die Verschlagwortung von Dokumenten. Freiwillig ist sie nur zu selten erfolgt. Wenn – so meine Erfahrung in DMS- und ECM-Projekten der vergangenen 20 Jahre – mussten die User eben über Muss-Felder gezwungen werden, Dokumente zu klassifizieren. Das hat sicher nicht zur Akzeptanz der Systeme beigetragen.

Auf der anderen Seite ist aber eine vernünftige Verschlagwortung für die spätere Suche – man denke insbesondere an Images/Bilder und Sprachdateien- unverzichtbar. Eine Volltextsuche funktioniert eben nicht immer. Auch kann der Erkennung von Eigenschaften eines Dokuments der Ausgangspunkt für einen Workflow, eine Prozess innerhalb des Unternehmens sein. Jord zeigte Standard-Skills von IBM Watson, die branchen- und anwendungsspezifisch „aufgebohrt“ werden können, um noch besser in bestimmten Einsatzgebieten zu erkennen und zu verschlagworten. Danke an Andreas und Jord für das kurzweilige Gespräch.

 

Schluss mit dem Smartphone und die Gedanken sind (noch) frei!?!

18. Oktober 2018 Posted by Stefan Pfeiffer

Ein sehr einprägsamer Titel in der Frankfurter Allgemeinen Sonntagszeitung, die das Leben nach dem Smartphone voraussagt (Der Artikel scheint nicht frei online verfügbar zu sein, muss also bei FAZ.NET „gekauft“ werden). Macht natürlich auch mich neugierig, da ich das Gefühl habe – auch privat – ohne Smartphone vor der Nase geht es nicht mehr. Wenn dann zusätzlich noch IBM-Kollege Dirk Wittkopp aus dem Labor zitiert wird …

Der Beitrag von Corinna Budras geht auf die Einschränkungen des Smartphones ein. Man braucht halt doch immer noch seine Hand oder Hände und manchmal die „Tastatur“. Das geht besser. Auch heute schon. Mit der Smartwatch telefonieren oder im Auto mit der Freisprecheinrichtung. Und das oft schon per Sprachsteuerung.

Da sind wir natürlich auch schon bei einer der Weiterentwicklungen – und nHerausforderungen. Dialekte und Sprachfärbungen, Jargon und spezielles Vokabular wird oft schlecht oder nicht verstanden. Doch die Spracherkennung wird immer besser und Alexa & Co sind in vielen Haushalten schon Realität. Und immer mehr Geräte werden „sprachgewaltig“ und können als Telefon genutzt werden. Meine Bedenken gegenüber potentiellen Wanzen im eigenen Heim (oder auch im Büro) habe ich hier ja oft geäußert.

Und halten wir uns vor Augen und im Gedächtnis: Oft ist es ja auch gar nicht mehr „telefonieren“, was mit den Smartphone gemacht wird. Muss ich an der Kasse per Smartphone zahlen? Das kann ich gegebenenfalls auch mit der Uhr oder einem anderen „intelligenten Gerät“ machen. Funktionen und Apps, die wir heute nur auf dem Handy ausführen, wandern ganz sicher auf Smarthome- und mobile Geräte.

Und die Entwicklung geht unaufhaltsam weiter. Schon wird die Stimmung, in der sich jemand befindet, durch Sprachanalyse erkannt. Oder aber es werden per Video Körpersprache und Gesichtsausdruck analysiert. Und an nächsten Stufen wird – so der Beitrag – wird wohl gearbeitet: Mit Hilfe künstlicher Intelligenz sollen Gedanken gelesen werden. Ich „denke“ meine nächste E-Mail und wenn ich „Senden“ denke, wird sie versandt. Da habe ich dann doch noch meine Bedenken … Aber man wird die weitere Entwicklung sorgfältig verfolgen müssen.

(Stefan Pfeiffer)