Voice Commerce: viele Geräte, viele Experimente.

von Gastautor am 12.März 2018 in News, Trends & Analysen

Sprachassistenten wie Amazons Alexa bieten vielfältige Funktionen – aber zum Einkaufen werden sie bislang nur selten genutzt (Bild: Shutterstock)

Von Stephan Lamprecht

Eingaben in natürlicher Sprache werden den Umgang mit Technik vollständig ändern. Da herrscht weltweit unter Experten Einigkeit. Aber bis zum perfekten Einkaufshelfer ist es noch ein weiter Weg.

Eine repräsentative Umfrage der Unternehmensberatung PwC aus dem Juni 2017 zeigt, welche Dynamik sich im Markt für sprachgesteuerte smarte Lautsprecher abspielt. Erst im Februar des Jahres konnte das erste Echo-Modell von Amazon auch ohne Einladung von den Kunden direkt bestellt werden. Und wenige Monate später gaben 5 Prozent der Deutschen an, bereits ein solches Gerät zu benutzen. Kein Wunder, dass die Großen der IT-Branche schnell versuchen, sich zu positionieren. Schließlich geht es um viel Geld. Dabei haben die Unternehmen gar nicht so sehr den Verkauf der Hardware im Blick. Natürlich werden auch hier in Zukunft die klassischen Mechanismen aus dem Bereich IT- und Unterhaltungselektronik greifen. Mit jeder neuen Produktversion wird in den Augen der Konsumenten das Gerät, das in den eigenen vier Wänden steht, immer unansehnlicher, bis es eben gegen die neueste Generation ausgetauscht wird.

Viel entscheidender ist allerdings der Lock-in-Effekt. Wessen Lautsprecher erst einmal auf die Kommandos der Konsumenten hört, hat dort auch gleich sein Ökosystem aufgebaut. So hat es der Mitbewerber schwer. Und so bietet Google mit seinem Home ebenfalls einen intelligenten Lautsprecher, während Apple mit seinem Home Pod recht spät auf der Bildfläche erschienen ist und deswegen sein System auch eher über dessen klanglichen Qualitäten positioniert.

Viele Handelsmanager dürften angesichts des neuen Geräts den Hut vor Amazons Innovationsfreude gezogen haben. Ein Lautsprecher, der auf Kommando direkt Artikel beim Alleshändler bestellt. Das sieht auf den ersten Blick nach der perfekten Basis für den Verkauf des eigenen Sortiments aus. Und damit nach einer idealen Lösung für den Verkauf im Zeitalter nach dem Webshop.

Viel eingekauft wird derzeit noch nicht

Positioniert werden die smarten Lautsprecher als Helfer im Alltag. Mit einem Sprachkommando steuern sie verschiedene Bausteine im Smart Home (Licht- oder Temperatursteuerung), erinnern an Termine oder spielen Musik oder Hörbücher aus dem Bestand des Kunden bzw. von einem Streamingdienst. Und sie geben auf alle erdenklichen Fragen eine mehr oder weniger zufriedenstellende Antwort. Voraussetzung dafür ist jedoch, dass die bevorzugte Suchmaschine eine Lösung anbietet, oder aber ein entsprechender Skill vorliegt und vom Nutzer aktiviert wurde. Und natürlich könnte darüber auch eingekauft werden. Aber gerade das tun die Nutzer bislang noch kaum, wie eine Umfrage von ComScore ergeben hat, die Statista in der folgenden Infografik visualisiert:

Das hat verschiedene Ursachen. Auch wenn die Spracherkennung bereits sehr ausgereift erscheint, ist sie technologisch eben gerade noch nicht so weit, tatsächlich jeden Tonfall und jede Variante in der Aussprache zu erkennen. Besonders dann, wenn ein Kontext fehlt. Die Stolpersteine liegen hier in den Details. Wie ein Praxistest zeigt, kann der einfache Begriff “H-Milch” die Worterkennung bereits ins Schleudern bringen. Und welcher Nutzer hat dann noch Lust, mehr Zeit in die Suche zu stecken, wenn bereits diese einfache Abfrage nicht zu einem positiven Ergebnis führt? Hier wird die weitere Entwicklung sicherlich eine bessere Erkennungsrate herbeiführen. Aber bei dieser Kernfunktionalität sind alle Anbieter von den Entwicklern der jeweiligen künstlichen Intelligenz (Amazon, Google, Apple) abhängig.

Zum anderen sind viele Skills derzeit auf einem Stand, der an die Frühzeit der App-Entwicklung für Smartphones erinnert. Sie werden zwar schnell auf den Markt gebracht, bieten aber derzeit noch wenig Nutzen. So hat Real einen Alexa Skill herausgebracht, der zwar Rezepttipps oder Neuigkeiten aus dem nächsten Markt anbietet, aber bislang keine Einkaufsmöglichkeit.

Aus Sicht der Verbraucher ist ein Grundproblem des Amazon Echo, dass die Funktionen in Sachen Kaufberatung bislang eher dürftig sind. Und aus Sicht des Handels, die ebenso überschaubaren Möglichkeiten, die Entwicklung von Skills auch wieder zu monetarisieren. Mehr oder weniger bedenkenlos dürfte sich die Spracheingabe für den Kauf von Convenience-Produkten eignen. Einen Karton Waschmittel oder einen Beutel Espressobohnen dürften die meisten Kunden auch ohne großes Nachdenken per Sprache in den Einkaufswagen legen. Allerdings ist hier auch für den Handel am einzelnen Produkt kaum etwas zu verdienen. Die Margen sind dabei so klein, dass schon große Stückzahlen abverkauft werden müssten, um die Entwicklungskosten eines Skills wieder einzuspielen.

Doch bereits bei nur etwas komplizierteren Produkten müsste der Kunde dann schon sichergehen, dass der Sprachassistent die richtige Ware bestellt. Eine Glühbirne mit der Fassung E27 mag zwar technisch mit der Leuchte kompatibel sein, passt aber nicht automatisch. Bei Mode oder Haushaltsgeräten sind die Gewinnspannen zwar deutlich besser, aber welcher Kunde bestellt schon eine Waschmaschine, ein paar Jeans oder modische Sneaker, ohne diese vorher einmal gesehen zu haben?

Neue Echos sollen es richten

Das Problem mit der mangelnden visuellen Rückmeldung hat auch Amazon bereits erkannt und seine Produktlinie entsprechend vergrößert. Der Echo Show bietet auch ein Display an, das nicht nur für die Wiedergabe von Filmen oder zur Durchführung von Video-Telefonaten genutzt werden kann, sondern den Kunden auch die Rückmeldung zu Produkten geben könnte, die vor dem eigentlichen Kauf entscheidend ist. Der Echo Look, dessen Kamerafunktion in erster Linie den Modekäufer im Blick hat und dessen “Compare” Funktion verschiedene Outfits vergleicht, dürfte durch den Echo Show schon fast wieder obsolet sein.

Es braucht Benutzeroberflächen, die Sprache in den Vordergrund stellen

Smarte Sprachsysteme sind derzeit technologisch noch weit entfernt davon, die Rolle eines Verkäufers oder eines gut strukturierten Shops zu übernehmen. Dazu bedarf es in erster Linie noch mehr Intelligenz und Benutzeroberflächen, die auf die Spracheingabe optimiert sind und den Kunden in regelmäßigen Abständen Rückmeldung geben. Schon die Anschaffung eines einfachen Haushaltsgeräts wie eine Espressomaschine bringt aktuelle Skills an ihre Grenzen. Siebträger, Halb- oder Vollautomat? Boiler oder Kessel? Ein oder zwei Heizkreise? Das sind nur einige der Fragen, die vor der Anschaffung eine Rolle spielen. Hier braucht es regelmäßige Nachfragen und schrittweises Vorangehen. Die Auswahlmöglichkeiten wieder zurück auf das Display zu delegieren, würden nur eine andere Art des Webshops schaffen.

Die Sprachtechnologie hat viel Potenzial. Im Bereich Buchungen, Supportanfragen und gerade auch der lokalen Suche (Siri, wo ist die nächste Filiale eines Schlüsseldienstes?) wird Sprachtechnologie langfristig viel verändern. Beim Einkaufen muss sich indes noch etwas tun: Händler sollten API-basierte Lösungen aus der Cloud nutzen, die auf das vorhandene Produktioninformationssystem zugreifen können, und sich auf ein gutes Voice Interface konzentrieren.

Whitepaper „Jenseits des Webshops“

Dieser Beitrag erschien zuerst in unserem neuen Whitepaper „Jenseits des Webshops – wie Händler Chatbots, Voice & Co einsetzen können“. In dem Whitepaper erklären wir auf 36 Seiten, welcher geschäftliche Mehrwert hinter neuen Touchpoints steckt und wie eine konkrete Umsetzung aussehen kann.

Lesen Sie in dem Whitepaper „Jenseits des Webshops“ u.a. folgende Themen:

  • Eyerywhere Commerce: Was uns jenseits des Webshops erwartet
  • Warum Unternehmen mit neuen digitalen Touchpoints experimentieren sollten
  • Umfrage: aktuelle Technologie-Trends im Handel
  • Wie das Internet der Dinge in Küche und Bad einzieht
  • Shoppen im Auto: Schon bald Realität

Das Whitepaper können Sie über den folgenden Link kostenlos als PDF anfordern:

Whitepaper „Jenseits des Webshops – wie Händler Chatbots, Voice & Co einsetzen können“ 


Artikel teilen




Abonnieren Sie den kostenlosen Newsletter von Location Insider. Wir liefern darin täglich gegen 11 Uhr business-relevante Hintergründe zur Digitalisierung des Handels.

Hiermit akzeptiere ich die Datenschutzbestimmungen.