samedi 13 janvier 2018

Le nouveau départ des interfaces vocales

Ce Noël, vous ne pouviez pas rater les assistants vocaux sous le sapin. Que ce soient ceux de Google, d'Amazon, ou des autres acteurs qui les suivent (Sonos, Bose,...). Et comme la bataille pour la domination de cette nouvelle interface vocale dans la maison se joue maintenant, quand le père Noël ne l'offre pas, ces acteurs donnent leur version d'entrée de gamme via des offres combinées avec d'autres produits compatibles (ex. Thermostat + Enceinte). 

Ce billet est pour GreenSI l'occasion d'explorer l'arrivée dans le grand public d'une interface déjà exploitée dans les entreprises : le vocal. 
En 2018 les prévisions sont la vente de 56 millions enceintes intelligentes, soit une progression de +70% sur un an, pour une catégorie de produits créée par Amazon en 2014 aux États-Unis, suivi par Google en 2016.


C'est de l'autre côté de l'Atlantique que se feront la majorité des ventes mondiales. La Chine, est également vue comme le pays n°2 des ventes ; un paradoxe quand ni Amazon ni Google n'y sont prédominants. Ceci démontre la force du concept de cette nouvelle interface conversationnelle, déjà copiée par les BATX, parlant chinois, mais aussi anglais. Le premier est Xiaomi, qui a lancé en 2017 un produit au nom sans aucune équivoque de "AI speaker". Il sera prochainement suivi par Alibaba.

En France, le lancement de Google Home cet été, avant Amazon Echo, le taux de pénétration de Google dans le search en France (94%, plus fort qu'aux États-Unis), et le prix d'entrée de la Google Mini a moins de 50€, fait que GreenSI ne serait pas surpris si les chiffres montrent que Google dépasse Amazon sur le marché national dès 2017.

Les entreprises ont déjà exploité l'interface vocale pendant plus de 10 ans. Par exemple dans les centres d'appels avec les serveurs vocaux interactifs (SVI). Cependant, les choix de navigation sur ces serveurs restent souvent bien limités même si la reconnaissance vocale s'est un peu développée. Appeler son opérateur ou sa banque sur un SVI est vécu par beaucoup comme une contrainte et souvent la frustration d'un choix limité par rapport à un contact humain. Le résultat n'est pas en général une expérience utilisateur hors du commun. 

Les enceintes connectées, elles, ont la chance de se lancer sur des sujets plus "légers" (météo, ciné, wikipedia, musiques...) où vous n'attendez pas nécessairement de régler un problème critique pour votre journée ou votre épargne. Mme Michue sera donc certainement plus indulgente... à moins de confondre Johnny et JJ.Goldman ;-) 

Mais comme leur reconnaissance vocale est radicalement plus performante que celle des SVI, s'appuyant sur l'intelligence artificielle (y compris reconnaissance de votre voix), il sera intéressant de voir si les assistants s'imposeront comme des compagnons à qui finalement les humains aiment parler. Et si c'est le cas, les SVI vont rapidement prendre un sacré coup de vieux...

Puis vers la fin des années 2000, quand la téléphonie a rejoint les standards de l'internet (avec la VoIP) l'entreprise a pu imaginer et concevoir des applications vocales, c'est à dire construites sur sa plateforme téléphonique sous IP, qui met en réseau la majorité de ses salariés et qui peut être reliée aux données des applications de gestion :
  • Ainsi, un responsable de magasin peut être appelé par une application métier, sur son téléphone mobile, pour lui donner le niveau de stock d'un produit dont les ventes marchent bien ce jour.
  • Un commercial, pendant une vente, peut appeler une application de configuration du produit qu'il vends (voiture, ordinateur, ...) et obtenir directement par la voix un prix lui permettant de faire un devis.
  • Un magasinier peut, en main libre, être piloté pour traiter une commande par une interface vocale qui lui donne l'emplacement des produits ("picking") et suivre la complétude de la préparation.
  • Mais l'application la plus commune entre ces deux mondes (vocal, applicatif), reste certainement l'envoi d'un email, suite à un appel manqué, avec en pièce jointe un message vocal numérisé.
Ces applications exploitant des interfaces vocales existent donc déjà dans l'entreprise, mais force est de constater qu'elles ne se sont pas beaucoup développées.

La porte ouverte par ces enceintes connectées va être de réinventer ce type d'applications vocales avec ceux qui les achètent, pour l'instant les clients particuliers.

Aujourd'hui, les technologies sous-jacentes des enceintes connectées sont différentes. Elles exploitent une reconnaissance vocale de meilleur niveau, dans de multiples langues, et surtout sont connectées aux services disponibles en temps réel sur Internet.

Mais attention toutes les reconnaissances vocales ne se valent pas. Si vous voulez éviter les "oopss, je ne comprends pas", il vaut mieux choisir celles qui sont déjà au point dans la langue souhaitée. Le test de poser 5000 questions aux assistants mobiles montre un pourcentage de questions reconnues de moins de 70% et un taux de réponses correctes de 60% à 90% selon les enceintes. 


Sans surprise, celui qui a le plus de données d'interactions avec des humains pour son moteur de recherche est le meilleur pour les comprendre...
Ces enceintes permettent d'écouter la musique, mais surtout elles peuvent rechercher le web et activer des services applicatifs qui se seront rendus compatibles. Le thermostat connecté Nest (acheté par Google) mais également Netatmo, sont compatibles avec Google Home et peuvent être réglés et interrogés par la voix. Ce sont les nouvelles applications vocales qui remplacent l'usage d'une Apps sur son smartphone ou les boutons sur les thermostats.

Amazon a aujourd'hui beaucoup de services applicatifs et vous pouvez déjà par exemple commander un taxi ou une pizza (selon les pays). Mais vu le rythme des ventes et donc des développeurs qui rejoignent le développement sur ces nouvelles plateformes, comme pour les Apps mobiles, ça peut aller très vite.
L'intégration de ces plateformes (pas que la partie émergée : l'enceinte) est donc la clef.

Et là vous savez que GreenSI va vous rappeler de vérifier avec  votre DSI si vos applications clients ont bien des API pour s'intégrer à ces futures plateformes. Et puis comme la conversation doit être naturelle, ces API seront certainement dans le Cloud avec assez de puissance à la demande pour avoir des temps de réponse excellents.

On est donc au tout début du retour de l'interface vocale dans l'entreprise.

Son nouvel objectif : entrer en relation avec ses clients et imaginer une nouvelle expérience d'achat et ou de service clients. Et puis pourquoi pas dans quelques temps imaginer des usages pour les salariés eux-même, par exemple dans les applications collaboratives de communication et de gestion de tâches.

De l'autre côté de cette interface, les internautes se retrouvent comme au début du web, avec un "navigateur vocal" dans les mains leur permettant d'accéder à une masse d'information... mais sans trop savoir quoi demander !
Pour en tester un, j'avoue qu'il y a au départ un peu la même excitation qu'au début du Net, dès qu'on découvre un nouvel usage.

Les premiers assistants vont bien sûr chercher à éduquer ces premiers utilisateurs, dans l'intérêt du financement de leur service à long terme. Donc leur apprendre des services qu'ils sauront valoriser...

En effet, comme avec le web, si l'équipement est acheté au départ par le client, il faudra bien financer la reconnaissance vocale sur le long terme. La publicité, les recommandations, voire la vente de produits et services, vont donc certainement venir s'incruster rapidement dans cette interface. Comment, et de façon non-intrusive, restent à imaginer...

Certains vont donc crier au loup et les articles sur "faut-il acheter un assistant" et "quelles recommandations de la CNIL quand on en achète un" se multiplient. Par rapport à la révolution précédente du web qui a laissé les cookies proliférer sans contrôle, l'encadrement veut s'organiser plus en amont.
Sans aucun doute, ces enceintes vont capturer et exploiter encore plus de données personnelles et comportementales. Les données des européens seront sous la surveillance du RGPD, mais pas celles des américains et des chinois qui vont tirer le marché et la technologie. Les versions européennes seront-elles bridées ? (voir RGDP l'épée de Damoclès sur l'innovation européenne)

Et puis une fois adoptées (et l'opt-in validé) il sera difficile de revenir en arrière et les utilisateurs l'accepteront en échange de la nouvelle expérience rendue possible par cette interface vocale. Qui a fermé son compte Gmail quand il a appris que l'analyse des emails personnels permettait de cibler la publicité ?
Alors, même si ces enceintes n'étaient pas sous votre sapin, surveillez quand même le développement du retour du vocal dans les entreprises en 2018. La souris, le clavier et l'écran ne seront plus les seuls moyens pour vos applications d'interagir avec vos clients et pourquoi pas avec vos salariés.
Previous Post
Next Post
Related Posts

L'humour de ceux qui aiment le numérique