Jusque-là l’assistant Alexa d’Amazon lisait les textes comme elle s’adresse aux utilisateurs. Le problème avec ce style de lecture est qu’une élocution qui convient à un échange n’est pas nécessairement la plus indiquée pour la lecture d’un texte. En particulier d’un texte long qui nécessite de respecter la structure du texte au risque de perdre l’attention de l’auditeur.
Justement, l’assistant Alexa s’est récemment doté d’un nouveau « style vocal ». Plus approprié à la lecture de textes, Alexa respecte désormais les temps de pause mais pas seulement. En effet, l’assistant vocal peut maintenant faire intervenir d’autres protagonistes.
L’assistant Alexa en constante amélioration
Les utilisateurs de l’assistant vocal le savent : celui-ci se dote de nouvelles fonctionnalités toutes les semaines. En témoigne le mail envoyé hebdomadairement et intitulé « les nouveautés Alexa ». Or, c’est sur le blog des développeurs Amazon que cette nouvelle a été relayée. Une fois n’est pas coutume : il faudra attendre pour voir ce mode débarquer en France.
Il est pour l’instant réservé aux Etats-Unis. Les utilisateurs américains de l’assistant Alexa peuvent maintenant lui faire lire des articles, pages web voire podcast. L’assistant doit son nouveau style vocal au deep learning ou plus précisément à un modèle de synthèse vocal exploitant le deep learning.
La technologie en question n’est pas comparable à celle de WaveNet, le réseau neuronal exploité par Google mais l’objectif s’en approche. Il s’agit d’améliorer la voix ou « style vocal » de l’assistant.
Amazon ouvre la voix ?
Le concurrent de Google marque des points en termes de synthèse vocal au sens large. Amazon a récemment annoncé avoir introduit dix voix de synthèse supplémentaires à Amazon Polly. Les marques peuvent bénéficier de cette solution et choisir parmi un catalogue de voix de synthèse ou bien créer la leur.
Le réalisme des voix des assistants vocaux semble devenir une problématique centrale en termes d’expérience utilisateur. Le style vocal serait-il le prochain bastion à conquérir pour les géants de la voicetech ?