La compréhension des informations contextuelles par les assistants vocaux demeure encore un challenge pour les chercheurs et designers. Or, Amazon travaille d’arrache-pied sur le sujet puisque son assistant vocal aura bientôt une meilleure prise en compte du contexte.
Un décryptage de notre historique
Plus exactement, Alexa sera en mesure de s’inspirer de notre historique de conversation pour répondre avec davantage de précision. Ainsi, il suffit d’une simple conversation avec un ami devant votre enceinte connectée ou smartphone – après prononciation du wake word – pour qu’Alexa se rappelle du contenu de vos échanges.
Mettons que la conversation portait sur un restaurant particulier, l’assistant vocal vous le proposera si vous cherchez à sortir diner. Il s’agit de compréhension contextuelle, capitale au bon déroulement d’un échange verbal. Pour l’instant seuls deux interlocuteurs humains en étaient pleinement capables mais il semble que l’IA soit sur le point de nous rattraper.
Un progrès de taille
L’équipe responsable de cette prouesse a expliqué son travail dans un article intitulé « Dialog State Tracking: A Neural Reading Comprehension Approach« . On y apprend notamment qu’Alexa a vu la précision de ses réponses améliorée de 6,5%. Récemment, l’assistant s’était vu attribuer la troisième place en termes de précision des réponses après Google Assistant et Siri. A l’inverse, l’assistant vocal d’Amazon se classait second en termes de compréhension des questions. Cette comparaison avait été menée par Gene Munster et Will Thompson de l’entreprise Loup Ventures.
Étonnamment, l’assistant vocal d’Amazon était également à la traine en ce qui concerne les questions relatives au commerce.
Pour rappel, les chiffres étaient les suivants (sur 800 questions issues de cinq catégories) :
- Google Assistant :
- 100% de questions comprises
- 99,2% de réponses correctes
- Siri :
- 99,8% de questions comprises
- 83,1% de réponses correctes
- Alexa :
- 99,9% de questions comprises
- 79,8% de réponses correctes
Grâce à cette amélioration, Alexa serait bientôt en mesure de proposer 96% de bonnes réponses. Une progression permise par le machine learning et semblable à la compréhension de la lecture.