Votre assistant vocal partage votre regard sur le monde

votre assistant

S’il est une chose qui manque à votre assistant vocal, c’est bien une paire d’yeux, la vôtre de préférence. Certes, certains devices conjuguent caméra et assistant vocal, pourtant aucune ne voit comme vous. Du moins, plus pour longtemps ! La solution : WorldGaze, une technologie développée par trois chercheurs du Carnegie Mellon Institute : Gierad Lapu, Chris Harrison and Sven Mayer. Ces chercheurs sont justement spécialisés dans le domaine des interactions homme-machine.

Démonstration de la technologie WorldGaze ou comment donner des yeux à votre assistant.

Imaginez un monde où votre assistant vocal serait en mesure de voir ce que vous voyez. Il serait alors capable de vous expliquer ce que vous avez sous les yeux sans que vous ayez besoin de le décrire. Même chose pour la domotique ou quoi que ce soit d’autre, plus de problème pour activer tel ou tel device.

Comment votre assistant voit-il ce que vous voyez ?

Rien de surprenant : l’IA exploite les caméras de votre smartphone pour en retirer du contexte. Car là se trouve la faiblesse des assistants vocaux : la compréhension du contexte. La caméra située à l’arrière du smartphone permet à votre assistant de comprendre ce que vous regardez. À l’inverse, la caméra avant l’aide à traquer vos mouvements oculaires. Ces deux caméras offrent un champ de vision à 200 degrés.

Grâce à la conjugaison des deux et aux informations collectées, extraites de votre intent et de ce qui vous entoure, l’assistant est en mesure de déduire du sens du contexte. Il vous suffit alors de passer devant un restaurant et de poser une question relative aux horaires d’ouverture. À condition que vous le fixiez des yeux et que vous positionnez correctement votre smartphone, votre assistant sera en mesure de vous répondre. Même chose pour les avis client ou toute autre information.

Le futur des assistants vocaux ?

Il est aisé d’imaginer les potentielles applications concrètes pour une telle technologie. Rien qu’en termes de voice commerce, elle permettrait d’offrir une expérience réellement immersive et de donner vie aux wishlists jusque-là virtuelles. Pour ce faire, il serait nécessaire de recourir à la réalité augmentée pour pouvoir scanner un QR code ou l’étiquette d’un produit. Il serait alors possible d’obtenir des informations ou de l’ajouter directement à une liste.

En attendant une intégration future dans des lunettes connectées, les utilisateurs devront se contenter de brandir leur smartphone. Une piètre contrainte au regard du potentiel d’une telle technologie. Un grand pas pour l’ambient compunting mais aussi pour la technologie vocale !

Inscrivez-vous à la newsletter vokode

Recevez chaque semaine le meilleur de l’actualité à propos des assistants vocaux et des innovations liées à l’audio digital. 

Les articles similaires

Roberto Parada TheAtlantic

Le Moulin à Paroles #41

Le Moulin à Paroles : la revue de presse par l’équipe de Vokode. Nous vous proposons une sélection d’articles sur la technologie vocale et son

Lire plus »