Sélectionner une page

Smarthome Academy – Episode 40 : Pourquoi exploiter un assistant vocal indépendant d’internet ?

par | Mar 22, 2019 | Podcast

Le cloud a ses avantages mais aussi ses limites. A l’ère du logement connecté contrôlable par la voix, une entreprise française présente une particularité, celle de proposer un assistant vocal indépendant d’internet.

1- Pour débuter ce nouvel épisode, peux-tu nous décrire, qui tu es et quel est ton background ?

Je m’appelle Valentin et je suis Product Manager chez Snips. Avant de rejoindre l’équipe, j’ai travaillé dans une entreprise spécialisée dans le hardware et dans une startup software. J’ai pu profiter du meilleur des deux mondes !

2- Peux-tu nous décrire ce qu’est Snips ?

Snips est une solution technologique d’interface vocale, plus précisément de reconnaissance vocale, qui fonctionne on device et qui n’a donc pas besoin de connexion internet pour traiter la voix.

Nous sommes aujourd’hui une entreprise de 70 personnes, dont le siège est à Paris mais qui est également présente à New-York et Tokyo.

3- Comment ça fonctionne ?

La solution de reconnaissance vocale de Snips est relativement simple. Un outil en ligne, appelé Console, permet de créer et d’entrainer son assistant afin de le personnaliser, de rajouter des paramètres et des phrases d’entrainement propres au vocabulaire de l’utilisateur. Lorsque cet assistant est finalisé, il est entrainé grâce au moteur de machine learning afin de créer le modèle qui sera ensuite téléchargé sur l’objet connecté. Celui-ci n’aura donc pas besoin de connexion internet pour fonctionner.

4- A qui s’adresse votre solution ?

La solution Snips s’adresse à de multiples entreprises, aussi bien l’industrie aéronautique que les entreprises spécialisées dans l’IoT ou bien le secteur médical. En d’autres termes, toute industrie ayant une interface homme machine. La voix étant plus naturelle et rapide qu’un clavier, il est donc logique qu’une grande partie de ces interfaces soient à terme remplacé ou bien amélioré en ajoutant une brique technologique vocale.

Ces industries ont besoin d’une technologie à condition d’être fiable, sécurisée et efficace.

5- Pourquoi avoir opté pour un assistant vocal indépendant d’internet ?

Chez Snips, nous partons du principe qu’il n’est pas nécessaire d’avoir une connexion à internet et d’envoyer ses données (d’autant plus lorsqu’il s’agit de la voix, qui est une donnée biométrique) sur des serveurs à des milliers de kilomètres pour qu’une requête soit analysée, que la réponse soit envoyée et que l’action soit effectuée.

Plus simplement, il est illogique que pour allumer une lumière chez soi, il faille envoyer l’information à l’autre bout du monde avec tout ce que cela implique comme danger de sécurité (perte de connexion, panne de serveur, manque de sécurité etc.) alors qu’il est tout à fait possible de réaliser exactement la même action, si ce n’est mieux, en local et de manière totalement sécurisée.

6- En termes de confidentialité, mes données seront donc conservées exclusivement dans mon domicile ?

Tout à fait, en tant qu’utilisateur, lorsque la solution est implémentée au sein d’un objet du
quotidien comme une machine à café par exemple, il n’est pas nécessaire d’envoyer la voix
vers un serveur. Avec Snips, toute la voix est traitée en local sur la machine.

7- On peut donc se passer d’internet pour contrôler son logement intelligent ?

Oui, il est tout à fait possible de contrôler son logement sans connexion internet. Bien entendu, il faut rappeler que si l’utilisateur fait appel à une application de service tierce, comme la météo, en utilisant l’assistant, la commande vocale sera traitée localement sur l’appareil mais il faudra bien une connexion internet afin de permettre à l’assistant d’aller chercher l’information demandée sur un serveur. C’est également le cas pour la musique ou d’autres services.

8- Quels sont les dispositifs pouvant intégrer Snips ?

Si on reste dans le domaine de l’IoT, tout objet connecté susceptible d’avoir une interface entre l’homme et l’objet peut intégrer la technologie de Snips que ce soit une montre, une machine à café ou encore une lampe.

9- Est-il possible de personnaliser le nom de la commande d’éveil du dispositif comme par exemple “Hey cafetière” ou encore “Hey Delonghi” ?

Tout à fait, nous travaillons aussi bien avec des entreprises, que des makers, des développeurs ou encore des utilisateurs souhaitant intégrer la solution chez eux. Nous proposons donc le personnal wake word et l’universal wake word. Ce dernier « Hey Snips », est entrainé sur un modèle composé de plusieurs milliers de personnes ayant des accents et des âges différents pour être adapté à tous les utilisateurs qui prononceront ce wake word.

Le personnal wake word, mis en place gratuitement pour les makers et les développeurs, permet de personnaliser un wake word qui sera créé sur-mesure et donc entraîné avec la voix de l’utilisateur. Il suffira à ce dernier de répéter plusieurs fois le mot choisi pour que le personnal wake word soit opérationnel.

10- Quelle est en moyenne, la distance maximale de communication entre la personne et Snips ?

Nous sommes une solution software et donc agnostique de l’hardware utilisé en arrière-plan. C’est à l’entreprise ou aux makers d’intégrer un hardware compatible, comme par exemple un micro longue portée en fonction du besoin de l’utilisateur de la qualité attendue et du prix.

11- Peut-on exploiter des services cloud via votre solution Snips ?

On peut tout à fait exploiter des services cloud avec Snips, dans tous les cas la voix sera toujours traitée par l’appareil en local, sans perte de données et sans envoi de celles-ci sur un serveur tiers. En fonction des applications qui seront utilisées (météo, musique, horaires de cinéma) il faudra faire un call API extérieur pour aller chercher ces informations qui seront envoyées sous la forme d’une suite de caractères (fichier .Json).

12- Quelles sont les langues disponibles pour communiquer avec Snips ?

Aujourd’hui nous avons plusieurs langues disponibles : le français, l’anglais, l’espagnol, l’allemand, le japonais et l’italien et nous travaillons déjà sur d’autres langues qui arriveront prochainement.

13- Les géants Amazon, Google et Apple ont aussi développé des assistants vocaux mais dépendants d’internet. Quelle est votre stratégie pour vous différencier de ceux-ci ?

Tout d’abord, nous ne sommes pas en concurrence « frontale » avec eux, ni une solution alternative puisqu’il est tout à fait possible pour l’objet d’être hybride et de pouvoir intégrer aussi bien Snips en local que Google pour obtenir des services tiers. Google et Alexa sont des assistants généralistes et donc fonctionnels sur un certain nombre de sujets, mais ils sont moins performants lorsqu’il s’agit d’aller dans un secteur vertical. L’alternative proposée par Snips consiste à s’appuyer sur la spécialisation et d’intégrer un assistant qui a été entraîné avec un vocabulaire spécialisé sur un sujet particulier. Nous ne cherchons pas à faire un assistant aussi généraliste que Google qui pourra répondre au travers de la machine à café aux requêtes sur la météo ou les séances de cinéma, mais plutôt de proposer un assistant suffisamment robuste et spécialisé pour que cette machine à café puisse répondre sur tout l’univers du café. Snips offre ainsi aux entreprises, makers et développeurs une possibilité de personnalisation complète, puisque tous ont un vocabulaire différent, une demande et un besoin de wake word spécifique ou des outils et des appareils différents. Contrairement aux solutions des GAFA, l’utilisateur n’a pas besoin de se plier à
une documentation spécifique.

14- Hôtels, bateaux, salles de réunion… quels sont les lieux dans lesquels, Snips peut avoir toute son importance ?

La voix est l’élément de communication le plus naturel, le but est donc de pouvoir s’affranchir d’un vocabulaire ou de phrases préprogrammées. Il faut que ce soit la machine qui comprenne l’utilisateur et non pas l’inverse.

La valeur ajoutée de Snips par rapport aux GAFA est que notre solution peut fonctionner même dans des endroits ne bénéficiant pas d’accès à internet, comme dans un parc public, sur un bateau ou encore dans le secteur de l’aéronautique. Mais Snips est également particulièrement adapté aux acteurs des industries qui ont un besoin de sécurité : industries médicales, industries civiles sensibles, bancaires… qui sont susceptibles d’avoir besoin d’un assistant fonctionnant entièrement localement sans perte de souveraineté de leur marque.

15- Pensez-vous que l’avenir d’un environnement connecté sera de tout contrôler par la voix ?

On y vient ! Le marché de la voix à une croissance encore plus forte que celui dusmartphone et de plus en plus de machines sont équipées d’assistants vocaux qui s’améliorent de jour en jour et deviennent plus rapides, plus performants, avec plus de langues et davantage de compréhension. Tout cela nous montre bien une importante évolution du marché de la voix même s’il y aura toujours besoin pour certains éléments d’une forme de retour, qu’il soit visuel avec un écran, tactile avec une télécommande etc. La voix n’est pas amenée à remplacer toutes les interfaces actuelles mais à les compléter, les améliorer.

16- Quelles sont les prochaines évolutions prévues au sujet de Snips ?

Il y en a beaucoup ! Tout d’abord nous avons récemment reçu le Best of Innovation Award 2019 au CES ainsi que le Best In Show Award au salon Embedded World de Nuremberg. Aujourd’hui, nous sommes particulièrement concentrés sur le marché des entreprises qui privilégient de plus en plus les assistants vocaux. Notre priorité est d’améliorer le développement de la console qui est l’interface en ligne pour personnaliser et créer son assistant. Cela passe par l’ajout de davantage de fonctionnalités qui sont actuellement en développement et seront proposées aux makers et aux entreprises.

Par ailleurs, l’accès à cette console et la possibilité de création d’un assistant est totalement gratuite pour les développeurs et les makers, à partir du moment où il n’y a pas d’usage commercial.

Restez connecté sur l'actualité domotique!