+33 (0)1 69 33 05 50

Actualité et agenda de l'AFTI

La montée en puissance des machines parlantes

La montée en puissance des machines parlantes

Depuis quelques années, la réalité a rejoint la fiction et la machine est dorénavant capable de dialoguer avec l’homme. À travers les robots, les objets connectés, les smartphones et les ordinateurs, les machines donnent de la voix et nous communiquent des informations. Qu’il s’agisse de voix numérique ou humaine, la technologie vocale est devenue une part indissociable des innovations en matière de développement logiciel.

Les parcours de formation en alternance de l’ AFTI – Ecole supérieure du numérique offrent de larges perspectives dans les domaines de la conception d’applications, de l’expertise logicielle et la cybersécurité. Des programmes complets et pointus sont proposés pour acquérir les compétences indispensables à la technologie vocale et répondre aux nombreux besoins du marché de l’emploi.


Parmi les cursus les plus pertinents en matière de technologies vocales, on retrouve :
ETGL – Expert en Ingénierie de Développement et logiciels
CDA – Concepteur Développeur d’Applications


 

La voix, la manière la plus naturelle de communiquer

La technologie vocale n’en est encore qu’à ses prémices, mais semble promise à un bel avenir.  Bien qu’en 2018, seulement 5 % des Français possèdent une enceinte connectée, une étude conjointe d’Hadopi et du CSA indique que 46 % des internautes ont déjà utilisé un assistant vocal. Rien d’étonnant puisque la communication orale est de loin la plus rapide et pratique avec 200 mots par minute contre 31 à l’écrit. L’interface vocale est d’une importance capitale dans de nombreux secteurs d’activité. On la retrouve notamment dans l’automobile pour des raisons évidentes de sécurité et de confort. Bientôt un assistant vocal intégré sera en mesure d’engager une conversation à partir du choix de destination et du parcours. Plus besoin d’écrans, ce dernier propose un service oral de navigation, de commande des diverses fonctionnalités, et même d’information ou de divertissement. En dehors de la voiture, le principe est le même et risque de gagner rapidement la maison, le travail, les magasins et bien d’autres lieux.

 

La technologie des interfaces vocales en plein boum

Les divers objets connectés à assistance vocale sont devenus des produits de consommation de plus en plus communs dans le paysage numérique. Après Apple, Google, Amazon et Microsoft se sont lancés dans le domaine et cherchent à développer leur utilisation au plus grand nombre. Dans son baromètre de juin 2019 sur les enceintes à commande vocale en France, Médiamétrie estime le nombre d’utilisateurs à 3,2 millions contre 1,7 million en novembre 2018. Une belle hausse, même si les ventes en la matière sont bien loin des chiffres du smartphone.

 

Intelligence artificielle et compréhension du langage

Lors d’une conversation, le plus important reste la capacité des deux interlocuteurs à se comprendre. Il s’agit bien du principal objectif des développeurs de technologie vocale. C’est à ce niveau que l’intelligence artificielle joue un rôle essentiel. À la base des systèmes embarqués permettant la réception et l’envoi d’instructions, elle utilise des systèmes NLU de Natural Language Understanding. Il en est de même pour les chatbots et robots vocaux dont la qualité de l’analyse sémantique et de la compréhension du langage est indispensable. Reconnaissance vocale et IA constituent le socle pour réaliser de nouvelles interactions en temps réel au travers de l’exploitation des données issues de la conversation et de différents capteurs. Ce type de projet implique une grande partie du travail sur la progression des algorithmes afin de comprendre le contexte et les demandes des utilisateurs.

D’ici quelques années, les avancés en matière d’IA et de technologie vocale promettent des résultats optimaux pour déterminer des émotions. Les assistants vont alors être capables d’adapter le ton et le volume en fonction d’un état de fatigue ou au contraire d’une joie intense.

 

Technologie vocale : des applications de plus en plus demandées

Inclure la technologie vocale au sein d’un logiciel ou d’une application smartphone fait appel à des compétences de data mining, de machine learning et à une automatisation du traitement du langage. Le simple fait de pouvoir interagir avec le logiciel sans nécessité d’écran ouvre de nombreuses possibilités et fait gagner un temps précieux. À l’image des smart speakers de plus en plus utilisés, les applications entièrement main libre se multiplient.

On retrouve deux types de technologies vocales intégrées. La reconnaissance vocale va convertir les paroles en texte, afin qu’elles soient comprises par le programme. Ce dernier va ensuite s’en servir pour réaliser les diverses fonctionnalités disponibles. À l’inverse, la synthèse vocale permet de communiquer avec l’utilisateur en transformant le texte en voix.

Doter une application de ses technologies implique un travail laborieux, étape par étape, de façon itérative. Elles sont adaptées en premier lieu aux fonctionnalités les plus populaires, puis aux autres de mise à jour en mise à jour. Des connaissances poussées sont nécessaires pour la réalisation d’assistants vocaux. L’école d’ingénierie informatique AFTI prépare les futurs développeurs à créer des solutions clés en main. Les formations en alternance contribuent à gagner en expérience autour de missions réalisées directement sur le Cloud ou de manière intégrée à l’application.  

 

Parmi les cursus les plus pertinents en matière de technologies vocales, on retrouve :
ETGL – Expert en Ingénierie de Développement et logiciels
CDA – Concepteur Développeur d’Applications