FRFAM.COM >> Science >> Technologie

Comment Siri et les assistants vocaux apprennent à prononcer parfaitement les mots

Alertes à la bombe, saut en longueur, gynécologie, décembre… Comment prononcez-vous ces mots ? Les humains trébuchent parfois sur la prononciation. Enseigner cela à un ordinateur semble donc presque impossible.

Cependant, les systèmes de synthèse vocale sont omniprésents aujourd'hui : voix du GPS, annonces en gare, ou assistants comme Google Assistant, Siri et Alexa. Dans son mémoire de master, l'étudiant en informatique Robrecht Meersman (UGent) a exploré les meilleures méthodes pour déterminer la prononciation d'un mot, avec l'objectif ultime de créer une voix indistinguable de celle d'un humain.

Décembre

Mais comment Siri prononce-t-elle un mot complexe comme « décembre » ? Ce mot compte trois « e », prononcés différemment.

Robrecht Meersman : « Pour déterminer la prononciation d'un mot, le système vocal le convertit d'abord en représentation phonétique. L'alphabet phonétique international (API ou IPA) utilise des symboles uniques pour chaque son : par exemple, décembre s'écrit /de.sɑ̃bʁ/.

L'objectif final ? Développer une voix impossible à distinguer de la voix humaine.Robrecht Meersman (UGent)

Les systèmes utilisent généralement un dictionnaire des mots courants. Mais cela est insuffisant en pratique. « De nouveaux mots apparaissent quotidiennement, les gens inventent des néologismes ou empruntent des termes étrangers. De plus, certains mots ont plusieurs prononciations selon le contexte, comme le saut en longueur. Un dictionnaire exhaustif est donc impossible. »

Exceptions

Pour les mots absents du dictionnaire, le système applique les règles traditionnelles de la langue. « Ces règles sont établies par des linguistes, un travail long et fastidieux. Or, toute langue regorge d'exceptions. »

Prédire l'accent tonique reste un défi majeur pour les systèmes vocaux.Robrecht Meersman (UGent)

Aujourd'hui, l'apprentissage automatique – une forme d'intelligence artificielle – peut remplacer ces règles. L'ordinateur apprend à partir d'exemples : « En lui indiquant ses erreurs, le réseau neuronal découvre les mécanismes de la langue sans règles linguistiques prédéfinies. »

Résultats

Cette approche surpasse les méthodes basées sur des règles. Robrecht Meersman : « Dans mon mémoire, j'ai comparé les taux d'erreur en croate et en turc. Pour le croate, ils passent de 85 % à 29 % ; pour le turc, de 50 % à 15 %. Un gain spectaculaire grâce à l'apprentissage automatique. »

Prédire l'accent tonique reste cependant intuitif et challenging.

Avenir des linguistes

Les linguistes ne sont pas menacés : « L'apprentissage automatique rend la tâche plus qualitative, simple et économique, mais ils superviseront les dictionnaires plutôt que les règles. »

Promoteurs : Prof. dr. Jan Cnops, Mme Corinne Bos.

Lisez la thèse complète dans la banque de thèses flamande.

Inscrivez-vous dès maintenant au Prix de la thèse flamande

Diplômé cette année universitaire avec une thèse de bachelier ou master ? Ne laissez pas votre travail s'empoussiérer : participez au Prix de la thèse flamande ! Gagnez jusqu'à 2 500 € et une visibilité médiatique exceptionnelle.

À l'inscription, chancez les quatre prix spéciaux, dont le Prix EOS des thèses en sciences exactes et le Prix Agoria pour la technologie et l'innovation.

Inscrivez-vous avant le dimanche 6 octobre. Appliquer maintenant

[]