FRFAM.COM >> Science >> Technologie

Comment Siri apprend à parler

Alerte à la bombe, saut en longueur, gynécologie, décembre… comment tu prononces ça ? Les gens trébuchent parfois sur la prononciation des mots. Il semble donc presque impossible d'enseigner cela à un ordinateur.

Pourtant, aujourd'hui, nous trouvons partout des systèmes de lecture informatisés. Il suffit de penser à la voix dans le GPS, aux systèmes de sonorisation dans les gares et aux assistants numériques de plus en plus populaires tels que Google Assistant, Siri et Alexa. Dans son mémoire de master, l'étudiant en informatique Robrecht Meersman (UGent) est parti à la recherche de la meilleure méthode pour déterminer la prononciation d'un mot, dans le but ultime :développer une voix impossible à distinguer de la voix humaine.

Décembre

Mais comment cela fonctionne-t-il, comment Siri sait-il prononcer un mot difficile comme "décembre" ? Il y a trois lettres E dans le mot décembre et elles se prononcent chacune de différentes manières.

Robrecht Meersman :« Afin de savoir comment un mot est prononcé, l'ordinateur vocal convertit d'abord les mots en leur représentation phonétique. L'alphabet phonétique IPA le plus populaire utilise des lettres étranges, chacune représentant un son unique :par exemple, décembre s'écrit desɛmbər.

L'objectif final ? Développer une voix impossible à distinguer de la voix humaine Robrecht Meersman (UGent)


Généralement, l'ordinateur vocal utilise un dictionnaire qui contient les mots les plus courants. Malheureusement, cela ne suffit pas dans la pratique. « De nouveaux mots sont ajoutés chaque jour, les gens utilisent des mots qui n'existent pas ou empruntent des mots à une autre langue. De plus, il existe des mots qui ont plusieurs prononciations possibles, selon leur sens dans la phrase :il suffit de penser au saut en longueur et au saut en longueur. Il est donc impossible de tout mettre dans un dictionnaire. ”

Exceptions

Lorsqu'un mot n'est pas dans le dictionnaire, l'ordinateur vocal déterminera sa prononciation en fonction des règles traditionnelles de la langue. « Ces règles sont saisies par des linguistes professionnels, un travail intensif et chronophage. De plus, une langue ne serait pas une langue sans les nombreuses exceptions à ces règles.”

Prédire le stress reste un défi difficile pour un ordinateur vocal Robrecht Meersman (UGent)

Aujourd'hui, il est possible de remplacer complètement ces règles par l'apprentissage automatique, une forme d'intelligence artificielle. L'ordinateur lui-même détermine comment prononcer un mot, en se basant sur un grand nombre d'exemples. « En disant à chaque fois où le réseau a fait une erreur, il finira par apprendre comment cette langue fonctionne indépendamment. Il n'y a donc plus de règle linguistique impliquée.

Température

Cette méthode d'apprentissage automatique semble très bien fonctionner par rapport à l'ancienne alternative basée sur des règles. Robrecht Meersman :« Dans mes recherches de mémoire de maîtrise, j'ai comparé la marge d'erreur dans deux langues :le croate et le turc. Il est apparu qu'il y avait une grande différence entre les deux systèmes :si l'on compare les systèmes à base de règles avec la méthode d'apprentissage automatique, la marge d'erreur pour le croate est passée de 85 % à à peine 29 % et pour le turc de 50 % à 15 %. Nous réalisons donc un gros gain lorsque nous utilisons l'apprentissage automatique.

Prédire uniquement la contrainte s'est avéré être un sérieux défi pour l'ordinateur :"Déterminer une contrainte est très intuitif."

Emplois

Les linguistes n'ont pas à se soucier d'avancer, déclare Robrecht Meersman :« Bien que la traduction via l'apprentissage automatique soit plus qualitative, plus simple et moins chère, les linguistes joueront toujours un rôle. Bien qu'ils soient plus enclins à compiler des dictionnaires qu'à saisir des règles. »

Promoteurs : professeur dr Jan Cnops, mme. Corinne Bos

Lire la thèse complète dans la banque de thèses flamande

Inscrivez-vous dès maintenant pour le prix de thèse flamand

Êtes-vous diplômé cette année universitaire ? Vous venez de terminer une solide thèse de baccalauréat ou de maîtrise? Alors ne laissez pas le résultat de votre dur labeur languir dans une archive poussiéreuse, mais sortez avec ! Participez au Prix de thèse flamand et courez la chance de gagner des prix en espèces allant jusqu'à 2 500 euros et beaucoup d'attention de la presse pour votre travail.

Lors de votre inscription, vous courez automatiquement la chance de gagner les quatre prix partiels, dont le prix EOS des thèses de sciences exactes et le Prix Agoria pour la technologie et l'innovation .

Vous pouvez vous inscrire jusqu'à dimanche 6 octobre

appliquer maintenant
[]