Amazon, Apple, Google, Meta et Microsoft collaborent pour améliorer la technologie de reconnaissance vocale

La possibilité de communiquer et de faire fonctionner des appareils par la parole est cruciale pour quiconque interagit avec la technologie aujourd’hui. Cependant, ces technologies ne profitent pas aux millions de personnes dans le monde qui sont atteint de divers handicaps.

L’université de l’Illinois à Urbana-Champaign (UIUC) aux États-Unis a lancé ce lundi 3 octobre le « Speech Accessibility Project », une initiative de recherche pluriannuelle avec le soutien d’Amazon, Apple, Google, Meta, Microsoft et quelques organisations de personnes handicapées à but non lucratif.

La nouvelle initiative de recherche vise à rendre la technologie de reconnaissance vocale plus accessible pour les personnes souffrant de troubles de la parole et de divers handicaps. Cela inclut notamment les handicaps affectant la parole, comme la sclérose latérale amyotrophique, la maladie de Parkinson, la paralysie cérébrale et le syndrome de Down (trisomie 21).  

« Les interfaces vocales devraient être disponibles pour tout le monde, y compris les personnes handicapées. Cette tâche a été difficile car elle nécessite beaucoup d’infrastructures, idéalement du type qui peuvent être soutenues par les principales entreprises technologiques. Nous avons donc créé une équipe interdisciplinaire unique, experte en linguistique, en parole, en IA, en sécurité et en confidentialité, pour nous aider à relever cet important défis », a déclaré Mark Hasegawa-Johnson, professeur de génie électrique et informatique à l’UIUC.

Au cours de la dernière décennie, Apple et d’autres entreprises technologiques ont innové dans le secteur des assistants vocaux avec des outils tels que Siri, Amazon Alexa, Google Assistant, etc. Apple a également investi dans des technologies telles que VoiceOver et Voice Control. Plus récemment en 2019, Google a lancé le projet Euphonia qui visait à rendre la technologie de reconnaissance vocale plus accessible en tirant parti de l’Intelligence artificielle. Ces projets ont connu chacun des failles d’où l’importance de collaborer pour développer des systèmes de reconnaissance automatique de la parole capables de comprendre la voix de tout le monde, quel que soit le modèle vocal.

Pour atteindre cet objectif, ce projet d’accessibilité de la parole collectera des échantillons de parole de personnes représentant une diversité de modèles de parole. Les chercheurs de l’UIUC recruteront des volontaires rémunérés pour fournir des échantillons de voix enregistrés et créeront un ensemble de données privées et dépersonnalisées qui pourront être utilisées pour entraîner des modèles d’apprentissage automatique afin de mieux comprendre une grande variété de modèles de parole.

Le Speech Accessibility Project se concentrera d’abord sur l’anglais américain. Selon le National Institute on Deafness and Other Communication Disorders (NIDCD), les résultats de ces travaux pourraient profiter à plus de 17,5 millions de personnes souffrant de ces problèmes, rien qu’aux États-Unis.

Samira Njoya

Lire aussi : Afrique du Sud : Google établira un centre de données à Cape Town en 2023 pour concurrencer Amazon