Google lance « Waxal », son IA vocale en langues africaines

L’IA de demain parlera aussi wolof, peul, haoussa ou swahili. Avec WAXAL, Google franchit un cap en s’attaquant de front à l’un des angles morts de l’intelligence artificielle : l’invisibilité des langues africaines dans les systèmes de reconnaissance et de synthèse vocale. Baptisé d’après le mot wolof « waxal », qui signifie « parler », ce projet n’est pas un nouveau chatbot, mais une gigantesque base de données vocales ouvertes, pensée pour servir de socle à tous les futurs outils de voix en Afrique : assistants, traducteurs, services publics, applications d’éducation ou de santé.

WAXAL, une base de données pour 21 langues africaines

WAXAL rassemble plus de 11 000 heures d’enregistrements vocaux couvrant 21 langues d’Afrique subsaharienne, parmi lesquelles le haoussa, le yoruba, l’igbo, le peul, le swahili, le luganda, l’acholi ou encore l’ikposo. Environ 1 250 heures sont minutieusement transcrites, de façon à entraîner des modèles de reconnaissance vocale capables de comprendre et de transcrire la parole avec précision. À cela s’ajoutent des heures d’enregistrement en qualité studio pour générer des voix de synthèse naturelles, qui permettront demain à des applications de « parler » ces langues en retour.

L’objectif : intégrer plus de 100 millions de locuteurs, jusqu’ici quasi absents de l’économie de l’IA, dans les interfaces vocales qui se généralisent partout ailleurs. La voix étant souvent l’interface la plus intuitive – notamment dans des contextes d’analphabétisme partiel ou de faible connectivité – cette ouverture change la donne pour l’accès au numérique en Afrique.

Un projet conçu et piloté depuis l’Afrique

L’une des forces de WAXAL tient à sa gouvernance. Contrairement aux initiatives passées où les données vocales africaines étaient souvent collectées puis stockées dans des centres de recherche hors du continent, ce projet est piloté par un consortium d’institutions africaines, avec financement et soutien technique de Google Research Africa. L’université Makerere (Ouganda), l’université du Ghana et l’organisation rwandaise Digital Umuganda coordonnent la collecte des données, le travail linguistique et la mobilisation des communautés.

Point crucial : la propriété des données reste entre les mains de ces institutions africaines, qui décident de l’usage, des licences et des conditions de réutilisation. C’est un renversement majeur. Ici, l’ouverture sert d’abord les chercheurs, étudiants et entrepreneurs locaux, qui disposent enfin d’un corpus de haute qualité dans leurs propres langues.

Un levier pour l’écosystème tech africain

WAXAL arrive dans un contexte où se multiplient les initiatives africaines en technologies de langage : au Nigeria, par exemple, le modèle N-ATLAS, open source, reconnaît et génère du texte en yoruba, haoussa, igbo et anglais à accent nigérian. En Afrique du Sud, des startups comme Lelapa AI développent Vulavula, combinent reconnaissance vocale, traduction et analyse de sentiments pour plusieurs langues locales. Sans données à grande échelle, ces projets restent bridés ; avec WAXAL, ils gagnent une base commune pour aller plus loin.​

Google présente cette base comme un « fondement essentiel » pour créer des outils adaptés aux réalités africaines : assistants vocaux pour les services publics, interfaces en langue locale pour la santé et l’agriculture, solutions éducatives qui parlent aux élèves dans leur langue maternelle. Dans un entretien, Aisha Walcott-Bryant (Google Research Africa) résume l’enjeu : permettre aux Africains de développer des technologies « selon leurs propres termes et dans leurs propres langues ».

Enjeux politiques et symboliques

Au‑delà de la technologie, WAXAL porte une poids politique : reconnaître que les langues africaines méritent la même place que l’anglais, le français ou le mandarin dans l’architecture de l’IA globale. Nommer le projet par un mot wolof, confier la gouvernance à des universités africaines, penser l’outil comme open data contrôlée : tout indique une volonté affichée de ne pas reproduire, dans le champ de l’IA, les mécanismes de domination linguistique et économique du passé.

Reste à voir comment cette base sera utilisée : qui construira les prochains assistants vocaux en haoussa ou en yoruba, pour quels usages, avec quelles garanties de protection des données et de non‑discrimination ? Mais une étape essentielle est franchie : l’Afrique n’est plus seulement une « zone blanche » dans les cartes de l’IA linguistique. Avec WAXAL, elle commence à écrire ses propres modèles – et surtout, à faire entendre ses propres voix.

Quitter la version mobile