SignGemma : Le Nouvel IA de Google pour Traduire la Langue des Signes en Texte Oral
Google poursuit son engagement en faveur de l’inclusion avec l’annonce de SignGemma, un nouveau modèle d’intelligence artificielle capable de traduire la langue des signes en texte parlé. Destiné à faciliter la communication pour les personnes souffrant de troubles de la parole et de l’audition, SignGemma s’appuie sur la technologie avancée de la série Gemma, actuellement en phase de test par le géant de la tech à Mountain View, avant un lancement prévu plus tard cette année.
Une traduction en temps réel, précise et adaptable
Présenté lors de la conférence Google I/O 2025, SignGemma se distingue par sa capacité à suivre et interpréter non seulement les mouvements des mains mais aussi les expressions faciales, éléments essentiels de la langue des signes. Cette combinaison permet une traduction fluide et instantanée, rendant les échanges face à face plus naturels et accessibles, même pour ceux qui ne maîtrisent pas la langue des signes.
Le modèle a été entraîné sur diverses variantes de langues des signes, avec une efficacité maximale pour la langue des signes américaine (ASL) traduite en anglais. Cette spécialisation garantit une haute qualité de conversion, répondant aux exigences communicationnelles des utilisateurs.
Un modèle open-source et utilisable hors ligne
Un des atouts majeurs de SignGemma est son caractère open-source. Rendu disponible pour les développeurs et les entreprises, il pourra être intégré dans diverses applications, augmentant ainsi son impact dans le domaine de l’accessibilité. Par ailleurs, SignGemma fonctionne sans connexion internet, un avantage crucial pour les zones où l’accès au réseau est limité ou instable.
Ce modèle est construit sur le framework Gemini Nano et utilise un vision transformer pour analyser en profondeur les formes et mouvements, offrant ainsi une interprétation fine et précise de la langue des signes.
Vers une technologie inclusive au service de tous
Google envisage non seulement de rendre SignGemma accessible aux développeurs, mais aussi de l’intégrer à ses outils d’intelligence artificielle existants, comme Gemini Live, amplifiant ainsi les possibilités d’utilisation pour améliorer la communication et l’inclusion.
En phase de test préliminaire, Google invite les individus intéressés à participer via un formulaire dédié, encourageant les retours pour affiner cette technologie prometteuse.
SignGemma représente une avancée majeure vers une technologie inclusive, qui rapproche davantage les personnes sourdes ou malentendantes du reste de la société, en supprimant les barrières linguistiques par une traduction automatique et naturelle.
👉 Source ici