Gemini 3.5 Live Translate : Google élimine la latence en traduction vocale
Google lance Gemini 3.5 Live Translate, un modèle de traduction vocale sans latence pour plus de 70 langues. L'IA génère la parole en continu, préservant intonation et rythme de l'orateur.

Google franchit une étape décisive en traduction vocale
Google déploie Gemini 3.5 Live Translate, un modèle d'IA conçu pour éliminer les latences qui ralentissent les échanges multilingues. Le système traduit la parole en continu dans plus de 70 langues, en préservant l'intonation, le rythme et la hauteur de voix de l'orateur original.
Ce modèle cible trois publics : les développeurs, les directions métiers et les professionnels en mobilité. Son déploiement s'accélère via une API publique, Google Meet et l'application Google Translate sur mobile.
L'API Gemini Live : accès immédiat pour les développeurs
Google rend cette technologie accessible aux développeurs en « public preview » via l'API Gemini Live et Google AI Studio. Les entreprises peuvent intégrer ces fonctions de traduction sans latence dans leurs propres applications.
Pour faciliter le déploiement, Google s'appuie sur des plateformes tierces : Agora, LiveKit et Pipecat. Ces partenaires permettent aux équipes métiers de déployer la traduction vocale sans développement interne lourd.
Le système détecte automatiquement les langues et résiste aux bruits ambiants. Aucune configuration manuelle n'est requise.
Google Meet : réunions multilingues sans friction
Dans Google Workspace, Gemini 3.5 Live Translate s'intègre directement à Google Meet, actuellement en « private preview ». Un déploiement plus large est prévu cette année.
Google annonce plus de 2000 combinaisons linguistiques possibles dans une même réunion. L'interface utilisateur de Meet a été repensée pour offrir un accès instantané à ces fonctions de traduction vocale.
Traduction mobile : écoute fluide sur Android et iOS
Les professionnels en déplacement bénéficient d'une version mobile via l'application Google Translate sur Android et iOS. En connectant des écouteurs, l'utilisateur peut suivre un discours avec une traduction qui imite le ton de l'interlocuteur.
Sur Android, un mode écoute permet de recevoir la traduction directement via le haut-parleur interne du smartphone. L'utilisateur tient son téléphone comme lors d'un appel classique, offrant une traduction discrète sans accessoires supplémentaires.
Sécurité : SynthID contre les deepfakes
Face aux risques d'usurpation d'identité vocale (deepfakes), Google intègre par défaut la technologie SynthID. Tous les flux audio générés par Gemini 3.5 Live Translate sont filigranés de manière imperceptible.
Ce marquage, tissé au cœur du signal audio, garantit que les contenus générés par l'IA restent traçables et détectables. Les directions de la sécurité (RSSI) disposent ainsi d'un garde-fou natif contre les abus potentiels.
Articles liés
llmChatGPT atteint le milliard d'utilisateurs mensuels
OpenAI franchit un cap symbolique en rassemblant un milliard d'utilisateurs actifs. Mais la concurrence s'intensifie : Claude gagne du terrain, et la monétisation devient l'enjeu majeur.
agentsGemini Spark de Google : un agent IA utile, mais avec des lacunes
Nous avons testé Gemini Spark, le nouvel agent IA de Google. Il automatise les tâches quotidiennes efficacement, mais souffre de limitations techniques importantes.
llmMicrosoft dévoile sa famille MAI : sept modèles d'IA développés en interne
Microsoft AI lance sept modèles développés entièrement en interne, dont MAI-Thinking-1 pour le raisonnement et MAI-Code-1-Flash pour le code. L'éditeur mise sur la personnalisation au niveau de l'entreprise.
enterpriseATM as a Service : l'Afrique modernise son infrastructure bancaire
Le modèle ATMaaS émerge en Afrique de l'Ouest et Centrale. Les banques externalisent la gestion de leurs distributeurs automatiques pour réduire les risques technologiques et accélérer l'inclusion financière.
