llmPublié le 12 juin 20263 min de lecture

Gemini 3.5 Live Translate : Google élimine la latence en traduction vocale

Google lance Gemini 3.5 Live Translate, un modèle de traduction vocale sans latence pour plus de 70 langues. L'IA génère la parole en continu, préservant intonation et rythme de l'orateur.

Gemini 3.5 Live Translate ديال Google: ترجمة الاجتماعات بدون تأخير

Google franchit une étape décisive en traduction vocale

Google déploie Gemini 3.5 Live Translate, un modèle d'IA conçu pour éliminer les latences qui ralentissent les échanges multilingues. Le système traduit la parole en continu dans plus de 70 langues, en préservant l'intonation, le rythme et la hauteur de voix de l'orateur original.

Ce modèle cible trois publics : les développeurs, les directions métiers et les professionnels en mobilité. Son déploiement s'accélère via une API publique, Google Meet et l'application Google Translate sur mobile.

L'API Gemini Live : accès immédiat pour les développeurs

Google rend cette technologie accessible aux développeurs en « public preview » via l'API Gemini Live et Google AI Studio. Les entreprises peuvent intégrer ces fonctions de traduction sans latence dans leurs propres applications.

Pour faciliter le déploiement, Google s'appuie sur des plateformes tierces : Agora, LiveKit et Pipecat. Ces partenaires permettent aux équipes métiers de déployer la traduction vocale sans développement interne lourd.

Le système détecte automatiquement les langues et résiste aux bruits ambiants. Aucune configuration manuelle n'est requise.

Google Meet : réunions multilingues sans friction

Dans Google Workspace, Gemini 3.5 Live Translate s'intègre directement à Google Meet, actuellement en « private preview ». Un déploiement plus large est prévu cette année.

Google annonce plus de 2000 combinaisons linguistiques possibles dans une même réunion. L'interface utilisateur de Meet a été repensée pour offrir un accès instantané à ces fonctions de traduction vocale.

Traduction mobile : écoute fluide sur Android et iOS

Les professionnels en déplacement bénéficient d'une version mobile via l'application Google Translate sur Android et iOS. En connectant des écouteurs, l'utilisateur peut suivre un discours avec une traduction qui imite le ton de l'interlocuteur.

Sur Android, un mode écoute permet de recevoir la traduction directement via le haut-parleur interne du smartphone. L'utilisateur tient son téléphone comme lors d'un appel classique, offrant une traduction discrète sans accessoires supplémentaires.

Sécurité : SynthID contre les deepfakes

Face aux risques d'usurpation d'identité vocale (deepfakes), Google intègre par défaut la technologie SynthID. Tous les flux audio générés par Gemini 3.5 Live Translate sont filigranés de manière imperceptible.

Ce marquage, tissé au cœur du signal audio, garantit que les contenus générés par l'IA restent traçables et détectables. Les directions de la sécurité (RSSI) disposent ainsi d'un garde-fou natif contre les abus potentiels.

Gemini 3.5 Live Translate : Google élimine la latence en traduction vocale

Google franchit une étape décisive en traduction vocale

L'API Gemini Live : accès immédiat pour les développeurs

Google Meet : réunions multilingues sans friction

Traduction mobile : écoute fluide sur Android et iOS

Sécurité : SynthID contre les deepfakes

Articles liés

Google lance des agents IA qui surveillent le web 24h/24 pour vous

WWDC d'Apple le 8 juin : Siri IA, iOS 27 et les surprises attendues

DeepL s'installe dans Google Meet avec des sous-titres traduits en temps réel

Google Drive : l'IA Gemini peut-elle vraiment organiser 14 ans de fichiers ?