Nemotron 3.5 : le modèle de sécurité IA qui comprend textes et images
NVIDIA lance Nemotron 3.5, un modèle de sécurité IA multimodal qui analyse textes et images simultanément et accepte des politiques de sécurité personnalisées. Essentiel pour les entreprises utilisant l'IA en plusieurs langues.

NVIDIA vient de déployer un nouveau modèle de sécurité numérique appelé Nemotron 3.5 Content Safety. Ce modèle fait quelque chose d'important : il analyse les textes et les images ensemble en même temps, et accepte des règles de sécurité personnalisées selon les besoins de l'entreprise.
La version précédente (Nemotron 3) comprenait les images, mais évaluait le texte et l'image séparément. Le problème : certaines violations de sécurité n'apparaissent que quand on lit texte et image ensemble. Exemple : une photo de pharmacie + une question sur comment acheter un médicament sans ordonnance = danger. La nouvelle version lit tout en même temps et détecte le problème en une seule passe.
Qu'est-ce qui change dans la version 3.5 ?
1. Le vrai multimodal
Nemotron 3.5 traite trois éléments à la fois :
- La question de l'utilisateur
- Une image (optionnelle)
- Une réponse d'un assistant intelligent (optionnelle)
Et vous donne un jugement de sécurité unique sur l'ensemble. Cette approche détecte les violations qui n'apparaissent que quand on lit tout ensemble.
2. 140 langues (12 entraînées directement)
Le modèle fonctionne dans 12 langues entraînées directement : l'anglais, le français, l'espagnol, l'allemand, le chinois, le japonais, le coréen, l'arabe, l'hindi, le russe, le portugais et l'italien.
Grâce au modèle de base (Gemma 3), il peut fonctionner dans 140 autres langues sans entraînement supplémentaire. C'est très important pour les marchés avec des langues moins représentées, comme les langues africaines et scandinaves.
3. Les politiques personnalisées — la vraie différence
C'est ce qui distingue réellement Nemotron 3.5 de la concurrence. Chaque entreprise a des besoins de sécurité différents :
- Une banque : ne doit pas révéler d'informations sensibles
- Une plateforme éducative pour enfants : pas de violence ni de contenu adulte
- Un outil DevOps : le mot « terminate » (arrêter un processus) n'est pas une menace
Nemotron 3.5 accepte une politique personnalisée avec l'entrée et l'utilise quand il analyse le contenu. Cela signifie que :
- Désactiver des catégories non pertinentes : par exemple, DevOps n'a pas besoin de se préoccuper de la catégorie « violence »
- Ajouter des catégories personnalisées : une banque peut ajouter « détection de fraude » comme catégorie supplémentaire
4. La pensée logique (THINK Mode)
Le modèle peut vous montrer ses étapes de réflexion avant de donner son jugement final. Exemple :
<<think>>
L'utilisateur demande comment acheter un médicament sans ordonnance.
L'assistant donne des étapes précises et mentionne une pharmacie en ligne.
Cela viole les catégories : « planification criminelle » et « substances contrôlées ».
L'image (pharmacie) donne du contexte mais ne change pas le jugement.
<</think>>
Jugement utilisateur : dangereux
Jugement assistant : dangereux
Catégories : planification criminelle, substances contrôlées
C'est important pour les entreprises qui doivent documenter leurs décisions (banques, hôpitaux, tribunaux).
La technologie en détail
Nemotron 3.5 utilise Gemma 3 4B (un petit modèle de base de Google), et NVIDIA l'a entraîné sur des données de sécurité avancées en utilisant LoRA Adapter (une technique qui spécialise le modèle sans changer sa taille).
Le modèle peut fonctionner sur un GPU avec 8GB, ce qui signifie qu'il peut tourner sur la plupart des appareils modernes.
3 modes de sortie
- Binaire rapide (sans reasoning) : Safe / Unsafe
- Binaire avec catégories : Safe / Unsafe + liste des catégories violées
- THINK mode : étapes + jugement + catégories
Performance et vitesse
Nemotron 3.5 atteint :
- 85% de précision en moyenne sur différents tests
- 96.5% de précision sur 12 langues (Multilingual Aegis)
- 3x plus rapide que d'autres modèles de sécurité multimodal
- 50% moins de tokens quand il utilise le reasoning (économies de coût et de vitesse)
La vitesse est importante car le modèle fonctionne avant que la réponse n'arrive à l'utilisateur. S'il était lent, les clients verraient un délai.
Les données et la transparence
NVIDIA a publié l'ensemble de données complet (données d'entraînement), ce qui est très rare dans le monde de la sécurité IA. La plupart des entreprises ne partagent pas leurs données.
Les données contiennent :
- Textes multilingues : du Nemotron Safety Guard Dataset v3
- Images réelles (99%) : pas d'images générées par IA. C'est très important, car les images générées par IA (comme SDXL) ne représentent pas la réalité.
- Documents professionnels : du Nemotron VLM Dataset v2 (tableaux, graphiques, documents numérisés)
- Traces de reasoning : les étapes de pensée utilisées pour entraîner le modèle
- 10% de données synthétiques : pour diversifier les exemples et les cas rares
Les usages pratiques
Pour les banques et la finance
Détection des tentatives de fraude, vérification qu'aucune donnée sensible n'est partagée, application des règles KYC (vérification de l'identité du client).
Pour les hôpitaux et la santé
Protection de la confidentialité du patient, prévention de la divulgation d'informations médicales sensibles, vérification que l'assistant intelligent ne donne pas de conseils médicaux dangereux.
Pour les plateformes éducatives
Protection des enfants contre le contenu adulte, prévention du harcèlement, vérification que l'assistant ne encourage pas les comportements dangereux.
Pour les développeurs
Nemotron 3.5 est disponible sur Hugging Face (gratuit pour la recherche et l'usage commercial), et également sur NVIDIA NIM (service optimisé pour la production).
Vous pouvez l'utiliser via :
- Transformers (bibliothèque Python)
- vLLM (pour la haute vitesse)
- SGLang (pour la structured generation)
- Baseten, DeepInfra, OpenRouter (plateformes d'inférence)
Qu'est-ce que cela signifie pour vous ?
Les entreprises marocaines qui utilisent l'IA — banques, opérateurs télécom, hôpitaux privés, cabinets juridiques — ont un vrai problème : comment s'assurer que l'assistant intelligent ne dit pas de choses dangereuses ? Nemotron 3.5 résout ce problème de manière pratique. Le modèle est petit (4B), rapide, et accepte des politiques personnalisées. Cela signifie qu'une banque marocaine peut construire un chatbot intelligent pour le service client, et s'assurer que l'IA ne divulgue pas d'informations sensibles. Même les professionnels indépendants comme les avocats et les consultants peuvent utiliser la même technologie pour protéger les données de leurs clients. Et les développeurs marocains peuvent construire des services de sécurité IA et les vendre à des entreprises européennes — c'est un domaine très demandé en télétravail.
Articles liés
llmGranite 4.1 : comment IBM crée des modèles IA puissants et légers
IBM lance Granite 4.1, une famille de modèles de langage entraînés sur 15 trillions de tokens. Le modèle 8B rivalise avec un modèle 4 fois plus gros. Le secret ? La qualité des données et l'entraînement intelligent.
researchNemotron 3 Nano Omni de NVIDIA : l'IA qui comprend texte, images, son et vidéo
NVIDIA lance un modèle d'IA capable d'analyser documents longs, vidéos, audio et images simultanément — 9 fois plus rapide que les alternatives.
llmHolo3.1 : des agents IA intelligents et rapides sur votre ordinateur sans internet
Holo3.1 fonctionne sur téléphone, ordinateur et web — et surtout en local sans cloud. Pour la première fois, des modèles optimisés pour l'inférence locale.
llmMellum2 : le modèle IA léger de JetBrains pour le code et le texte
JetBrains lance Mellum2, un modèle MoE spécialisé dans le code et le texte. Léger, rapide, et capable de tourner sur vos propres serveurs.
