llmPublié le 6 juin 20264 min de lecture

Nemotron 3.5 : le modèle de sécurité IA qui comprend textes et images

NVIDIA lance Nemotron 3.5, un modèle de sécurité IA multimodal qui analyse textes et images simultanément et accepte des politiques de sécurité personnalisées. Essentiel pour les entreprises utilisant l'IA en plusieurs langues.

Nemotron 3.5: نموذج أمان AI كيتفهم الصور والنصوص وكيقبل سياسات مخصصة

NVIDIA vient de déployer un nouveau modèle de sécurité numérique appelé Nemotron 3.5 Content Safety. Ce modèle fait quelque chose d'important : il analyse les textes et les images ensemble en même temps, et accepte des règles de sécurité personnalisées selon les besoins de l'entreprise.

La version précédente (Nemotron 3) comprenait les images, mais évaluait le texte et l'image séparément. Le problème : certaines violations de sécurité n'apparaissent que quand on lit texte et image ensemble. Exemple : une photo de pharmacie + une question sur comment acheter un médicament sans ordonnance = danger. La nouvelle version lit tout en même temps et détecte le problème en une seule passe.

Qu'est-ce qui change dans la version 3.5 ?

1. Le vrai multimodal

Nemotron 3.5 traite trois éléments à la fois :

  • La question de l'utilisateur
  • Une image (optionnelle)
  • Une réponse d'un assistant intelligent (optionnelle)

Et vous donne un jugement de sécurité unique sur l'ensemble. Cette approche détecte les violations qui n'apparaissent que quand on lit tout ensemble.

2. 140 langues (12 entraînées directement)

Le modèle fonctionne dans 12 langues entraînées directement : l'anglais, le français, l'espagnol, l'allemand, le chinois, le japonais, le coréen, l'arabe, l'hindi, le russe, le portugais et l'italien.

Grâce au modèle de base (Gemma 3), il peut fonctionner dans 140 autres langues sans entraînement supplémentaire. C'est très important pour les marchés avec des langues moins représentées, comme les langues africaines et scandinaves.

3. Les politiques personnalisées — la vraie différence

C'est ce qui distingue réellement Nemotron 3.5 de la concurrence. Chaque entreprise a des besoins de sécurité différents :

  • Une banque : ne doit pas révéler d'informations sensibles
  • Une plateforme éducative pour enfants : pas de violence ni de contenu adulte
  • Un outil DevOps : le mot « terminate » (arrêter un processus) n'est pas une menace

Nemotron 3.5 accepte une politique personnalisée avec l'entrée et l'utilise quand il analyse le contenu. Cela signifie que :

  • Désactiver des catégories non pertinentes : par exemple, DevOps n'a pas besoin de se préoccuper de la catégorie « violence »
  • Ajouter des catégories personnalisées : une banque peut ajouter « détection de fraude » comme catégorie supplémentaire

4. La pensée logique (THINK Mode)

Le modèle peut vous montrer ses étapes de réflexion avant de donner son jugement final. Exemple :

<<think>>
L'utilisateur demande comment acheter un médicament sans ordonnance.
L'assistant donne des étapes précises et mentionne une pharmacie en ligne.
Cela viole les catégories : « planification criminelle » et « substances contrôlées ».
L'image (pharmacie) donne du contexte mais ne change pas le jugement.
<</think>>

Jugement utilisateur : dangereux
Jugement assistant : dangereux
Catégories : planification criminelle, substances contrôlées

C'est important pour les entreprises qui doivent documenter leurs décisions (banques, hôpitaux, tribunaux).

La technologie en détail

Nemotron 3.5 utilise Gemma 3 4B (un petit modèle de base de Google), et NVIDIA l'a entraîné sur des données de sécurité avancées en utilisant LoRA Adapter (une technique qui spécialise le modèle sans changer sa taille).

Le modèle peut fonctionner sur un GPU avec 8GB, ce qui signifie qu'il peut tourner sur la plupart des appareils modernes.

3 modes de sortie

  1. Binaire rapide (sans reasoning) : Safe / Unsafe
  2. Binaire avec catégories : Safe / Unsafe + liste des catégories violées
  3. THINK mode : étapes + jugement + catégories

Performance et vitesse

Nemotron 3.5 atteint :

  • 85% de précision en moyenne sur différents tests
  • 96.5% de précision sur 12 langues (Multilingual Aegis)
  • 3x plus rapide que d'autres modèles de sécurité multimodal
  • 50% moins de tokens quand il utilise le reasoning (économies de coût et de vitesse)

La vitesse est importante car le modèle fonctionne avant que la réponse n'arrive à l'utilisateur. S'il était lent, les clients verraient un délai.

Les données et la transparence

NVIDIA a publié l'ensemble de données complet (données d'entraînement), ce qui est très rare dans le monde de la sécurité IA. La plupart des entreprises ne partagent pas leurs données.

Les données contiennent :

  • Textes multilingues : du Nemotron Safety Guard Dataset v3
  • Images réelles (99%) : pas d'images générées par IA. C'est très important, car les images générées par IA (comme SDXL) ne représentent pas la réalité.
  • Documents professionnels : du Nemotron VLM Dataset v2 (tableaux, graphiques, documents numérisés)
  • Traces de reasoning : les étapes de pensée utilisées pour entraîner le modèle
  • 10% de données synthétiques : pour diversifier les exemples et les cas rares

Les usages pratiques

Pour les banques et la finance

Détection des tentatives de fraude, vérification qu'aucune donnée sensible n'est partagée, application des règles KYC (vérification de l'identité du client).

Pour les hôpitaux et la santé

Protection de la confidentialité du patient, prévention de la divulgation d'informations médicales sensibles, vérification que l'assistant intelligent ne donne pas de conseils médicaux dangereux.

Pour les plateformes éducatives

Protection des enfants contre le contenu adulte, prévention du harcèlement, vérification que l'assistant ne encourage pas les comportements dangereux.

Pour les développeurs

Nemotron 3.5 est disponible sur Hugging Face (gratuit pour la recherche et l'usage commercial), et également sur NVIDIA NIM (service optimisé pour la production).

Vous pouvez l'utiliser via :

  • Transformers (bibliothèque Python)
  • vLLM (pour la haute vitesse)
  • SGLang (pour la structured generation)
  • Baseten, DeepInfra, OpenRouter (plateformes d'inférence)

Qu'est-ce que cela signifie pour vous ?

Les entreprises marocaines qui utilisent l'IA — banques, opérateurs télécom, hôpitaux privés, cabinets juridiques — ont un vrai problème : comment s'assurer que l'assistant intelligent ne dit pas de choses dangereuses ? Nemotron 3.5 résout ce problème de manière pratique. Le modèle est petit (4B), rapide, et accepte des politiques personnalisées. Cela signifie qu'une banque marocaine peut construire un chatbot intelligent pour le service client, et s'assurer que l'IA ne divulgue pas d'informations sensibles. Même les professionnels indépendants comme les avocats et les consultants peuvent utiliser la même technologie pour protéger les données de leurs clients. Et les développeurs marocains peuvent construire des services de sécurité IA et les vendre à des entreprises européennes — c'est un domaine très demandé en télétravail.

Articles liés