startupPublié le 20 juin 20265 min de lecture

Probably lève 9 millions de dollars pour rendre l’IA plus fiable et moins sujette aux hallucinations

La startup Probably vient de lever 9 millions de dollars pour réduire les hallucinations des LLM. Son approche : combiner un modèle plus petit avec un système de validation rigoureux.

Probably جمعات 9 مليون دولار: AI أقل أخطاء وأكثر موثوقية

Probably lève 9 millions de dollars pour rendre l’IA plus fiable et moins sujette aux hallucinations

Les hallucinations restent le grand problème de l’IA

Les grands modèles de langage, ou LLMs, comme GPT et Claude, sont devenus extrêmement puissants. Ils rédigent, résument, analysent, codent et assistent déjà des millions d’utilisateurs dans leur travail quotidien.

Mais ils conservent un problème majeur : les hallucinations.

Une hallucination, dans le contexte de l’intelligence artificielle, désigne une réponse fausse générée avec assurance. Le modèle peut inventer une source, donner un chiffre incorrect, créer une référence inexistante ou présenter comme certaine une information qu’il ne maîtrise pas réellement.

Dans une conversation informelle, ce type d’erreur peut simplement être gênant. Mais dans la finance, le droit, la santé, la comptabilité ou l’ingénierie, une erreur factuelle peut avoir un coût réel.

C’est précisément le problème que veut résoudre Probably, une jeune startup qui vient de lever 9 millions de dollars en financement seed auprès de Andreessen Horowitz.

Son objectif : construire une IA plus fiable, capable de rapprocher les modèles de langage du niveau de précision attendu des systèmes logiciels traditionnels.

L’idée de Probably

Le fondateur de Probably, Peter Elias, résume l’objectif simplement : empêcher les erreurs d’atteindre l’utilisateur.

L’entreprise ne part pas du principe que les modèles de langage ne feront jamais d’erreurs. Au contraire, elle considère que l’erreur est possible, et qu’il faut donc construire autour du modèle une architecture capable de vérifier, filtrer et rejeter les mauvaises réponses avant qu’elles ne soient affichées.

C’est une différence importante.

Beaucoup d’acteurs du marché misent sur des modèles toujours plus grands, plus puissants et plus coûteux. Probably, elle, mise sur une autre approche : entourer le modèle d’un système de validation robuste.

Autrement dit, la fiabilité ne vient pas seulement du modèle. Elle vient aussi de l’ingénierie construite autour du modèle.

Une architecture basée sur la validation

Le cœur de l’approche de Probably repose sur ce que l’entreprise appelle le harness engineering.

L’idée est de construire une couche technique autour du modèle de langage afin de guider ses réponses, les vérifier et empêcher les erreurs de sortir du système.

Le fonctionnement peut se résumer ainsi :

Le modèle génère une première réponse.
Un système de validation déterministe vérifie cette réponse.
Les chiffres, les faits et les résultats sont comparés aux données réelles.
Si la réponse est correcte, elle est transmise à l’utilisateur.
Si elle contient une erreur, elle est rejetée et le modèle doit recommencer.

L’utilisateur final ne voit donc pas forcément la première réponse du modèle. Il voit uniquement une réponse qui a passé une couche de contrôle.

Cette approche rapproche l’IA des systèmes déterministes traditionnels, où le comportement est plus contrôlable et plus facile à auditer.

Des modèles plus petits, des coûts plus faibles

L’un des aspects les plus intéressants de l’approche de Probably concerne le coût.

Selon Peter Elias, plus l’ingénierie autour du modèle est solide, moins le modèle lui-même a besoin d’être puissant.

Cela signifie qu’une entreprise peut, dans certains cas, obtenir une grande fiabilité avec un modèle plus petit, à condition que le système de validation soit bien conçu.

L’impact économique est important.

Un grand modèle coûte cher. Il consomme plus de ressources. Il nécessite souvent une infrastructure cloud lourde. Il génère davantage de coûts liés aux tokens.

Un modèle plus petit, entouré d’un bon système de vérification, peut être plus rapide, moins coûteux et plus adapté à certains usages professionnels.

Cette approche peut changer la manière dont les entreprises conçoivent leurs applications IA. La question ne sera plus seulement : “Quel est le modèle le plus puissant ?” mais aussi : “Quel est le meilleur système de contrôle autour du modèle ?”

Un premier produit pour la data science

Le premier produit de Probably est destiné à la data science.

L’objectif est de permettre aux utilisateurs d’obtenir rapidement des réponses à partir de jeux de données complexes, tout en conservant deux éléments essentiels :

des citations, pour savoir d’où vient l’information ;
une trace d’audit, pour comprendre comment le résultat a été produit.

Ces deux éléments sont cruciaux dans un contexte professionnel.

Dans une entreprise, il ne suffit pas qu’une IA donne une réponse convaincante. Il faut pouvoir vérifier cette réponse, comprendre son origine et retracer le raisonnement ou le calcul qui a permis de l’obtenir.

C’est précisément ce que beaucoup d’outils IA actuels ne font pas encore assez bien.

Des usages bien au-delà de la data science

Même si le premier produit vise la data science, l’approche de Probably peut s’appliquer à de nombreux secteurs sensibles à la précision.

Comptabilité et facturation Une petite erreur de chiffre peut entraîner des conséquences financières ou juridiques.

Finance et assurance Les analyses doivent être fiables, surtout lorsqu’elles concernent le risque, les prêts ou les rapports réglementaires.

Droit Un avocat ne peut pas se permettre d’utiliser un système qui invente une jurisprudence ou une clause inexistante.

Santé Une recommandation erronée peut avoir des conséquences graves.

Ingénierie Les calculs, normes et décisions techniques doivent être vérifiables.

Dans tous ces secteurs, la question n’est pas seulement de savoir si l’IA peut produire une réponse bien formulée. La question est de savoir si cette réponse est exacte, traçable et défendable.

Pourquoi cette approche est importante

L’approche de Probably montre un changement de logique dans l’intelligence artificielle.

Jusqu’ici, la course s’est surtout concentrée sur la taille et la puissance des modèles. Les entreprises voulaient des modèles plus grands, plus généraux, capables de répondre à toutes sortes de demandes.

Mais pour beaucoup d’usages professionnels, ce n’est pas suffisant.

Une entreprise n’a pas seulement besoin d’une IA qui parle bien. Elle a besoin d’une IA qui donne des réponses vérifiables.

C’est là que l’approche de Probably devient intéressante. Au lieu de chercher uniquement à construire un modèle universel, la startup cherche à construire un système fiable pour des contextes où les données peuvent être contrôlées.

Un modèle général essaie de répondre à tout. Un système fiable répond surtout quand il peut vérifier.

Cette différence peut devenir centrale dans les prochaines années.

Ce que cela signifie pour les professionnels

Pour les entreprises et les professionnels, notamment au Maroc et dans le monde arabe, ce type de technologie est très important.

Les banques, compagnies d’assurance, cabinets comptables, administrations, avocats, médecins et ingénieurs manipulent tous des données sensibles. Dans ces contextes, une erreur générée par l’IA peut coûter cher.

L’avenir ne sera donc pas seulement d’utiliser directement ChatGPT, Claude ou d’autres modèles. L’avenir sera aussi de construire des solutions professionnelles autour de ces modèles, avec des données fiables, des validations, des sources et des traces d’audit.

Pour les développeurs indépendants, c’est une vraie opportunité.

Les entreprises auront besoin de solutions sur mesure combinant :

un modèle de langage ;
une base de données fiable ;
une couche de validation ;
des citations ;
une trace d’audit ;
une interface simple pour les utilisateurs.

Autrement dit, la valeur ne sera pas seulement dans l’utilisation de l’IA, mais dans la capacité à rendre l’IA fiable dans un vrai contexte métier.

La prochaine phase de l’intelligence artificielle ne sera donc pas uniquement celle du modèle le plus puissant.

Elle sera aussi celle du système le plus fiable.

Et c’est précisément le terrain sur lequel Probably veut se positionner.

Probably lève 9 millions de dollars pour rendre l’IA plus fiable et moins sujette aux hallucinations

Probably lève 9 millions de dollars pour rendre l’IA plus fiable et moins sujette aux hallucinations

Les hallucinations restent le grand problème de l’IA

L’idée de Probably

Une architecture basée sur la validation

Des modèles plus petits, des coûts plus faibles

Un premier produit pour la data science

Des usages bien au-delà de la data science

Pourquoi cette approche est importante

Ce que cela signifie pour les professionnels

Articles liés

Varya : le modèle vidéo IA d'Avataar, conçu pour l'Inde

WindBorne : la startup IA qui prédit le temps mieux que les gouvernements

STAM 2026 : l'Afrique fabrique ses propres téléphones

L'Europe veut construire, pas seulement réguler