Le backend IA de Puxxle : conçu pour refuser les hallucinations

Une maison aux chambres élégantes et sans fournaise

C'est l'une des choses les plus désorientantes des logiciels modernes : un produit qui a l'air de fonctionner.

Puxxle, une plateforme de recherche basée à Montréal, est le type d'outil qu'un concepteur de produit ou un chef de produit peut utiliser pour donner un sens à une série d'entretiens avec des clients. Au moment où les travaux ont commencé, l'interface avait été pensée en détail. Les flux étaient propres. La marque était confiante. Une vidéo de démonstration a été diffusée sur les écrans avec une sorte de finition qui incite les investisseurs à arrêter de faire défiler la page.

Ce qu'il ne possédait pas, c'était la partie du produit pour laquelle tout le monde serait réellement prêt à payer. La couche de renseignement qui lit les recherches, découvre ce qui compte et répond aux questions les concernant n'a pas été construite. Le directeur technique de Puxxle, Alexei Savchenko, a été le premier à reconnaître ce qui manquait. Le produit avait un visage, un corps et un pouls. Il n'avait pas encore de cerveau.

C'est plus courant que ce que l'industrie admet habituellement. La génération actuelle d'IA générative a rendu la coque d'un produit intelligent beaucoup plus facile à construire que la substance elle-même. Une équipe peut envoyer quelque chose qui fournit des informations dans une démo et qui reste vide entre les mains d'un utilisateur réel.

La fragilité de la recherche qualitative

La recherche qualitative est la partie la plus lente et la plus contestée du processus de fabrication d'un produit. Une équipe organise vingt entretiens, accumule des centaines de pages de transcriptions et passe deux semaines à les lire à la main. Au moment où une découverte parvient à une réunion, la moitié de la salle soupçonne que la chercheuse n'a trouvé que ce qu'elle cherchait. Ce qui est fragile dans la recherche qualitative, ce n'est pas ce qu'elle trouve. C'est ce qu'il ne peut pas prouver. Puxxle a été conçu pour supprimer cette vulnérabilité : en téléchargeant la recherche, le système l'étiquetait, l'organisait et permettait à l'équipe de l'interroger en langage clair, chaque affirmation étant ancrée dans une citation réelle dans une vraie interview.

La décision prise par Morgane avant l'écriture de tout code

La décision la plus importante a été prise par la fondatrice et PDG de Puxxle, Morgane Neto, avant qu'une seule ligne de code de production n'existe.

Le système ne serait pas autorisé à inventer.

Si un utilisateur posait une question à laquelle la recherche sous-jacente ne pouvait pas répondre, le système était tenu de le dire. C'est à ne pas deviner. Ne pas planer. Ne pas composer une réponse plausible en assemblant des éléments adjacents. Si un utilisateur demandait quelque chose hors de portée, le système refuserait. Chaque affirmation contenue dans une réponse devait être liée à un extrait spécifique provenant d'une source spécifique. Non paraphrasé à proximité. Cité.

Il ne s'agit pas d'un choix technologique. Il s'agit d'une norme, et les normes de ce type sont inhabituelles dans un jeune produit d'IA. Morgane était d'avis que ses utilisateurs souhaitaient autre chose qu'une réponse sûre : ils voulaient savoir si les données étayaient l'affirmation. Si c'était le cas, ils voulaient l'affirmation, avec leurs sources. Si ce n'était pas le cas, ils voulaient que le système le dise clairement.

Une telle norme recadre complètement le travail d'ingénierie. Il n'est plus difficile de faire parler un mannequin. Il s'agit de lui apprendre à garder le silence.

Preuve, pas éloquente

La première étape a consisté à éloigner le modèle génératif du centre du système. Le prototype que Puxxle avait construit avant l'arrivée d'INTO a envoyé l'intégralité du document à OpenAI avec une seule instruction. Un système à invite unique ne sait pas d'où viennent ses réponses. Elle ne peut que générer, couramment et en toute confiance, qu'elle ait ou non une activité dans ce domaine.

Le système qui l'a remplacé fonctionne différemment. La plupart de ce que cela fait se produit avant qu'un modèle ne soit consulté. Les informations personnelles sont supprimées lors de l'ingestion à l'aide de la bibliothèque open source Presidio de Microsoft. Le texte est segmenté et indexé dans Milvus, une base de données vectorielle qui permet au système de trouver les fragments pertinents d'un corpus quels que soient les mots utilisés pour demander. Un vocabulaire thématique cohérent est appliqué à l'ensemble du matériel, et chaque balise pointe vers la ligne de texte qui l'a mérité.

Ce n'est qu'à la fin, lorsqu'une réponse doit être écrite pour qu'un humain puisse la lire, qu'OpenAI entre en scène. D'ici là, la question a été restreinte, les preuves ont été récupérées et le travail du mannequin est celui pour lequel il est vraiment doué : rédiger un paragraphe clair sur le matériel qui lui a été remis. Si le matériau n'est pas là, le modèle n'est pas invité à fonctionner.

Ce que fait réellement l'utilisateur

Une chercheuse télécharge ses entretiens, ses tickets d'assistance ou ses enquêtes. Le système les lit, supprime les informations personnelles, indexe le contenu et étiquette les passages en fonction d'un vocabulaire cohérent sur lequel l'équipe s'est mise d'accord. Il s'agit d'un premier passage minutieux qu'un humain peut auditer et affiner.

La fonctionnalité la plus intéressante est le chat. Un designer peut demander à Puxxle, en anglais clair, ce qui frustre un type de client en particulier en matière d'intégration, et recevoir en retour un paragraphe synthétisant la réponse avec trois citations directes jointes. Elle peut montrer ce paragraphe à un chef de produit sceptique, qui peut cliquer sur les transcriptions complètes pour voir les citations dans leur contexte. L'argument qu'elle avance ne relève plus de son autorité. C'est une question de preuve.

Lorsque les données ne permettent pas de répondre à la question, le système l'indique. Il explique pourquoi et propose la prochaine étape. C'est la fonctionnalité qui permet de gagner la confiance dès qu'un client comprend ce qui se passe.

Ce que Puxxle peut dire maintenant

Le système a été déployé dans l'environnement Google Cloud Platform de Puxxle, avec le code dans leur référentiel GitHub. Morgane a signé en septembre 2025. Le système répondait à la norme qu'elle avait établie au début.

Avant les travaux, Puxxle disposait d'un produit intelligent. Après cela, Puxxle propose un produit qui fait preuve de rigueur. Un outil de recherche dont les réponses ne peuvent pas être vérifiées est une curiosité ; un outil de recherche dont chaque affirmation est ancrée dans une citation réelle faite lors d'un entretien est quelque chose qu'un chercheur défendra lors d'une réunion et que l'acheteur paiera. Le standard défini par Morgane au début est désormais la fonctionnalité qu'elle peut vendre.

Sébastien Brault

Connectons-nous

À propos

Grâce à son expertise en matière de stratégie et de gestion de produits, Sébastien aide les organisations à intégrer l'IA dans leurs opérations et services commerciaux.

Résumé de l'article

Puxxle, une plateforme de recherche en IA basée à Montréal pour les concepteurs de produits et les gestionnaires de produits, disposait d'une interface raffinée et d'une véritable attraction client, mais aucune capacité d'ingénierie interne en matière d'IA. Avant l'écriture de tout code, la norme était fixée : le système ne serait pas autorisé à inventer. INTO a construit le moteur du produit, conçu sur la base de preuves plutôt que sur l'éloquence, chaque réponse étant ancrée dans une citation réelle et le refus en tant que caractéristique. Puxxle possède et exploite désormais le système dans son propre cloud.

Partagez cette histoire →

Le moteur qui savait quand se taire : au cœur de l'infrastructure IA de Puxxle