Sous le capot

Un pipeline construit
pour ne pas
inventer.

Chaque composant a un rôle précis. Rien n'est une boîte noire. Voici comment le système fonctionne — dans l'ordre où il travaille.

Génération

Claude API

Articles longs, voix de marque, narration structurée.

RAG natif

Command-R+

Q&A sourcé, citations précises, retrieval natif.

Local / souverain

Mistral Nemo

Chunking, évaluation, audit. Via Ollama, OVH.

Vectoriel

Qdrant

Recherche sémantique + filtres métadonnées.

01 — Orchestration multi-modèles

Le bon modèle
pour la bonne tâche.

Le pipeline sélectionne automatiquement le modèle selon le type de contenu demandé. Pas de modèle universel — chaque outil à sa place.

Article éditorial long

→ Claude API

Chunks + persona de marque + arc narratif. Cohérence longue distance.

Q&A documentaire

→ Command-R+

Retrieval natif, citation de source, réponse courte et précise.

Enrichissement web

→ Perplexity

Données temps réel, veille sectorielle. Vos sources internes non exposées.

Évaluation / audit

→ Nemo local

Léger, rapide, souverain. Audite sans générer. Seuil de refus.

02 — Système de filtrage

Ce qui se passe avant
que le modèle réponde.

Le seuil de similarité

Chaque fragment récupéré reçoit un score entre 0 et 1. En dessous du seuil configuré — écarté automatiquement. Le modèle ne reçoit que ce qui dépasse le seuil.

Fragment A

0.84 ✓

Fragment B

0.71 ✓

Fragment C

0.48 ✗

Seuil : 0.65 — Fragment C écarté

Le seuil de refus

Si aucun fragment ne dépasse le seuil, le système répond : "Cette information n'est pas disponible dans les sources." Jamais d'approximation à la place de la vérité.

Filtrage par métadonnées

Avant la recherche sémantique, les métadonnées restreignent le périmètre. Une question sur une norme ne cherche que dans les documents certifiés.

Type · Fiche · Certification · Éditorial

Segment · B2B · Grand public · Technique

Certitude · Vérifié · Estimé · À valider

Fraîcheur · Version · Date de mise à jour

Audit automatique

Un second modèle (Nemo) évalue chaque sortie avant livraison : conformité technique, rigueur des données, adéquation du ton. Score avant votre première relecture.

Conformité technique✓ 100%

Rigueur des données✓ 98%

Score global97%

03 — Interface métier

Piloter sans être
ingénieur.

Ce que vos équipes font seules

Ajouter ou mettre à jour des documents sources

Déclencher une nouvelle ingestion

Consulter les sorties et leur score d'audit

Valider ou rejeter avant publication

Choisir le modèle selon le type de contenu

Formats de sortie

JSON

CMS, CRM, API tierces

Markdown

Publication directe CMS

HTML

Email, pages web

Texte

Réseaux sociaux, notifs

Latence : 2 à 8 secondes selon la complexité. Recherche pure : 100–300ms.

Une question sur
votre cas d'usage ?

On préfère une conversation directe à une documentation exhaustive. Décrivez votre contexte — on évalue ensemble.

Traitement souverain

Chunking, embeddings, évaluation — tout reste sur votre VPS OVH.

Génération via Claude API

Vos sources ne quittent pas votre infra. Seul le prompt structuré part à l'API.

Stack 100% open source

Auditable, documentée, transférable. Vous n'êtes captif d'aucun éditeur.

Un pipeline construitpour ne pasinventer.

Le bon modèlepour la bonne tâche.

Ce qui se passe avantque le modèle réponde.

Piloter sans êtreingénieur.

Une question survotre cas d'usage ?

Un pipeline construit
pour ne pas
inventer.

Le bon modèle
pour la bonne tâche.

Ce qui se passe avant
que le modèle réponde.

Piloter sans être
ingénieur.

Une question sur
votre cas d'usage ?