Sous le capot

Un pipeline construit
pour ne pas
inventer.

Chaque composant a un rôle précis. Rien n'est une boîte noire. Voici comment le système fonctionne — dans l'ordre où il travaille.

Génération
Claude API
Articles longs, voix de marque, narration structurée.
RAG natif
Command-R+
Q&A sourcé, citations précises, retrieval natif.
Local / souverain
Mistral Nemo
Chunking, évaluation, audit. Via Ollama, OVH.
Vectoriel
Qdrant
Recherche sémantique + filtres métadonnées.
01 — Orchestration multi-modèles

Le bon modèle
pour la bonne tâche.

Le pipeline sélectionne automatiquement le modèle selon le type de contenu demandé. Pas de modèle universel — chaque outil à sa place.

Article éditorial long
→ Claude API
Chunks + persona de marque + arc narratif. Cohérence longue distance.
Q&A documentaire
→ Command-R+
Retrieval natif, citation de source, réponse courte et précise.
Enrichissement web
→ Perplexity
Données temps réel, veille sectorielle. Vos sources internes non exposées.
Évaluation / audit
→ Nemo local
Léger, rapide, souverain. Audite sans générer. Seuil de refus.
02 — Système de filtrage

Ce qui se passe avant
que le modèle réponde.

Le seuil de similarité
Chaque fragment récupéré reçoit un score entre 0 et 1. En dessous du seuil configuré — écarté automatiquement. Le modèle ne reçoit que ce qui dépasse le seuil.
Fragment A
0.84 ✓
Fragment B
0.71 ✓
Fragment C
0.48 ✗
Seuil : 0.65 — Fragment C écarté
Le seuil de refus
Si aucun fragment ne dépasse le seuil, le système répond : "Cette information n'est pas disponible dans les sources." Jamais d'approximation à la place de la vérité.
Filtrage par métadonnées
Avant la recherche sémantique, les métadonnées restreignent le périmètre. Une question sur une norme ne cherche que dans les documents certifiés.
Type · Fiche · Certification · Éditorial
Segment · B2B · Grand public · Technique
Certitude · Vérifié · Estimé · À valider
Fraîcheur · Version · Date de mise à jour
Audit automatique
Un second modèle (Nemo) évalue chaque sortie avant livraison : conformité technique, rigueur des données, adéquation du ton. Score avant votre première relecture.
Conformité technique✓ 100%
Rigueur des données✓ 98%
Score global97%
03 — Interface métier

Piloter sans être
ingénieur.

Ce que vos équipes font seules
Ajouter ou mettre à jour des documents sources
Déclencher une nouvelle ingestion
Consulter les sorties et leur score d'audit
Valider ou rejeter avant publication
Choisir le modèle selon le type de contenu
Formats de sortie
JSON
CMS, CRM, API tierces
Markdown
Publication directe CMS
HTML
Email, pages web
Texte
Réseaux sociaux, notifs
Latence : 2 à 8 secondes selon la complexité. Recherche pure : 100–300ms.

Une question sur
votre cas d'usage ?

On préfère une conversation directe à une documentation exhaustive. Décrivez votre contexte — on évalue ensemble.

01
Traitement souverain
Chunking, embeddings, évaluation — tout reste sur votre VPS OVH.
02
Génération via Claude API
Vos sources ne quittent pas votre infra. Seul le prompt structuré part à l'API.
03
Stack 100% open source
Auditable, documentée, transférable. Vous n'êtes captif d'aucun éditeur.