Modèles LLM et configuration avancée
Cette page explique en détail comment choisir et configurer le modèle LLM utilisé par chaque agent d’automatisation. Vous y trouverez les flux pas-à-pas pour sélectionner un modèle par étape, créer/éditer/dupliquer/exécuter un agent, des conseils pratiques pour choisir le modèle adapté à chaque type de workflow, et des stratégies pour gérer les cas limites et erreurs fréquentes.
Modèles LLM et configuration avancée
Sélection, bonnes pratiques et scénarios recommandés pour chaque type d'agent
Contrôlez finement quel modèle LLM chaque étape d’un agent utilise et optimisez coût, latence et qualité de sortie.
Ce que vous pouvez faire ici
Sélection par étape
Attribuer un modèle LLM différent à chaque étape d’un agent (ou laisser le modèle par défaut).
Inventaire géré
La liste des modèles disponibles est fournie via l’interface de sélection et exclut automatiquement certains modèles système non destinés à l’usage direct.
Optimisation avancée
Conseils pour répartir les étapes entre modèles légers et modèles haute-capacité afin de contrôler coûts et performances.
Exécution flexible
Associer un agent à un déclencheur planifié ou l’exécuter manuellement depuis l’interface.
Validation et robustesse
Stratégies pour valider et normaliser les sorties (format JSON/CSV), et pour gérer les réessais.
Duplication et templates
Dupliquer des agents pour créer rapidement des variantes avec d’autres modèles ou prompts.
Avant de commencer — bref rappel
- La sélection des modèles se fait dans le sélecteur affiché au niveau de chaque étape d’un agent. Certains modèles système (par exemple dédiés aux embeddings ou aux usages internes) sont exclus de la liste présentée.
- Si un champ modèle est laissé vide, l’agent utilisera le modèle par défaut du projet (ou de la plateforme), selon la configuration. Vous pouvez donc définir des exceptions étape par étape.
Commencez simple
Pour un nouvel agent, testez d’abord avec un modèle standard (profil équilibré). Une fois le flow validé, remplacez certaines étapes par des modèles plus puissants uniquement là où c’est nécessaire.
Séparez extraction et génération
Utilisez des modèles légers pour extraction/normalisation (plus rapides et moins coûteux) et réservez les modèles haute-capacité aux étapes créatives ou de synthèse.
Sélectionner un modèle LLM pour chaque étape d’un agent
Étape 1 — Ouvrir l’éditeur d’agent
Accédez à la liste des agents du projet et ouvrez l’éditeur (ou créez un nouvel agent) via le bouton “Agent” / “Create” ou “Edit”.
Étape 2 — Identifier l’étape à configurer
Dans la section Steps, repérez l’étape pour laquelle vous voulez définir un modèle (par ex. Step 1, Step 2).
Étape 3 — Ouvrir le sélecteur de modèle
Sous le bloc Prompt de l’étape, cliquez sur le menu de sélection du modèle (champ “Select AI Model”).
Étape 4 — Choisir un modèle
Sélectionnez le modèle souhaité dans la liste. Si vous ne voulez pas spécifier un modèle, laissez le champ vide pour utiliser le modèle par défaut.
Étape 5 — Sauvegarder
Une fois vos changements faits pour chaque étape, cliquez sur “Save” pour enregistrer l’agent.
Étape 6 — Vérifier après sauvegarde
Testez l’agent avec un run manuel pour vérifier que la sortie correspond aux attentes (format, qualité, latence).
Create / Edit / Duplicate / Execute — procédures pas-à-pas
Créer un agent (workflow détaillé)
Étape 1 — Ouvrir le dialogue de création
Dans la zone Agents du projet, cliquez sur “Create Agent” ou l’équivalent pour ouvrir le dialogue de création.
Étape 2 — Définir le nom et la description
Saisissez un nom clair et une description courte pour savoir à quoi sert cet agent.
Étape 3 — Ajouter des steps
Cliquez sur “Add Step” autant de fois que nécessaire. Pour chaque step, renseignez le Prompt (template) et, si besoin, le modèle LLM (voir sélection par étape).
Étape 4 — Configurer dépendances et boucle
Si une étape doit attendre la sortie d’une autre, définissez les dépendances. Si une étape doit s’exécuter en boucle sur un tableau, configurez le champ “Loop On”.
Étape 5 — Tester la logique
Avant de finaliser, exécutez un test manuel en donnant un input représentatif pour valider le comportement (format de sortie, erreurs).
Étape 6 — Sauvegarder et publier
Cliquez “Save”. L’agent est désormais prêt à être associé à des déclencheurs ou lancé manuellement.
Éditer un agent existant
Étape 1 — Ouvrir l’agent
Sélectionnez l’agent dans la liste et cliquez sur “Edit” pour ouvrir le dialogue d’édition.
Étape 2 — Modifier étapes et modèles
Modifiez les prompts, changez les modèles pour certaines étapes, ajustez les dépendances et les boucles si nécessaire.
Étape 3 — Valider la cohérence
Assurez-vous que les étapes qui consomment les sorties précédentes attendent le bon format (ex. JSON array si vous utilisez “Loop On”).
Étape 4 — Sauvegarder et retester
Enregistrez puis lancez un run de test pour vérifier le résultat après modification.
Dupliquer un agent
Étape 1 — Sélectionner l’agent à copier
Dans la liste, sélectionnez l’agent que vous voulez cloner.
Étape 2 — Cliquer sur Duplicate
Utilisez la fonction “Duplicate” (ou “Duplicate Agent”) pour créer une copie. Une nouvelle instance est générée avec un nouveau nom.
Étape 3 — Adapter la copie
Ouvrez la copie, renommez-la et modifiez les modèles et prompts selon le nouveau besoin (p. ex. tester un modèle différent).
Étape 4 — Sauvegarder et tester
Sauvegardez puis testez la copie indépendamment de l’original.
Exécuter un agent — manuel ou via déclencheur
Étape 1 — Lancer manuellement
Depuis la vue de l’agent, cliquez sur “Run” / “Execute” et saisissez l’input utilisateur attendu. Validez pour démarrer.
Étape 2 — Associer à un déclencheur (Hook)
Pour automatiser, créez ou éditez un Hook, sélectionnez l’agent à associer, définissez l’événement déclencheur (push, schedule…) et sauvegardez.
Étape 3 — Surveiller l’exécution
Consultez les logs et changelogs pour vérifier les sorties, erreurs et éventuelles consommations de crédits.
Étape 4 — Itérer
Si la sortie n’est pas correcte, ajustez prompts, modèle ou ajoutez une étape de validation, puis relancez.
Pièges fréquents et limites
- Certains modèles présentés dans la plateforme sont volontairement exclus (ex. modèles internes ou spécialisés). Si vous ne trouvez pas le modèle attendu, vérifiez les permissions ou demandez à votre administrateur.
- Les modèles ont des limites de tokens et peuvent tronquer de longs prompts ou réponses : scindez les entrées trop volumineuses.
- Laisser le champ modèle vide fait confiance au modèle par défaut : vérifiez quel modèle par défaut est appliqué à votre projet si le coût ou la latence est critique.
Approches avancées et recommandations pratiques
Optimiser l'usage des modèles par étape
Étape 1 — Classifier les rôles des étapes
Identifiez pour chaque étape si elle est : extraction/normalisation, augmentation/RAG, génération créative, ou validation.
Étape 2 — Assigner un profil de modèle
- Extraction/normalisation : modèles légers (faible coût, faible latence).
- Augmentation/RAG : modèles capables d’intégrer contexte externe ; privilégiez stabilité sur créativité.
- Génération finale (texte long, style) : modèles haute-capacité pour meilleure cohérence.
Étape 3 — Minimiser les appels couteux
Réservez les modèles coûteux aux étapes où la différence de qualité est perceptible pour l’utilisateur final.
Étape 4 — Ajouter des étapes de validation
Incluez une étape qui vérifie la structure et le format (ex. JSON schema) : si erreur, boucle de correction ou fallback vers un modèle spécialisé.
Étape 5 — Monitoring
Surveillez la qualité et la consommation : ajustez modèles et prompts en fonction des résultats et du budget.
Forcer un format de sortie fiable
Demandez explicitement une sortie JSON strictement formatée (avec un exemple minimal) et ajoutez une étape de validation qui rejette et relance la requête en cas d’erreur de parsing.
Recommandation : utiliser un modèle stable, à faible température, capable d’intégrer des passages externes. Choisissez un modèle qui gère bien le context window large si vous passez beaucoup de contexte. Conseil : limitez la quantité de contexte envoyé, faites une étape d’extraction des passages pertinents puis une étape de synthèse.
Comparaison rapide
- Modèle léger : coût faible, latence faible, sortie parfois moins riche.
- Modèle puissant : coût élevé, latence plus longue, meilleure cohérence.
Avant / Après optimisation
- Avant : un seul modèle puissant pour toutes les étapes → coûts élevés, temps de réponse long.
- Après : modèles mixtes par étape → meilleur ratio coût/qualité et résilience.
Cas limites et solutions pratiques
- Si une étape attend un tableau mais reçoit une chaîne : ajoutez une étape pré-parseur qui force la sortie en tableau (donner l’instruction “Répond uniquement par un tableau JSON”).
- Si un modèle refuse ou ignore une instruction de format : réduisez la température, donnez un exemple minimal, ou post-traitez la réponse avec une étape de nettoyage.
- Si le modèle n’est pas disponible dans la liste : vérifiez les droits de votre compte ou demandez l’ajout via l’équipe plateforme.
Limiter les coûts imprévus
Pour des runs fréquents planifiés, utilisez des modèles économes sur les étapes répétitives et conservez l’usage des modèles coûteux pour les exécutions déclenchées manuellement ou en cas d’exception.
FAQ — Questions fréquentes
Frequently Asked Questions
Conclusion — mettre en place une stratégie de modèles cohérente permet d’optimiser coûts, latence et qualité. Commencez par des tests simples, validez les formats de sortie et évoluez vers une configuration multi-modèles par étape pour les workflows critiques.