Modèles LLM et configuration avancée

Cette page explique en détail comment choisir et configurer le modèle LLM utilisé par chaque agent d’automatisation. Vous y trouverez les flux pas-à-pas pour sélectionner un modèle par étape, créer/éditer/dupliquer/exécuter un agent, des conseils pratiques pour choisir le modèle adapté à chaque type de workflow, et des stratégies pour gérer les cas limites et erreurs fréquentes.

Modèles LLM et configuration avancée

Sélection, bonnes pratiques et scénarios recommandés pour chaque type d'agent

Contrôlez finement quel modèle LLM chaque étape d’un agent utilise et optimisez coût, latence et qualité de sortie.

Ce que vous pouvez faire ici

Sélection par étape

Attribuer un modèle LLM différent à chaque étape d’un agent (ou laisser le modèle par défaut).

Inventaire géré

La liste des modèles disponibles est fournie via l’interface de sélection et exclut automatiquement certains modèles système non destinés à l’usage direct.

Optimisation avancée

Conseils pour répartir les étapes entre modèles légers et modèles haute-capacité afin de contrôler coûts et performances.

Exécution flexible

Associer un agent à un déclencheur planifié ou l’exécuter manuellement depuis l’interface.

Validation et robustesse

Stratégies pour valider et normaliser les sorties (format JSON/CSV), et pour gérer les réessais.

Duplication et templates

Dupliquer des agents pour créer rapidement des variantes avec d’autres modèles ou prompts.

Avant de commencer — bref rappel

  • La sélection des modèles se fait dans le sélecteur affiché au niveau de chaque étape d’un agent. Certains modèles système (par exemple dédiés aux embeddings ou aux usages internes) sont exclus de la liste présentée.
  • Si un champ modèle est laissé vide, l’agent utilisera le modèle par défaut du projet (ou de la plateforme), selon la configuration. Vous pouvez donc définir des exceptions étape par étape.

Commencez simple

Pour un nouvel agent, testez d’abord avec un modèle standard (profil équilibré). Une fois le flow validé, remplacez certaines étapes par des modèles plus puissants uniquement là où c’est nécessaire.

Séparez extraction et génération

Utilisez des modèles légers pour extraction/normalisation (plus rapides et moins coûteux) et réservez les modèles haute-capacité aux étapes créatives ou de synthèse.

Sélectionner un modèle LLM pour chaque étape d’un agent

1

Étape 1 — Ouvrir l’éditeur d’agent

Accédez à la liste des agents du projet et ouvrez l’éditeur (ou créez un nouvel agent) via le bouton “Agent” / “Create” ou “Edit”.

2

Étape 2 — Identifier l’étape à configurer

Dans la section Steps, repérez l’étape pour laquelle vous voulez définir un modèle (par ex. Step 1, Step 2).

3

Étape 3 — Ouvrir le sélecteur de modèle

Sous le bloc Prompt de l’étape, cliquez sur le menu de sélection du modèle (champ “Select AI Model”).

4

Étape 4 — Choisir un modèle

Sélectionnez le modèle souhaité dans la liste. Si vous ne voulez pas spécifier un modèle, laissez le champ vide pour utiliser le modèle par défaut.

5

Étape 5 — Sauvegarder

Une fois vos changements faits pour chaque étape, cliquez sur “Save” pour enregistrer l’agent.

6

Étape 6 — Vérifier après sauvegarde

Testez l’agent avec un run manuel pour vérifier que la sortie correspond aux attentes (format, qualité, latence).

Create / Edit / Duplicate / Execute — procédures pas-à-pas

Créer un agent (workflow détaillé)

1

Étape 1 — Ouvrir le dialogue de création

Dans la zone Agents du projet, cliquez sur “Create Agent” ou l’équivalent pour ouvrir le dialogue de création.

2

Étape 2 — Définir le nom et la description

Saisissez un nom clair et une description courte pour savoir à quoi sert cet agent.

3

Étape 3 — Ajouter des steps

Cliquez sur “Add Step” autant de fois que nécessaire. Pour chaque step, renseignez le Prompt (template) et, si besoin, le modèle LLM (voir sélection par étape).

4

Étape 4 — Configurer dépendances et boucle

Si une étape doit attendre la sortie d’une autre, définissez les dépendances. Si une étape doit s’exécuter en boucle sur un tableau, configurez le champ “Loop On”.

5

Étape 5 — Tester la logique

Avant de finaliser, exécutez un test manuel en donnant un input représentatif pour valider le comportement (format de sortie, erreurs).

6

Étape 6 — Sauvegarder et publier

Cliquez “Save”. L’agent est désormais prêt à être associé à des déclencheurs ou lancé manuellement.

Éditer un agent existant

1

Étape 1 — Ouvrir l’agent

Sélectionnez l’agent dans la liste et cliquez sur “Edit” pour ouvrir le dialogue d’édition.

2

Étape 2 — Modifier étapes et modèles

Modifiez les prompts, changez les modèles pour certaines étapes, ajustez les dépendances et les boucles si nécessaire.

3

Étape 3 — Valider la cohérence

Assurez-vous que les étapes qui consomment les sorties précédentes attendent le bon format (ex. JSON array si vous utilisez “Loop On”).

4

Étape 4 — Sauvegarder et retester

Enregistrez puis lancez un run de test pour vérifier le résultat après modification.

Dupliquer un agent

1

Étape 1 — Sélectionner l’agent à copier

Dans la liste, sélectionnez l’agent que vous voulez cloner.

2

Étape 2 — Cliquer sur Duplicate

Utilisez la fonction “Duplicate” (ou “Duplicate Agent”) pour créer une copie. Une nouvelle instance est générée avec un nouveau nom.

3

Étape 3 — Adapter la copie

Ouvrez la copie, renommez-la et modifiez les modèles et prompts selon le nouveau besoin (p. ex. tester un modèle différent).

4

Étape 4 — Sauvegarder et tester

Sauvegardez puis testez la copie indépendamment de l’original.

Exécuter un agent — manuel ou via déclencheur

1

Étape 1 — Lancer manuellement

Depuis la vue de l’agent, cliquez sur “Run” / “Execute” et saisissez l’input utilisateur attendu. Validez pour démarrer.

2

Étape 2 — Associer à un déclencheur (Hook)

Pour automatiser, créez ou éditez un Hook, sélectionnez l’agent à associer, définissez l’événement déclencheur (push, schedule…) et sauvegardez.

3

Étape 3 — Surveiller l’exécution

Consultez les logs et changelogs pour vérifier les sorties, erreurs et éventuelles consommations de crédits.

4

Étape 4 — Itérer

Si la sortie n’est pas correcte, ajustez prompts, modèle ou ajoutez une étape de validation, puis relancez.

Pièges fréquents et limites

  • Certains modèles présentés dans la plateforme sont volontairement exclus (ex. modèles internes ou spécialisés). Si vous ne trouvez pas le modèle attendu, vérifiez les permissions ou demandez à votre administrateur.
  • Les modèles ont des limites de tokens et peuvent tronquer de longs prompts ou réponses : scindez les entrées trop volumineuses.
  • Laisser le champ modèle vide fait confiance au modèle par défaut : vérifiez quel modèle par défaut est appliqué à votre projet si le coût ou la latence est critique.

Approches avancées et recommandations pratiques

Optimiser l'usage des modèles par étape

1

Étape 1 — Classifier les rôles des étapes

Identifiez pour chaque étape si elle est : extraction/normalisation, augmentation/RAG, génération créative, ou validation.

2

Étape 2 — Assigner un profil de modèle

  • Extraction/normalisation : modèles légers (faible coût, faible latence).
  • Augmentation/RAG : modèles capables d’intégrer contexte externe ; privilégiez stabilité sur créativité.
  • Génération finale (texte long, style) : modèles haute-capacité pour meilleure cohérence.
3

Étape 3 — Minimiser les appels couteux

Réservez les modèles coûteux aux étapes où la différence de qualité est perceptible pour l’utilisateur final.

4

Étape 4 — Ajouter des étapes de validation

Incluez une étape qui vérifie la structure et le format (ex. JSON schema) : si erreur, boucle de correction ou fallback vers un modèle spécialisé.

5

Étape 5 — Monitoring

Surveillez la qualité et la consommation : ajustez modèles et prompts en fonction des résultats et du budget.

Forcer un format de sortie fiable

Demandez explicitement une sortie JSON strictement formatée (avec un exemple minimal) et ajoutez une étape de validation qui rejette et relance la requête en cas d’erreur de parsing.

Recommandation : utiliser un modèle stable, à faible température, capable d’intégrer des passages externes. Choisissez un modèle qui gère bien le context window large si vous passez beaucoup de contexte. Conseil : limitez la quantité de contexte envoyé, faites une étape d’extraction des passages pertinents puis une étape de synthèse.

Recommandation : modèles haute-capacité et température plus élevée pour créativité. Utilisez un modèle plus puissant uniquement pour la dernière étape de réécriture/synthèse. Astuce : faites d’abord une étape d’outline (léger) puis une étape de rédaction finale (puissant).

Recommandation : modèles rapides et déterministes (température basse). Demandez des sorties strictement formatées, idéalement en CSV/JSON pour ingestion automatique.

Remarque : les modèles d’embedding sont spécialisés et souvent gérés séparément par la plateforme. Pour indexation et recherche vectorielle, utilisez les modèles d’embeddings recommandés par la plateforme.

Comparaison rapide

  • Modèle léger : coût faible, latence faible, sortie parfois moins riche.
  • Modèle puissant : coût élevé, latence plus longue, meilleure cohérence.

Avant / Après optimisation

  • Avant : un seul modèle puissant pour toutes les étapes → coûts élevés, temps de réponse long.
  • Après : modèles mixtes par étape → meilleur ratio coût/qualité et résilience.

Cas limites et solutions pratiques

  • Si une étape attend un tableau mais reçoit une chaîne : ajoutez une étape pré-parseur qui force la sortie en tableau (donner l’instruction “Répond uniquement par un tableau JSON”).
  • Si un modèle refuse ou ignore une instruction de format : réduisez la température, donnez un exemple minimal, ou post-traitez la réponse avec une étape de nettoyage.
  • Si le modèle n’est pas disponible dans la liste : vérifiez les droits de votre compte ou demandez l’ajout via l’équipe plateforme.

Limiter les coûts imprévus

Pour des runs fréquents planifiés, utilisez des modèles économes sur les étapes répétitives et conservez l’usage des modèles coûteux pour les exécutions déclenchées manuellement ou en cas d’exception.

FAQ — Questions fréquentes

Frequently Asked Questions

Conclusion — mettre en place une stratégie de modèles cohérente permet d’optimiser coûts, latence et qualité. Commencez par des tests simples, validez les formats de sortie et évoluez vers une configuration multi-modèles par étape pour les workflows critiques.