Historique, streaming et limites
Historique, streaming et limites
Comprendre comment naviguer l'historique de vos conversations, suivre les réponses en streaming et gérer les quotas et comportements selon le modèle
Maîtrisez l’historique de chat, la gestion des réponses longues en streaming et les limites pour obtenir des réponses rapides, fiables et économes en crédits.
Ce que couvre cette page
Historique de conversation
Accédez, naviguez, réutilisez et nettoyez les échanges précédents. Conservez le contexte utile et supprimez ce qui est obsolète.
Streaming des réponses
Suivez la génération progressive des réponses longues, copiez des sections partielles et gérez les interruptions ou erreurs.
Limites et quotas
Comprenez les limites de taux, la consommation de crédits liée aux recherches de contexte et au LLM, et adaptez votre usage selon le modèle sélectionné.
Introduction
Cette page explique, pas à pas, comment utiliser l’historique de conversation du mode “Chat avec le code”, comment suivre et gérer les réponses longues envoyées en streaming, et comment anticiper ou réagir aux limites (taux, quotas, comportement des modèles). Vous trouverez des workflows détaillés, des conseils pratiques et des solutions aux problèmes courants.
Démarrer une conversation — pas à pas
Ouvrir l'onglet Chat with code
- Dans l’interface du projet, cliquez sur l’onglet “Chat avec le code”.
- Assurez-vous d’être dans le bon projet (nom affiché en haut).
- Vérifiez que la liste des messages s’affiche et que la zone de saisie est prête.
Sélectionner un modèle IA
- Ouvrez le menu de sélection de modèle situé près de la zone d’entrée.
- Choisissez un modèle adapté à votre besoin (réponses rapides et courtes = modèle léger ; réponses détaillées et longues = modèle plus grand).
- Notez que certains modèles prennent en charge le streaming des réponses (voir section comportement par modèle).
Saisir et envoyer votre message
- Rédigez votre question ou demande dans la zone prévue.
- Si vous voulez inclure une référence (nom de fichier, fonction, extrait), mentionnez-la clairement dans votre message.
- Appuyez sur Envoyer. Le système va enrichir automatiquement la requête avec le contexte pertinent du projet avant d’interroger le modèle.
Suivre la réponse
- Si le modèle supporte le streaming, la réponse commencera à afficher des fragments au fur et à mesure.
- Utilisez les commandes d’interface (stop/cancel/copier) pour contrôler la lecture (voir section sur le streaming).
- À la fin, la réponse finale est enregistrée dans l’historique.
Inclure le contexte du code (RAG) — comment tirer parti du contexte projet
Formuler la requête en indiquant le besoin
- Dites clairement ce que vous voulez (diagnostic, exemple de correctif, résumé de comportement).
- Indiquez le niveau de détail souhaité (résumé, pas-à-pas, patch).
Laisser le système rechercher le contexte
- Le système recherchera automatiquement le contexte pertinent du projet (documents, extraits pertinents) pour enrichir la requête.
- Vous n’avez rien à télécharger : le contexte pertinent est ajouté en arrière-plan.
Vérifier la source du contexte si utile
- Lorsque la réponse est générée, regardez les éventuels marqueurs ou notes indiquant quels extraits ont été utilisés (si l’interface les affiche).
- Si une zone de contexte est incorrecte ou manquante, reformulez en précisant le dossier/fonction ou fournissez plus de détails dans le message.
Limiter le périmètre pour économiser des crédits
- Si vous voulez limiter la recherche à une partie du projet (ex. “uniquement le dossier api/”), mentionnez-le explicitement dans la requête.
- Réduire la portée diminue le nombre de documents consultés et préserve vos crédits.
Gérer les emails entrants (inbound email) pour poser des questions par ticket
Ouvrir le popover email
- Dans l’interface du chat, cliquez sur l’icône ou le popover dédié aux emails.
- Vous verrez l’adresse email inbound unique liée au projet.
Copier l'adresse inbound
- Cliquez sur “Copier l’adresse email” pour la coller dans votre client mail.
- Un message de confirmation s’affichera (“Adresse copiée !”).
Envoyer le ticket par email
- Envoyez un email à cette adresse : l’objet est optionnel, le corps servira de prompt.
- Évitez les pièces jointes (non prises en charge).
- Notez la limite de longueur : si le corps est très long, il peut être tronqué.
Recevoir la réponse
- La réponse générée vous sera renvoyée par email et enregistrée comme conversation dans l’onglet Chat with code.
- Si la réponse semble incomplète, renvoyez un suivi en précisant “Suite” ou “Compléter la réponse précédente”.
Naviguer et gérer l'historique de conversation
Parcourir l'historique
- Dans la zone de conversation, faites défiler vers le haut pour voir les échanges précédents.
- Les messages sont regroupés par conversation ; repérez la date et le modèle utilisé.
Reprendre un ancien échange
- Cliquez sur un message utilisateur ou assistant pour le réutiliser comme nouveau prompt (selon l’interface, utilisez l’option ‘Réutiliser’ ou copiez-collez).
- Ajoutez un suivi clarifiant ce que vous attendez (par ex. “Donne-moi un patch pour la fonction X”).
Rechercher dans l'historique
- Utilisez le champ de recherche (s’il est présent) pour trouver mots-clés, fonctions ou problématiques déjà traitées.
- Les mots-clés fréquents accélèrent la reprise de conversation.
Nettoyer ou exporter
- Supprimez les conversations obsolètes si elles contiennent des données sensibles ou inutiles.
- Exportez (si l’interface le permet) les échanges importants pour archivage ou partage.
Suivre et gérer les réponses en streaming (longues) — bonnes pratiques
Détecter si la réponse est en streaming
- Dès l’envoi, l’interface indique l’état (analyse, recherche, réflexion, rédaction).
- Si le modèle supporte le streaming, vous verrez des morceaux de texte s’afficher en temps réel.
Lire progressivement, copier et agir
- Vous pouvez lire et copier des fragments avant la fin de la génération.
- Pour des corrections rapides, copiez la section utile et testez-la directement dans votre éditeur.
Interrompre ou régénérer
- Si la génération part dans une mauvaise direction, utilisez l’option ‘Arrêter’ ou ‘Annuler’.
- Pour obtenir une autre version, demandez “Regénérer” ou reformulez la consigne (ex. “Sois plus synthétique”).
Gérer les interruptions ou blocages
- Si le streaming se coupe sans message final : actualisez la page ou relancez la requête (en citant la dernière phrase reçue).
- Si la coupure est récurrente, basculez vers un modèle plus stable ou réduisez la taille du contexte cherché.
Que faire quand vous atteignez des limites ou manquez de crédits
Reconnaître le symptôme
- Messages types : “Limite atteinte”, “Crédits insuffisants”, ralentissements répétés ou erreurs de génération.
- L’interface peut afficher un compteur d’outputs restants ou une alerte.
Prioriser les requêtes
- Réservez les modèles puissants et les recherches étendues aux tâches critiques.
- Pour les questions générales, utilisez un modèle léger pour économiser des crédits.
Limiter la recherche de contexte
- Demandez explicitement de restreindre la recherche (ex. “Cherche seulement dans la partie API”).
- Fractionnez une grosse demande en plusieurs petites requêtes.
Demander de l'aide au support ou recharger des crédits
- Si vos crédits sont épuisés, suivez la procédure de recharge dans la section facturation.
- En cas d’alertes fréquentes, contactez le support pour analyser l’utilisation et ajuster les quotas.
- Choisissez un modèle léger.
- Limitez la recherche de contexte (ex. dossier précis).
- Demandez une réponse synthétique (2–3 points).
- Utilisez le résultat pour itérer localement.
Avant : vous envoyez une grosse demande unique — risque d’interruption, coûts élevés, résultat difficile à itérer.
Après : vous découpez la tâche (plan → analyse ciblée → synthèse) — contrôle des coûts, meilleure résilience du streaming et résultats plus actionnables.
Workflow recommandé pour les analyses lourdes
- Demandez un plan ou une liste d’éléments à inspecter. 2) Lancez des requêtes ciblées sur chaque élément. 3) Demandez une synthèse finale. Ce pattern limite les risques d’interruption et facilite la traçabilité des crédits consommés.
Données sensibles
Ne partagez pas de secrets, clés, mots de passe ni informations personnelles sensibles dans les messages. Si des données sensibles existent dans le projet, supprimez-les ou anonymisez-les avant de les inclure.
Frequently Asked Questions
Résumé pratique
- Commencez toujours par formuler clairement l’objectif et le niveau de détail attendu.
- Préférez des requêtes ciblées pour limiter la consommation de crédits.
- Utilisez le streaming pour lire et réutiliser des fragments en temps réel, mais sauvegardez la réponse complète à la fin.
- En cas de limites atteintes, passez à un modèle plus léger, fractionnez la tâche ou rechargez des crédits.
Besoin d'aide pour optimiser vos usages ?
Si vous rencontrez des limitations récurrentes ou avez besoin d’un plan adapté, consultez la page de facturation pour ajuster vos crédits et limites par projet.