Coordination multi-agents : les 14 modes d'échec et comment les éviter
Le papier Cemri 2025 a recensé 14 modes d'échec récurrents dans les systèmes multi-agents. Diagnostic, et trois familles d'architecture pour s'en prémunir.
Coordination de systèmes multi-agents IA
Façon dont plusieurs agents IA collaborent sans se marcher dessus. Quatorze modes d'échec connus, trois familles d'architecture, une réponse via Conway's Law.
La coordination multi-agents désigne l'ensemble des mécanismes par lesquels plusieurs agents IA collaborent pour accomplir une tâche que ni l'un ni l'autre ne pourrait accomplir seul. C'est l'un des sujets les plus actifs de la recherche en 2024-2026, avec une littérature qui s'enrichit rapidement et des frameworks qui se multiplient (LangGraph, CrewAI, AutoGen, Swoft, et bien d'autres).
Le papier Cemri et al. (arXiv 2025) a fait référence en répertoriant quatorze modes d'échec récurrents dans les systèmes multi-agents : cascade d'erreurs, perte de contexte entre agents, négociation infinie, hallucination collective, contradiction de rôles, dérive d'objectif, blocage par dépendance circulaire, etc. Chaque mode d'échec a une probabilité non négligeable d'apparaître en production sans architecture appropriée.
La coordination multi-agents devient pertinente dès qu'on dépasse l'agent unique. C'est-à-dire en pratique dès qu'on adresse un workflow métier complet (souscription, sinistre, dossier patient, scoring) qui nécessite plusieurs compétences : extraction documentaire, validation, scoring, escalade. Pour une organisation, c'est typiquement le passage du POC mono-agent au déploiement multi-domaines.
Chez Swoft, la coordination multi-agents repose sur trois principes alignés sur la loi de Conway. Premièrement, chaque agent est rattaché à un Bounded Context du métamodèle DDD : son périmètre est une contrainte architecturale, pas une consigne de prompt. Deuxièmement, les agents ne communiquent jamais en texte libre entre eux, mais via des événements typés persistés dans l'Event Store. Troisièmement, l'orchestration des workflows longs est portée par des sagas event-sourcées, avec compensation automatique en cas d'échec partiel.
Cette architecture résout structurellement la majorité des quatorze modes d'échec recensés dans la littérature. La cascade d'erreurs est bornée par la compensation automatique. La perte de contexte est éliminée par la mémoire partagée de l'Event Store. La contradiction de rôles est impossible car les Bounded Contexts sont disjoints. La dérive d'objectif est captée par les approval gates injectées dans les sagas.
Le papier Cemri 2025 a recensé 14 modes d'échec récurrents dans les systèmes multi-agents. Diagnostic, et trois familles d'architecture pour s'en prémunir.
Comment combiner LLM et raisonnement formel pour bâtir des agents IA fiables sur des domaines spécialisés. Lecture de la taxonomie de Kautz, des cas AlphaGeometry, Plato-3, FAOS.
Le cadre Sheridan adapté au business 2026 : cinq paliers du simple assistant au système entièrement autonome. Diagnostic, exigences architecturales et calendrier réaliste pour passer un palier.
Quand Coordination multi-agents demande un logiciel sur-mesure, nous le livrons en quelques semaines, 3× moins cher qu'un éditeur historique.