Test bench · 2026-05-08

Ruflo (claude-flow)

Framework d'orchestration multi-agent qui se greffe sur Claude Code — 32 plugins, swarms hiérarchiques, mémoire vectorielle, fédération multi-machines. Testé en sandbox sur la 3.7.0-alpha.17 puis sur la 3.6.30 stable.

Pourquoi le tester

Le repo ruvnet/ruflo (anciennement claude-flow) propose une couche d'orchestration multi-agent sur Claude Code, avec des concepts ambitieux : swarms hiérarchiques, mémoire vectorielle persistante, hooks self-learning, fédération sécurisée entre machines. Le README annonce "agents qui ne tournent pas juste, ils collaborent". Il a fallu voir ce qu'il en était en pratique avant de l'intégrer (ou pas) dans le workflow perso.

Ce qu'on a testé

Sandbox isolée dans un dossier dédié, snapshot md5 de ~/.claude/CLAUDE.md avant et après init pour mesurer l'empreinte globale.
Init minimal + flag --no-global pour limiter au maximum la surface — d'abord sur la 3.7.0-alpha.17 (npm latest), puis sur la 3.6.30 (GitHub "Latest" stable).
Vérification du cleanup : ruflo cleanup --dry-run puis --force, puis listing des artefacts résiduels.
Quelques commandes basiques : status, swarm init, memory init, plugins list (registry IPFS via Pinata).

Verdict

Ce qui fonctionne

• Toolkit massif (47+ commandes, V3 features)
• Swarm init donne un graphe coordonné en une commande
• 8 skills pré-installés sur la 3.6.30 (SPARC, swarm-orchestration, pair-programming…)
• cleanup --dry-run est l'output par défaut (safety)
• Documentation détaillée des modes minimal / full

Ce qui pète

• --no-global ne respecte pas ~/.claude/CLAUDE.md (testé sur les deux versions)
• cleanup --force laisse CLAUDE.md projet, .mcp.json, et 8 skills/
• Naming inconsistent (ruflo vs claude-flow dans les mêmes fichiers)
• Plugin registry IPFS ralentit la commande (~8s via Pinata)
• npm latest tag pointe sur du prerelease alpha

Décision

Pas d'adoption en l'état. Les blockers sont des défauts d'architecture (cleanup incomplet de plusieurs catégories d'artefacts) plus que des bugs d'alpha — la stable 3.6.30 ne corrige rien. À reconsidérer quand un changelog mentionnera explicitement le fix de --no-global et un cleanup réellement complet.

Leçons à reprendre (8)

Ne pas adopter Ruflo n'invalide pas ses idées. Voici les patterns qu'on ré-applique chez nous, indépendamment :

01

Multi-agent named SendMessage

Pattern Lead ←→ architect ←→ developer ←→ tester ←→ reviewer avec rôles fixes et messages directs entre agents. À tenter sur les features complexes (5+ fichiers, plusieurs couches) au lieu d'un seul sub-agent général.
02

Méthodologie SPARC

Specification → Pseudocode → Architecture → Refinement → Completion. Framework cognitif pour structurer le dev d'une feature algo lourde. Différent d'APEX par l'étape pseudocode + refinement.
03

Memory SQLite + embeddings HNSW

Pour les projets qui accumulent beaucoup de souvenirs structurés, semantic search via SQLite + vector embeddings >> grep dans des .md. Pas urgent mais à reconsidérer si la recherche par mots-clés sature.
04

Hooks self-learning : noter explicitement les patterns gagnants

Au-delà du feedback implicite, capturer systématiquement les patterns validés par l'humain ET les anti-patterns observés. Ça construit une mémoire actionnable session après session.
05

Two install paths (lite vs full)

Quand on shippe un outil custom : proposer un mode lite (zéro pollution workspace, juste une slash command) ET un mode full (workspace setup complet). User choisit selon son besoin.
06

Cleanup --dry-run par défaut

Pour tout script destructif (rm, drop, deploy rollback) : --dry-run en sortie par défaut, --force pour exécuter vraiment. Safety pattern qui sauve des soirées.
07

CLAUDE.md project-level avec règles spécifiques

Au-delà du CLAUDE.md global, chaque projet peut avoir ses règles métier persistantes (ex : 'toujours tester PIN guard sur nouvel endpoint', 'JAMAIS de vraies données dans les fixtures').
08

Plugin marketplace décentralisé (concept)

Pas applicable maintenant (latence IPFS), mais intéressant intellectuellement : registry non-centralisé pour distribuer des plugins de manière autonome. À garder en tête.

Watchlist

Ruflo est sur notre liste d'outils à re-tester quand mature. Conditions de re-évaluation :

✓ Mention dans le changelog d'un fix --no-global
✓ Un cleanup --all ou équivalent qui retire skills + CLAUDE.md projet + .mcp.json
✓ Naming cohérent (ruflo OU claude-flow, pas les deux dans les mêmes fichiers)
✓ Sortie d'une 4.0 stable, ou ligne 3.6.x continue de stabiliser

↗ Releases GitHub ↗ npm ruflo

Test mené 2026-05-08 · versions 3.7.0-alpha.17 + 3.6.30 stable.

Ruflo (claude-flow)

Multi-agent named SendMessage

Méthodologie SPARC

Memory SQLite + embeddings HNSW

Hooks self-learning : noter explicitement les patterns gagnants

Two install paths (lite vs full)

Cleanup --dry-run par défaut

CLAUDE.md project-level avec règles spécifiques

Plugin marketplace décentralisé (concept)