Test bench · 2026-05-08

Ruflo (claude-flow)

Framework d'orchestration multi-agent qui se greffe sur Claude Code — 32 plugins, swarms hiérarchiques, mémoire vectorielle, fédération multi-machines. Testé en sandbox sur la 3.7.0-alpha.17 puis sur la 3.6.30 stable.

Pourquoi le tester

Le repo ruvnet/ruflo (anciennement claude-flow) propose une couche d'orchestration multi-agent sur Claude Code, avec des concepts ambitieux : swarms hiérarchiques, mémoire vectorielle persistante, hooks self-learning, fédération sécurisée entre machines. Le README annonce "agents qui ne tournent pas juste, ils collaborent". Il a fallu voir ce qu'il en était en pratique avant de l'intégrer (ou pas) dans le workflow perso.

Ce qu'on a testé

  • Sandbox isolée dans un dossier dédié, snapshot md5 de ~/.claude/CLAUDE.md avant et après init pour mesurer l'empreinte globale.
  • Init minimal + flag --no-global pour limiter au maximum la surface — d'abord sur la 3.7.0-alpha.17 (npm latest), puis sur la 3.6.30 (GitHub "Latest" stable).
  • Vérification du cleanup : ruflo cleanup --dry-run puis --force, puis listing des artefacts résiduels.
  • Quelques commandes basiques : status, swarm init, memory init, plugins list (registry IPFS via Pinata).

Verdict

Ce qui fonctionne

  • • Toolkit massif (47+ commandes, V3 features)
  • • Swarm init donne un graphe coordonné en une commande
  • • 8 skills pré-installés sur la 3.6.30 (SPARC, swarm-orchestration, pair-programming…)
  • cleanup --dry-run est l'output par défaut (safety)
  • • Documentation détaillée des modes minimal / full

Ce qui pète

  • --no-global ne respecte pas ~/.claude/CLAUDE.md (testé sur les deux versions)
  • cleanup --force laisse CLAUDE.md projet, .mcp.json, et 8 skills/
  • • Naming inconsistent (ruflo vs claude-flow dans les mêmes fichiers)
  • • Plugin registry IPFS ralentit la commande (~8s via Pinata)
  • • npm latest tag pointe sur du prerelease alpha

Décision

Pas d'adoption en l'état. Les blockers sont des défauts d'architecture (cleanup incomplet de plusieurs catégories d'artefacts) plus que des bugs d'alpha — la stable 3.6.30 ne corrige rien. À reconsidérer quand un changelog mentionnera explicitement le fix de --no-global et un cleanup réellement complet.

Leçons à reprendre (8)

Ne pas adopter Ruflo n'invalide pas ses idées. Voici les patterns qu'on ré-applique chez nous, indépendamment :

  1. 01

    Multi-agent named SendMessage

    Pattern Lead ←→ architect ←→ developer ←→ tester ←→ reviewer avec rôles fixes et messages directs entre agents. À tenter sur les features complexes (5+ fichiers, plusieurs couches) au lieu d'un seul sub-agent général.

  2. 02

    Méthodologie SPARC

    Specification → Pseudocode → Architecture → Refinement → Completion. Framework cognitif pour structurer le dev d'une feature algo lourde. Différent d'APEX par l'étape pseudocode + refinement.

  3. 03

    Memory SQLite + embeddings HNSW

    Pour les projets qui accumulent beaucoup de souvenirs structurés, semantic search via SQLite + vector embeddings >> grep dans des .md. Pas urgent mais à reconsidérer si la recherche par mots-clés sature.

  4. 04

    Hooks self-learning : noter explicitement les patterns gagnants

    Au-delà du feedback implicite, capturer systématiquement les patterns validés par l'humain ET les anti-patterns observés. Ça construit une mémoire actionnable session après session.

  5. 05

    Two install paths (lite vs full)

    Quand on shippe un outil custom : proposer un mode lite (zéro pollution workspace, juste une slash command) ET un mode full (workspace setup complet). User choisit selon son besoin.

  6. 06

    Cleanup --dry-run par défaut

    Pour tout script destructif (rm, drop, deploy rollback) : --dry-run en sortie par défaut, --force pour exécuter vraiment. Safety pattern qui sauve des soirées.

  7. 07

    CLAUDE.md project-level avec règles spécifiques

    Au-delà du CLAUDE.md global, chaque projet peut avoir ses règles métier persistantes (ex : 'toujours tester PIN guard sur nouvel endpoint', 'JAMAIS de vraies données dans les fixtures').

  8. 08

    Plugin marketplace décentralisé (concept)

    Pas applicable maintenant (latence IPFS), mais intéressant intellectuellement : registry non-centralisé pour distribuer des plugins de manière autonome. À garder en tête.

Watchlist

Ruflo est sur notre liste d'outils à re-tester quand mature. Conditions de re-évaluation :

  • ✓ Mention dans le changelog d'un fix --no-global
  • ✓ Un cleanup --all ou équivalent qui retire skills + CLAUDE.md projet + .mcp.json
  • ✓ Naming cohérent (ruflo OU claude-flow, pas les deux dans les mêmes fichiers)
  • ✓ Sortie d'une 4.0 stable, ou ligne 3.6.x continue de stabiliser

Test mené 2026-05-08 · versions 3.7.0-alpha.17 + 3.6.30 stable.