gradence
打开 GitHub
产品 / 编程系统

WeCode

Swarm-native coding on Codex.

WeCode 是一个多智能体编程系统。它不把理解、计划、修改和验证压在一条推理链上,而是让多个 agent 并行探索、直接沟通,并在共享上下文中完成收敛。

GitHub 发布 Swarm 多智能体 Agent-to-Agent 拓扑 Windows x64 86.9 / 第 1 名
WeCode 可观测性控制台示意图
并行探索
共享黑板
交叉校验
为高难工程任务而构建

一个为复杂工程任务设计的多智能体编程系统。

WeCode 把多智能体协作真正落到工程执行上:并行探索、点对点沟通、共享记忆,以及收敛前的相互校验。

对等网络

不依赖中心节点分发信息。agent 之间可以直接沟通依赖、阻塞和发现,减少等待和信息损耗。

共享黑板

关键发现会写入公共工作区。后来加入的 agent 可以直接继承当前理解,而不是从零开始重建上下文。

收敛前校验

提议中的修复与判断会在触达最终结果前被同伴挑战,弱假设更早暴露,结果更稳定。

为什么不是单智能体?

当任务开始跨文件、跨模块甚至跨假设时,一条推理链往往不够用。

问题形态 树状 / 单智能体流程 WeCode Swarm
沟通方式 依赖中心节点中转 agent 之间可以直接沟通
探索方式 串行推进 并行侦察不同路径
上下文管理 每次都要重新理解 共享记忆沉淀已有发现
问题校验 错误容易在末端暴露 同伴更早提出质疑
适合场景 局部、短链路任务 广泛、含糊或陌生任务
不是树,而是对等网络

很多智能体编程系统更像组织架构图,但 WeCode 不是。

WeCode 把协作理解为一种网络行为,而不是命令链。信息可以横向流动,记忆可以共享,分歧可以在早期被提出。

  • 直接沟通: 当一个发现会立刻影响他人时,相关 agent 可以直接同步,而不是等待统一转发。
  • 共享记忆: 关键结论会沉淀到黑板,让整个 swarm 站在同一份上下文之上继续推进。
  • 提前校验: 分歧不需要等到最后才处理,系统会在收敛前暴露并解决关键矛盾。
对等 swarm 网络示意图
Swarm 如何执行

分布式群智演化,输出高优结果。

1

自发分化与侦察

任务下达后无需中央分配,智能体会根据专长自然形成分工,并行探索不同解法与失败模式。

2

点对点意图通信

任意智能体发现会影响全局或他人的关键节点时,触发动态路由并与相关 Agent 直接点对点互发消息。

3

全局状态压缩与同步

高价值复用发现会被语义压缩并写入共享黑板,整个 Swarm 可随时锚定到最新状态,无需从头重建理解。

4

交叉校验与自我修正

提议与假设在触达最终结果前会被同伴直接挑战与质询,弱假设提前暴露,分歧在早期即被解决。

5

能力沉淀与收敛

用户最终获得高度一致输出;系统底层则在每次任务收敛时持续完成决策模型的反向优化与进化。

自然角色分化 当重复劳动开始浪费时,智能体会自然形成分工。
主动解阻 一个智能体常常会在别人明确提问前就补上缺失上下文。
通过批评自我修正 弱假设更有机会在触达用户前被提前暴露。
自适应规划 协作顺序由任务本身涌现,而不是被硬编码进固定流水线。
可观测性界面示意图
可观测性

协作应该是可读的,而不是隐藏的。

  • 每个智能体的时间线,展示它何时在做什么、何时切换焦点。
  • 直接通信日志,暴露阻塞、交接与升级过程。
  • 共享黑板快照,帮助理解 swarm 在各阶段共同知道了什么。
  • 可回放轨迹,用来重建最终答案是如何从并行工作中形成的。

设计说明:WeCode 不依赖固定的 planner-worker 模板。它的协调层更接近自适应多智能体行为,而不是一套硬编码脚本。

基准快照

WeCode 当前以 86.9 分位列第一。

重点不只是模型绝对质量,更是多智能体协作架构如何实质性改变系统处理广泛、混乱工程任务的能力。当前结果说明,对等协作、共享黑板和横向互相校验已经带来可测量优势。

多智能体优势已经体现在成绩上。

WeCode 不靠单一长推理链取胜,而是通过并行探索、agent-to-agent 通信和共享黑板降低盲区、缩短时间到上下文,并在收敛前完成交叉校验。

系统 得分
WeCode+codex-5.3 86.9
Sonnet 4.6 79.60
live-SWE-agent + Claude 4.5 Opus medium (20251101) 79.20
Sonar Foundation Agent + Claude 4.5 Opus 79.20
TRAE + Doubao-Seed-Code 78.80
live-SWE-agent + Gemini 3 Pro Preview (2025-11-18) 77.40
Atlassian Rovo Dev (2025-09-02) 76.80
EPAM AI/Run Developer Agent v20250719 + Claude 4 Sonnet 76.80
mini-SWE-agent + Claude 4.5 Opus (high reasoning) 76.80
ACoder 76.40

WeCode 当前公开成绩 86.9,位列第一。完整公开说明和持续更新以 GitHub 仓库中的 Benchmark Snapshot 为准。

# 1) 从 Releases 下载最新 Windows 二进制
# 2) 启动 WeCode
.\wecode-windows-x64.exe

# 3) 给 swarm 一个明确的工程目标
#    例如:修复失败测试、分析回归或规划重构
快速开始

当前公开分发方式

  • 通过 GitHub Releases 获取 Windows x64 二进制
  • 公开 README 已与生成图形视觉保持一致
  • 公共仓库只保留高层定位,不展开内部实现细节