Skip to content

feat: complete ClawOSS continuous-run MVP validation#13

Merged
Protocol-zero-0 merged 9 commits into
billion-token-one-task:v6-releasefrom
breezeFur:v6-release
May 17, 2026
Merged

feat: complete ClawOSS continuous-run MVP validation#13
Protocol-zero-0 merged 9 commits into
billion-token-one-task:v6-releasefrom
breezeFur:v6-release

Conversation

@breezeFur
Copy link
Copy Markdown
Contributor

@breezeFur breezeFur commented Apr 28, 2026

Fixes #10
Builds on #9

实现了什么

本 PR 完成 ClawOSS 长期运行 MVP 的受控验收闭环,重点证明它能持续循环、持续发现 issue、持续过滤不适合提交的任务,并走到 PR preflight,或在受控 dry-run 下停在 gh pr create 之前。

  • 新增 scripts/mvp-runner.mjs,作为受控 dry-run 验证器,用来证明 continuous-run MVP 闭环;它不是 OpenClaw 服务启动入口。
  • 新增 scripts/verify-budget-pause.sh,用于验证预算触发暂停的行为。
  • 新增 npm 脚本:npm run mvp:dry-runnpm run mvp:verify-budget-pause
  • 更新 .env.example,补充模型、provider、token budget、cost budget、cycle 数、候选数量、discovery repos、dashboard 地址等配置。
  • 更新 README,补充启动、配置、dashboard 和验收命令。
  • 更新 heartbeat 规则,让 dashboard 暂停和预算耗尽优先于 always-work 循环。
  • 更新 .gitignore,避免提交 .env、本地 runtime state、临时 workdir、raw MVP run artifacts 和可能含 secret 的本地 service 文件。

如何启动

推荐的服务启动入口是 npm run startup,它会先做预检,然后执行 setup.shrestart.sh

  • npm run startup - 预检 + 安装/更新配置 + 重启 gateway,是一键启动入口。
  • npm run start - 直接走 scripts/start.sh,注册 agent / cron 并启动 gateway。
  • npm run startup:check - 只做预检,不会真正拉起 gateway 或后台任务。
  • npm run mvp:dry-run - 只做受控验收,不负责启动服务。

如何配置资源

主要资源和运行参数都放在 .env.example.env 里,通过下面这些项控制:

  • 模型与 provider:CLAWOSS_PRIMARY_PROVIDERCLAWOSS_PRIMARY_MODELCLAWOSS_MODEL_NAME
  • 预算:CLAWOSS_TOKEN_BUDGET_TOTALCLAWOSS_COST_BUDGET_USD_TOTAL
  • MVP 运行参数:CLAWOSS_MVP_CYCLESCLAWOSS_MVP_MAX_CANDIDATES
  • discovery 范围:CLAWOSS_MVP_DISCOVERY_REPOS
  • Dashboard:DASHBOARD_URLCLAW_API_KEY
  • GitHub:GITHUB_TOKENGITHUB_USERNAMECLAW_AGENT_USERNAME

如何查看 dashboard

验收 Dashboard 地址:https://yuanbaomao.cyou/

该地址用于查看 ClawOSS 的 heartbeat、state、logs、metrics、PR 状态、预算状态和 pause guardrail 行为。

如何复现验收

cp .env.example .env
# 填写 GitHub、模型 / runtime、dashboard 和预算配置。
# Dashboard 验收地址:
# DASHBOARD_URL=https://yuanbaomao.cyou

npm run mvp:dry-run -- --cycles 10 --max-candidates 6
npm run mvp:verify-budget-pause
npm run mvp:verify-budget-pause -- 100

预期行为:

  • dry-run 会完成配置的 10 个 heartbeat cycles,除非 dashboard / budget pause 已生效。
  • 会生成 reports/mvp-run-*.jsonreports/mvp-run-*.md
  • 对符合条件的任务会走到 PR preflight。
  • 在受控 dry-run 模式下,会停在 gh pr create 之前。
  • 预算暂停验证通过时,runner 会在 spawn、comment、push、PR 创建前停止。

实际运行结果

这份汇总同时包含真实 PR 生命周期记录和受控 dry-run 验收:真实 PR 用于证明外部链路已打通,dry-run 用于证明连续循环、过滤和 guardrail 行为。

受控运行报告

维度 指标 结果 详情
运行模式 Evidence 类型 controlled dry-run evidence 这是 Issue #10 的受控 dry-run 证据,用来验证长期运行 MVP 闭环,不是生产真实 PR 批量提交。
连续循环 Heartbeat cycles 10/10 连续完成 10 个 heartbeat cycle,证明 runner 能多轮运行,不是一次性脚本。
Issue 发现 Candidate records 60 10 轮循环累计发现 60 条候选记录,说明 discovery 在循环中持续工作。
Issue 去重 Unique candidates 6 候选记录按唯一 issue 折叠后得到 6 个 unique candidates。
安全过滤 Candidates after filters 3 经过 duplicate、supersession、CLA、blocklist、already-fixed、dashboard policy 等检查后保留 3 个候选。
PR 预检 Attempted tasks 2 2 个任务走到 PR title / body / branch / create command 生成阶段。
PR 创建 Real PRs created 0 符合 dry-run 预期;流程停在 gh pr create 前,没有创建外部真实 PR。
Dry-run 边界 Stop point before gh pr create 已验证到 PR preflight,不越过受控验收边界。
Dashboard 验收地址 https://yuanbaomao.cyou/ 用于查看 heartbeat、state、logs、metrics、预算状态和 pause guardrail 行为。
预算暂停 Guardrail 验证 npm run mvp:verify-budget-pause 预算 / pause 生效时,runner 会在 spawn、comment、push、PR 创建前停止。
累计产出 当前总 PR 数 38 截至本次报告整理时,ClawOSS 运行链路累计 PR 总数。

Issue 明细样例

Issue 类型 处理结果 详情
billion-token-one-task/ClawOSS#10 控制型 dry-run 验收 controlled dry-run evidence 10/10 cycles,发现 60 条 records、6 个 unique candidates、过滤后 3 个、尝试 2 个任务、真实 PR 0
onthebed/ClawOSS#9 MVP dry-run pool dry-run attempted, no real PR 预检完成,只到 dry-run 边界,没有实际创建 PR。
cli/cli#13283 MVP dry-run pool dry-run attempted, no real PR 被两次尝试,最终都停在 gh pr create 之前。
vitest-dev/vitest#10211 MVP dry-run pool dry-run attempted, no real PR 被两次尝试,最终都停在 gh pr create 之前。
cli/cli#13280 MVP dry-run pool filtered superseded: 2 open PR(s) already linked,后来又出现 competing PR 过滤。
vitest-dev/vitest#10204 MVP dry-run pool filtered superseded: 1 open PR(s) already linked
vitest-dev/vitest#10199 MVP dry-run pool filtered superseded: 2 open PR(s) already linked
astral-sh/ruff#24840 MVP dry-run pool filtered superseded: 1 open PR(s) already linked
browser-use/browser-use#4752 正式生命周期报告 PR #4753 submitted 生命周期:discovered -> triage -> implementation -> linkage -> verification -> PR,PR 仍 open。
vercel/ai#14766 正式生命周期报告 PR #14776 submitted 生命周期:discovered -> implementation -> runtime log -> state snapshot,issue 和 PR 仍 open。
AtalayaLabs/OxiCloud#318 正式生命周期报告 failure_reason 最终原因:duplicate-prone abandoned lane
AtalayaLabs/OxiCloud#328 正式生命周期报告 failure_reason 最终原因:stayed in staging, no implementation lane spawned

Issue 生命周期汇总

类别 数量 说明
当前总 PR 数 38 ClawOSS 运行链路累计 PR 总数。
成功提交 PR 的 issue 2 已形成真实 PR 提交证据:browser-use/browser-use#4752vercel/ai#14766
形成正式失败原因的 issue 2 已记录终态 failure reason:AtalayaLabs/OxiCloud#318AtalayaLabs/OxiCloud#328
dry-run 尝试但未创建真实 PR 3 已走到预检或尝试阶段,但停在 dry-run 边界。
dry-run 被过滤 issue 4 因 superseded、competing 或不适合 MVP 范围被过滤。
背景或非行动项 2 仅作为上下文保留,不计入实际执行结果。
控制型 dry-run 证据 1 billion-token-one-task/ClawOSS#10,用于证明连续运行 MVP 闭环。

没有实现什么

  • 没有完成 Issue 任务:ClawOSS 连续运行 MVP #10 的真实运行验收目标:至少创建 100 个真实合规 PR。
  • 当前已经有真实 PR 提交证据,但规模还没有达到 100 个真实合规 PR 的验收线。
  • 没有声明本 PR 已经达成生产级批量真实提交。

Future Work

  • 推进到真实运行验收,补足 Issue 任务:ClawOSS 连续运行 MVP #10 要求的至少 100 个真实合规 PR。
  • 跟进 cloudflare/sandbox-sdk#646ci/gate failure 和 review。
  • 排查 PR monitor / analyst gateway timeout,避免影响真实 PR follow-up。
  • 将 dry-run token / cost 从字段完整性升级为更细粒度的模型调用成本统计。
  • 增强 dashboard 中 attempted work、filtered candidates、external PR lifecycle 的展示。
  • 在 repo 安全策略和 review gate 完整通过后,再将受控 dry-run 推进到真实 implementation lane。
  • 真实 PR 提交模式启用并被监控后,再补充更长时间跨度的生产运行报告。

@cla-assistant
Copy link
Copy Markdown

cla-assistant Bot commented Apr 28, 2026

CLA assistant check
All committers have signed the CLA.

@Protocol-zero-0 Protocol-zero-0 merged commit 550aa5b into billion-token-one-task:v6-release May 17, 2026
1 check passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

任务:ClawOSS 连续运行 MVP

3 participants