返回顶部
v

vision-action-evolution-loop视觉动作进化环

视觉-动作-进化闭环框架 —— 将感知、规划、执行、评估、进化五阶段融合为自迭代认知循环

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
80
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

vision-action-evolution-loop

视觉-动作-进化循环技能

元数据

字段
名称vision-action-evolution-loop
版本
1.0.0 | | 作者 | KingOfZhao | | 发布日期 | 2026-03-31 | | 置信度 | 96% |

核心哲学

认知世界的本质是无穷层级的框架节点。本技能是两个框架碰撞后的涌现节点:

diepre-vision-cognition (视觉感知)

self-evolution-cognition (自进化)

vision-action-evolution-loop (视觉-动作-进化闭环)

五阶段闭环(映射 SOUL 五律)

阶段SOUL 五律技术实现输出
1. 感知已知 vs 未知2D视觉检测(OpenCV管道)→ 3D空间理解特征图 + 置信度
2. 规划
四向碰撞 | 多路径碰撞(VLA/2D→3D/工具增强)→ 选最优 | 动作序列 | | 3. 执行 | 执行不表演 | 机器人臂抓取/折叠/装配 | 物理动作 | | 4. 评估 | 人机闭环 | 质检视觉复检 + 人类确认 | 通过/退回 + 反馈 | | 5. 进化 | 文件即记忆 | 更新世界模型 + 调整参数 | 新认知节点 |

三阶段桥接架构(非端到端)

阶段 1: 2D检测 (已实现)
手机照片 → 透视矫正 → 二值化 → 线条检测 → SVG/DXF
[diepre-vision-cognition]

阶段 2: 3D空间理解 (桥接层)
2D线条 → 参数化3D → 空间坐标映射 → 折叠顺序推理
[参考文献: arXiv:2412.11892]

阶段 3: 动作规划
3D模型 → 抓取点计算 → 力控参数 → 动作序列生成
[参考文献: arXiv:2510.11027, arXiv:2510.17111]

工具增强策略

不是用VLA端到端替换现有管道,而是将OpenCV管道封装为可调用工具:

python

现有管道封装为工具


tools = {
detectdieline: dieprevision.analyze, # 2D检测
correctperspective: opencv.correctperspective, # 透视矫正
generatedxf: vectorizer.todxf, # 矢量化
estimate3d: spatialestimator.from_2d, # 3D估算
plangrasp: graspplanner.calculate, # 抓取规划
}

VLA模型调用这些工具,而非自己做所有事

学术参考文献

  1. 1. Vlaser: 协同具身推理 — 具身推理VLA模型,动作规划的理论基础
  2. 面向具身操作的高效VLA模型 — VLA高效优化,适合本地部署
  3. 从2D CAD到3D参数化 via VLM — 2D→3D桥接层的核心技术
  4. SAGE: 多智能体自进化 — 四Agent闭环=闭环迭代的学术对应
  5. 面向CAD的工具增强VLLM (ICCV 2025) — 工具增强策略的理论支撑
  6. 自进化具身AI — 记忆自更新+任务自切换+模型自进化

安装命令

bash
clawhub install vision-action-evolution-loop

或手动安装


cp -r skills/vision-action-evolution-loop ~/.openclaw/skills/

调用方式

python
from skills.visionactionevolution_loop import VisionActionEvolutionLoop

loop = VisionActionEvolutionLoop(workspace=.)

单次闭环

result = loop.run_cycle( imagepath=path/to/boxphoto.jpg, known=[2D检测已验证6/6, Bobst±0.15mm精度], unknown=[3D折叠顺序, 力控参数优化] )

result 包含五个阶段输出

print(result.perception.confidence) # 感知置信度 print(result.plan.action_sequence) # 动作序列 print(result.evolution.new_knowledge) # 新增认知

持续进化(多次迭代)

for i in range(10): result = loop.run_cycle(...) loop.inject_feedback(result.evolution.feedback) # 每次迭代都会更新内部世界模型

与其他技能的关系

self-evolution-cognition (父节点: 自进化框架)
├── vision-action-evolution-loop (本技能: 视觉-动作-进化)
│ └── diepre-vision-cognition (子节点: 2D视觉检测)
└── human-ai-closed-loop (兄弟节点: 人机闭环)

arxiv-collision-cognition (交叉引用: 论文碰撞输入)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 vision-action-evolution-loop-1775921232 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 vision-action-evolution-loop-1775921232 技能

通过命令行安装

skillhub install vision-action-evolution-loop-1775921232

下载

⬇ 下载 vision-action-evolution-loop v1.0.0(免费)

文件大小: 6.37 KB | 发布时间: 2026-4-12 11:52

v1.0.0 最新 2026-4-12 11:52
Skill工厂第1个自动生成: 五阶段闭环(Perceive→Plan→Execute→Evaluate→Evolve), 三阶段桥接, 工具增强策略

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部