阶段	SOUL 五律	技术实现	输出
1. Perceive 感知	已知 vs 未知	2D视觉检测（OpenCV管道）→ 3D空间理解	特征图 + 置信度
2. Plan 规划

视觉-动作-进化循环技能

元数据

字段	值
名称	vision-action-evolution-loop
版本

1.0.0 | | 作者 | KingOfZhao | | 发布日期 | 2026-03-31 | | 置信度 | 96% |

核心哲学

认知世界的本质是无穷层级的框架节点。本技能是两个框架碰撞后的涌现节点：

diepre-vision-cognition (视觉感知)
⊗
self-evolution-cognition (自进化)
↓
vision-action-evolution-loop (视觉-动作-进化闭环)

五阶段闭环（映射 SOUL 五律）

阶段	SOUL 五律	技术实现	输出
1. 感知	已知 vs 未知	2D视觉检测（OpenCV管道）→ 3D空间理解	特征图 + 置信度
2. 规划

三阶段桥接架构（非端到端）

阶段 1: 2D检测 (已实现)
手机照片 → 透视矫正 → 二值化 → 线条检测 → SVG/DXF
[diepre-vision-cognition]

阶段 2: 3D空间理解 (桥接层)
2D线条 → 参数化3D → 空间坐标映射 → 折叠顺序推理
[参考文献: arXiv:2412.11892]

阶段 3: 动作规划
3D模型 → 抓取点计算 → 力控参数 → 动作序列生成
[参考文献: arXiv:2510.11027, arXiv:2510.17111]

工具增强策略

不是用VLA端到端替换现有管道，而是将OpenCV管道封装为可调用工具：

python

现有管道封装为工具

tools = {
detectdieline: dieprevision.analyze, # 2D检测
correctperspective: opencv.correctperspective, # 透视矫正
generatedxf: vectorizer.todxf, # 矢量化
estimate3d: spatialestimator.from_2d, # 3D估算
plangrasp: graspplanner.calculate, # 抓取规划
}

VLA模型调用这些工具，而非自己做所有事

学术参考文献

1. Vlaser: 协同具身推理 — 具身推理VLA模型，动作规划的理论基础
面向具身操作的高效VLA模型 — VLA高效优化，适合本地部署
从2D CAD到3D参数化 via VLM — 2D→3D桥接层的核心技术
SAGE: 多智能体自进化 — 四Agent闭环=闭环迭代的学术对应
面向CAD的工具增强VLLM (ICCV 2025) — 工具增强策略的理论支撑
自进化具身AI — 记忆自更新+任务自切换+模型自进化

安装命令

bash
clawhub install vision-action-evolution-loop

或手动安装

cp -r skills/vision-action-evolution-loop ~/.openclaw/skills/

调用方式

python
from skills.visionactionevolution_loop import VisionActionEvolutionLoop

loop = VisionActionEvolutionLoop(workspace=.)

单次闭环

result = loop.run_cycle( imagepath=path/to/boxphoto.jpg, known=[2D检测已验证6/6, Bobst±0.15mm精度], unknown=[3D折叠顺序, 力控参数优化] )

result 包含五个阶段输出

print(result.perception.confidence) # 感知置信度 print(result.plan.action_sequence) # 动作序列 print(result.evolution.new_knowledge) # 新增认知

持续进化（多次迭代）

for i in range(10): result = loop.run_cycle(...) loop.inject_feedback(result.evolution.feedback) # 每次迭代都会更新内部世界模型

与其他技能的关系

self-evolution-cognition (父节点: 自进化框架)
├── vision-action-evolution-loop (本技能: 视觉-动作-进化)
│ └── diepre-vision-cognition (子节点: 2D视觉检测)
└── human-ai-closed-loop (兄弟节点: 人机闭环)

arxiv-collision-cognition (交叉引用: 论文碰撞输入)

vision-action-evolution-loop视觉动作进化环

vision-action-evolution-loop

Vision-Action-Evolution Loop Skill

元数据

核心哲学

五阶段闭环（映射 SOUL 五律）

三阶段桥接架构（非端到端）

工具增强策略

学术参考文献

安装命令

调用方式

与其他 Skill 的关系

视觉-动作-进化循环技能

元数据

核心哲学

五阶段闭环（映射 SOUL 五律）

三阶段桥接架构（非端到端）

工具增强策略

现有管道封装为工具

VLA模型调用这些工具，而非自己做所有事

学术参考文献

安装命令

或手动安装

调用方式

单次闭环

result 包含五个阶段输出

持续进化（多次迭代）

与其他技能的关系

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

vision-action-evolution-loop视觉动作进化环

vision-action-evolution-loop

Vision-Action-Evolution Loop Skill

元数据

核心哲学

五阶段闭环（映射 SOUL 五律）

三阶段桥接架构（非端到端）

工具增强策略

学术参考文献

安装命令

调用方式

与其他 Skill 的关系

视觉-动作-进化循环技能

元数据

核心哲学

五阶段闭环（映射 SOUL 五律）

三阶段桥接架构（非端到端）

工具增强策略

现有管道封装为工具

VLA模型调用这些工具，而非自己做所有事

学术参考文献

安装命令

或手动安装

调用方式

单次闭环

result 包含五个阶段输出

持续进化（多次迭代）

与其他技能的关系

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement