视觉-动作-进化闭环框架 —— 将感知、规划、执行、评估、进化五阶段融合为自迭代认知循环
| 字段 | 值 |
|---|---|
| 名称 | vision-action-evolution-loop |
| 版本 |
认知世界的本质是无穷层级的框架节点。本技能是两个框架碰撞后的涌现节点:
diepre-vision-cognition (视觉感知)
⊗
self-evolution-cognition (自进化)
↓
vision-action-evolution-loop (视觉-动作-进化闭环)
| 阶段 | SOUL 五律 | 技术实现 | 输出 |
|---|---|---|---|
| 1. 感知 | 已知 vs 未知 | 2D视觉检测(OpenCV管道)→ 3D空间理解 | 特征图 + 置信度 |
| 2. 规划 |
阶段 1: 2D检测 (已实现)
手机照片 → 透视矫正 → 二值化 → 线条检测 → SVG/DXF
[diepre-vision-cognition]
阶段 2: 3D空间理解 (桥接层)
2D线条 → 参数化3D → 空间坐标映射 → 折叠顺序推理
[参考文献: arXiv:2412.11892]
阶段 3: 动作规划
3D模型 → 抓取点计算 → 力控参数 → 动作序列生成
[参考文献: arXiv:2510.11027, arXiv:2510.17111]
不是用VLA端到端替换现有管道,而是将OpenCV管道封装为可调用工具:
python
bash
clawhub install vision-action-evolution-loop
python
from skills.visionactionevolution_loop import VisionActionEvolutionLoop
loop = VisionActionEvolutionLoop(workspace=.)
self-evolution-cognition (父节点: 自进化框架)
├── vision-action-evolution-loop (本技能: 视觉-动作-进化)
│ └── diepre-vision-cognition (子节点: 2D视觉检测)
└── human-ai-closed-loop (兄弟节点: 人机闭环)
arxiv-collision-cognition (交叉引用: 论文碰撞输入)
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 vision-action-evolution-loop-1775921232 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 vision-action-evolution-loop-1775921232 技能
skillhub install vision-action-evolution-loop-1775921232
文件大小: 6.37 KB | 发布时间: 2026-4-12 11:52