返回顶部
v

virtual-tryon-scorer虚拟试穿评分

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
93
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

virtual-tryon-scorer

虚拟试穿效果打分

通过比较原始人物、目标服装和生成输出,评估AI生成的虚拟试穿结果质量。生成结构化的分维度评分并附简要说明,然后汇总为加权总分。

输入识别

用户可能通过两种方式提供图片。正确识别所处理的格式至关重要——识别错误会使整个评估无效。

格式A:三张独立图片

用户上传三张不同的图片:

  1. 1. 原始人物图片——试穿前人物的原始照片
  2. 目标服装图片——要试穿的参考服装
  3. 试穿结果图片——AI生成的输出,显示人物穿着目标服装

当提供三张图片时,如果从上下文或文件名中无法明显区分,请要求用户说明哪张是哪张。常见命名模式:person/model/source、cloth/garment/target、result/output/generated。

格式B:单张拼接图片

用户上传一张包含所有三张照片拼接在一起的图片(并排或网格布局)。在这种情况下:

  1. 1. 识别面板布局(水平条、垂直条、2×2网格等)
  2. 通过视觉线索确定哪个面板对应什么:
- 原始人物面板显示穿着原始服装的人物(与目标服装不同) - 目标服装面板通常显示平铺、人台或不同模特身上的服装 - 试穿结果面板显示原始人物穿着目标服装
  1. 3. 如果布局不明确,描述每个面板中看到的内容并要求用户确认

关键区分信号:

  • - 如果一个面板显示孤立的服装物品(没有人或人台),那就是服装参考
  • 如果两个面板显示同一个人但穿着不同服装,与服装参考匹配的那个是结果
  • 注意面板之间的背景一致性——原始人物和结果通常共享相同的背景

评估维度

0–100的尺度上对每个维度进行评分。维度按重要性顺序列出,这也决定了它们在最终分数中的权重。

维度1:人脸身份保持(权重:40%)

这是唯一最重要的标准。试穿结果中的人物必须可识别为与原始图像中相同的个体。人脸是身份的主要载体——如果人脸发生变化,无论其他方面看起来多好,试穿从根本上就是失败的。

检查内容:

  • - 面部结构:下颌线、颧骨、脸型
  • 关键面部特征:眼睛、鼻子、嘴巴、眉毛
  • 肤色和 complexion
  • 面部表情(应相似或自然合理)
  • 与面部交界处的发型和发色
  • 面部配饰(眼镜、耳环、穿孔)

评分指南:

  • - 90–100:面部几乎相同;人物可立即识别
  • 70–89:存在微小差异但身份清晰保持;可视为同一个人
  • 50–69:面部特征有明显变化;身份存疑
  • 30–49:面部严重变形或身份转变;难以确认是同一人
  • 0–29:面部严重改变、模糊或无法识别

维度2:服装还原与贴合(权重:30%)

结果中的服装应忠实再现目标服装的视觉特征,并自然贴合人物身体。这一点很重要,因为虚拟试穿的整个目的是展示特定服装在特定人物身上的效果。

检查内容:

  • - 颜色准确性:色调、饱和度、亮度与参考匹配
  • 图案/印花保真度:标志、条纹、图案、文字应保持
  • 服装结构:领型、袖型、下摆形状、纽扣、拉链
  • 面料纹理:材料外观应与参考匹配
  • 贴合质量:服装应自然垂坠在人物身体上
  • 比例:服装比例应适合人物的体型
  • 边界质量:服装与皮肤/其他服装接触的边缘干净

评分指南:

  • - 90–100:服装外观像素完美,贴合自然
  • 70–89:轻微色差或小图案变形;贴合看起来自然
  • 50–69:服装有明显差异;存在一些贴合问题(漂浮/裁剪)
  • 30–49:服装偏差显著;贴合差或垂坠不自然
  • 0–29:服装几乎无法识别或严重变形

维度3:非人脸身体特征保持(权重:20%)

除了面部之外,其他身体特征应在原始图像和结果之间保持一致。这强化了整体感觉,即这确实是同一个人,而不是在不同身体上的换脸。

检查内容:

  • - 体型和比例(体格、身高印象、体型)
  • 可见身体部位的肤色(手臂、手、脖子、腿)
  • 手部:手指数量、姿势、自然外观
  • 纹身、疤痕或其他可见的身体标记
  • 非面部珠宝和配饰(手表、手链、戒指)
  • 不应改变的服装部分(如果只更换上衣,则裤子、鞋子等)
  • 远离面部的头发(长度、样式、颜色)

评分指南:

  • - 90–100:身体特征完美保持
  • 70–89:存在微小不一致但整体身体身份完整
  • 50–69:某些身体部位看起来不同或有伪影
  • 30–49:体型有明显变化或显著伪影
  • 0–29:身体严重变形或完全不同的身体特征

维度4:背景保持(权重:10%)

原始人物图像和试穿结果之间的背景应保持稳定。背景变化会分散注意力并降低试穿的真实感。

检查内容:

  • - 场景一致性:相同的环境、物体、空间布局
  • 颜色和光照:一致的色调和照明
  • 伪影:人物轮廓周围的模糊、重影或扭曲
  • 物体完整性:家具、墙壁、图案应保持不变
  • 边缘融合:人物与背景之间的平滑过渡

评分指南:

  • - 90–100:背景相同或几乎无法区分
  • 70–89:非常微小的变化;需要仔细检查才能注意到
  • 50–69:一些明显的背景改变或伪影
  • 30–49:背景显著变化或严重伪影
  • 0–29:背景严重改变或替换

输出格式

按以下确切结构呈现评估:

虚拟试穿效果评分报告

输入识别

  • - 输入格式:[三张独立图片 / 单张拼接图]
  • 原始人物:[简要描述人物特征]
  • 目标服装:[简要描述服装特征]
  • 试穿结果:[简要描述试穿效果概况]

分项评分

1. 人脸身份保持 (权重 40%)

  • - 得分:XX/100
  • 评价:[1-2句话解释分数]

2. 服装还原与贴合 (权重 30%)

  • - 得分:XX/100
  • 评价:[1-2句话解释分数]

3. 非人脸身体特征保持 (权重 20%)

  • - 得分:XX/100
  • 评价:[1-2句话解释分数]

4. 背景保持 (权重 10%)

  • - 得分:XX/100
  • 评价:[1-2句话解释分数]

总分

  • - 加权总分:XX.X/100
  • 计算方式:(人脸 × 0.4) + (服装 × 0.3) + (身体 × 0.2) + (背景 × 0.1)

总体评价

[2-3句话总结整体质量,突出最强和最弱的方面,并建议试穿流程中可以改进的地方]

评估理念

评分应诚实且校准。几个指导原则:

  • - 不要按曲线评分。 95分应意味着真正优秀的质量,而不仅仅是高于平均水平。将90分以上的分数留给那些能骗过细心人类观察者的结果。
  • - 按指定权重分配维度。 人脸身份(40%)占主导地位,因为面部变化意味着试穿未能实现其核心目的——展示这个人穿那件衣服的效果。技术完美但面部不同的服装转移毫无价值。
  • - 反馈要具体。 不要只说看起来不错或有问题。指出具体观察结果:鼻梁看起来略微变窄或左袖上的条纹图案变形。
  • - 考虑使用场景。 虚拟试穿是一种实用工具——用户想知道他们在购买前穿某件衣服是否好看。从这个角度评估:这个结果能帮助某人做出自信的购买决定吗?

边缘情况

  • - 如果服装类型不匹配(例如,原始人物穿着T恤,结果显示完全不同的类别如连衣裙),请注明这一点,但仍根据目标服装参考评估结果。
  • - 如果图像质量非常低,请注明限制,并解释由于分辨率限制,分数可能不完全可靠。
  • - 如果用户只提供两张图片(缺少三张中的一张),询问缺少哪一张以及他们能否提供。如果他们无法提供服装参考,仍可评估人脸/身体/背景,但应对服装分数加以说明。
  • - 如果试穿只改变部分服装(例如,只更换上衣),仅评估改变部分的服装保真度,并注明原始部分中保留的内容。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 virtual-tryon-scorer-1775957554 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 virtual-tryon-scorer-1775957554 技能

通过命令行安装

skillhub install virtual-tryon-scorer-1775957554

下载

⬇ 下载 virtual-tryon-scorer v1.0.0(免费)

文件大小: 5.02 KB | 发布时间: 2026-4-13 12:29

v1.0.0 最新 2026-4-13 12:29
virtual-tryon-scorer 1.0.0

- Initial release of the virtual try-on quality assessment skill.
- Evaluates AI-generated virtual try-on results based on four weighted criteria: face identity preservation, garment fidelity & fit, non-face body identity preservation, and background preservation.
- Supports both separate and concatenated image input formats, with logic for identifying image roles and prompting user clarification if needed.
- Provides detailed, structured scoring (0–100 per dimension), weighted total score, and concise explanations for each aspect.
- Triggers automatically when users request virtual try-on evaluation, scoring, or feedback, including common English and Chinese phrases.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部