Chanjing Text To Digital Person

功能说明

文生图、图生说话视频、可选 LoRA 训练与轮询；用户明确要求时下载生成物。凭据与权限见 manifest.yaml。脚本不依赖 ffmpeg/ffprobe。

运行依赖

- python3 与同仓库 scripts/*.py（含 _auth.py、_task_api.py）
无 ffmpeg/ffprobe 门控

环境变量与机器可读声明

- 环境变量键名与说明：manifest.yaml（environment 段）及本文
变量、凭据模型、合规 permissions、clientPermissions、agentPolicy：manifest.yaml

使用命令

- ClawHub（slug 以注册表为准）：INLINECODE10
本仓库：python skills/chanjing-text-to-digital-person/scripts/create_photo_task.py …（见 Standard Workflow）

登记与审稿（单一事实来源）

路径、primaryEnv 省略、persistAccessTokenOnDisk、敏感字段、agentPolicy、可选 env 等：以 manifest.yaml 为准。实现上由 _auth.py、_task_api.py 与各 CLI 脚本承担；本篇从 When to Use 起写流程。

When to Use This Skill

当用户要做这些事时使用本 Skill：

* 根据人物提示词生成数字人形象图
把生成的人物图转成会说话的短视频
查询文生图 / 图生视频 / LoRA 任务状态
在用户明确要求时，把生成图片或视频下载到本地

如果需求是“上传真人素材训练定制数字人”，优先使用 chanjing-customised-person。
如果需求是“拿已有数字人做口播视频合成”，优先使用 chanjing-video-compose。

Preconditions

执行本 Skill 前，必须先通过 chanjing-credentials-guard 完成 AK/SK 与 Token 校验。

本 Skill 与 guard 共用：

* INLINECODE21
INLINECODE22

无凭证时，脚本会自动打开蝉镜登录页（若同仓库存在则执行 chanjing-credentials-guard/scripts/open_login_page.py，否则 webbrowser.open），并提示本地执行 chanjing_config.py。

审阅与安全（凭据）

与 Purpose / Credentials / Persistence 相关的逐项说明见 manifest.yaml（缺凭证时可能子进程调用 guard 的 open_login_page.py 等行为见 clientPermissions）。

Standard Workflow

主流程通常分两段，且都是异步任务：

1. 调用 create_photo_task.py 创建文生图任务，得到 INLINECODE30
调用 poll_photo_task.py 轮询到成功，选一张 INLINECODE32
调用 create_motion_task.py 创建图生视频任务，得到 INLINECODE34
调用 poll_motion_task.py 轮询到成功，得到最终 INLINECODE36
只有在用户明确要求保存到本地时，才调用 INLINECODE37

可选扩展：

* 若用户想做 LoRA 训练，调用 create_lora_task.py 和 INLINECODE39
INLINECODE40 成功后会返回一条 photo_task_id，可继续用 poll_photo_task.py 拿图

Covered APIs

本 Skill 当前覆盖：

* INLINECODE43
INLINECODE44
INLINECODE45
INLINECODE46
INLINECODE47
INLINECODE48
INLINECODE49

Scripts

脚本目录：

* INLINECODE50

本仓库随附文件（勿与仅含 `_auth.py` 的精简包混淆）

完整包内含 _auth.py、_task_api.py（供任务脚本复用）及下列 .py CLI；请用 python3 <路径>/<脚本名>.py 调用（与仓库内其它蝉镜 skill 约定一致）。

文件名（仓库内）	说明
INLINECODE56	读 `credentials.json`、刷新并写回 `access_token` / `expire_in`；缺 AK/SK 时尝试 `open_login_page.py`
INLINECODE61

若环境中缺少上表任一入口或 _task_api.py，属于 分发/打包不完整。

Usage Examples

示例 1：文生图后直接图生视频

CODEBLOCK0

示例 2：LoRA 训练

CODEBLOCK1

Download Rule

下载是显式动作，不是默认动作：

* poll_photo_task.py 和 poll_motion_task.py 成功后应先返回远端 URL
不要自动下载结果文件
只有当用户明确表达“下载到本地”“保存到 outputs”“帮我落盘”时，才执行 INLINECODE84

Output Convention

默认本地输出目录：

* INLINECODE85

Additional Resources

更多接口细节见：

* INLINECODE86
INLINECODE87

Chanjing 文本转数字人

功能说明

文生图、图生说话视频、可选 LoRA 训练与轮询；用户明确要求时下载生成物。凭据与权限见 manifest.yaml。脚本不依赖 ffmpeg/ffprobe。

运行依赖

- python3 与同仓库 scripts/*.py（含 auth.py、task_api.py）
无 ffmpeg/ffprobe 门控

环境变量与机器可读声明

- 环境变量键名与说明：manifest.yaml（environment 段）及本文
变量、凭据模型、合规 permissions、clientPermissions、agentPolicy：manifest.yaml

使用命令

- ClawHub（slug 以注册表为准）：clawhub run chanjing-text-to-digital-person
本仓库：python skills/chanjing-text-to-digital-person/scripts/createphototask.py …（见 标准工作流）

登记与审稿（单一事实来源）

路径、primaryEnv 省略、persistAccessTokenOnDisk、敏感字段、agentPolicy、可选 env 等：以 manifest.yaml 为准。实现上由 auth.py、task_api.py 与各 CLI 脚本承担；本篇从 使用时机 起写流程。

使用时机

当用户要做这些事时使用本技能：

* 根据人物提示词生成数字人形象图
把生成的人物图转成会说话的短视频
查询文生图 / 图生视频 / LoRA 任务状态
在用户明确要求时，把生成图片或视频下载到本地

如果需求是上传真人素材训练定制数字人，优先使用 chanjing-customised-person。
如果需求是拿已有数字人做口播视频合成，优先使用 chanjing-video-compose。

前置条件

执行本技能前，必须先通过 chanjing-credentials-guard 完成 AK/SK 与 Token 校验。

本技能与 guard 共用：

* ~/.chanjing/credentials.json
https://open-api.chanjing.cc

无凭证时，脚本会自动打开蝉镜登录页（若同仓库存在则执行 chanjing-credentials-guard/scripts/openloginpage.py，否则 webbrowser.open），并提示本地执行 chanjing_config.py。

审阅与安全（凭据）

与 用途 / 凭据 / 持久化 相关的逐项说明见 manifest.yaml（缺凭证时可能子进程调用 guard 的 openloginpage.py 等行为见 clientPermissions）。

标准工作流

主流程通常分两段，且都是异步任务：

1. 调用 createphototask.py 创建文生图任务，得到 photouniqueid
调用 pollphototask.py 轮询到成功，选一张 photopath
调用 createmotiontask.py 创建图生视频任务，得到 motionuniqueid
调用 pollmotiontask.py 轮询到成功，得到最终 videourl
只有在用户明确要求保存到本地时，才调用 download_result.py

可选扩展：

* 若用户想做 LoRA 训练，调用 createloratask.py 和 pollloratask.py
pollloratask.py 成功后会返回一条 phototaskid，可继续用 pollphototask.py 拿图

覆盖的 API

本技能当前覆盖：

* POST /open/v1/aigc/photo
GET /open/v1/aigc/photo/task
GET /open/v1/aigc/photo/task/page
POST /open/v1/aigc/motion
GET /open/v1/aigc/motion/task
POST /open/v1/aigc/lora/task/create
GET /open/v1/aigc/lora/task

脚本

脚本目录：

* skills/chanjing-text-to-digital-person/scripts/

本仓库随附文件（勿与仅含 _auth.py 的精简包混淆）

完整包内含 auth.py、task_api.py（供任务脚本复用）及下列 .py CLI；请用 python3 <路径>/<脚本名>.py 调用（与仓库内其它蝉镜技能约定一致）。

文件名（仓库内）	说明
auth.py	读 credentials.json、刷新并写回 accesstoken / expirein；缺 AK/SK 时尝试 openloginpage.py
task_api.py

若环境中缺少上表任一入口或 taskapi.py，属于 分发/打包不完整。

使用示例

示例 1：文生图后直接图生视频

bash
PHOTOTASKID=$(python3 skills/chanjing-text-to-digital-person/scripts/createphototask.py \
--age 青年 \
--gender 女 \
--number-of-images 1 \
--industry 教育培训 \
--background 现代直播间背景 \
--detail 短发，亲和力强，职业装 \
--talking-pose 上半身特写，站立讲解)

PHOTOURL=$(python3 skills/chanjing-text-to-digital-person/scripts/pollphoto_task.py \
--unique-id $PHOTOTASKID)

MOTIONTASKID=$(python3 skills/chanjing-text-to-digital-person/scripts/createmotiontask.py \
--photo-unique-id $PHOTOTASKID \
--photo-path $PHOTO_URL \
--emotion 自然播报，语气清晰自信 \
--gesture)

python3 skills/chanjing-text-to-digital-person/scripts/pollmotiontask.py \
--unique-id $MOTIONTASKID

示例 2：LoRA 训练

bash
LORAID=$(python3 skills/chanjing-text-to-digital-person/scripts/createlora_task.py \
--name 演示LoRA \
--photo-url https://example.com/1.jpg \
--photo-url https://example.com/2.jpg \
--photo-url https://example.com/3.jpg \
--photo-url https://example.com/4.jpg \
--photo-url https://example.com/5.jpg)

python3 skills/chanjing-text-to-digital-person/scripts/pollloratask.py \
--lora-id $LORA_ID

下载规则

下载是显式动作，不是默认动作：

* pollphototask.py 和 pollmotiontask.py 成功后应先返回远端 URL
不要自动下载结果文件
只有当用户明确表达下载到本地保存到 outputs帮我落盘时，才执行 download_result.py

输出约定

默认本地输出目录：

* outputs/text-to-digital-person/

附加资源

更多接口细节见：

* skills/chanjing-text-to-digital-person/reference.md
skills/chanjing-text-to-digital-person/examples.md

chanjing-text-to-digital-person文本转数字人