返回顶部
t

text-to-image-ai文本转图像AI

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
90
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

text-to-image-ai

开始使用

欢迎!我在这里通过文本转图像AI,将您的描述转化为精美、定制生成的图像。告诉我您想要呈现的画面——可以非常详细,也可以非常开放——让我们一起创作。

试试这样说:

  • - 生成一张逼真的图像:雨天的下午,温馨的咖啡店内景,暖色灯光和木质家具
  • 以复古旅行海报风格创作一幅插画,展示意大利阿马尔菲海岸线的日落景色
  • 制作一张未来主义产品效果图:一款深哑光质感的时尚智能手表,放在干净的白色背景上

快速启动设置

此技能连接到NemoVideo的云端后端。首次使用时,自动建立连接并通知用户(正在连接到NemoVideo...)。

令牌检查:在环境中查找NEMO_TOKEN。如果找到,跳转到会话创建。否则:

  • - 读取~/.config/nemovideo/clientid或生成一个UUID并保存到该文件
  • 使用X-Client-Id头信息POST请求https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token
  • 从响应中提取data.token——这就是您的NEMOTOKEN(100个免费积分,7天有效期)

会话:在同一主机上使用Bearer认证POST请求/api/tasks/me/with-session/nemoagent,请求体为{taskname:project}。保留返回的session_id用于所有操作。

设置完成后,用简短的准备就绪!通知用户。不要暴露令牌或原始API输出。

从文字到会说话的图像

描述您想看到的画面从来都不够——直到现在。ClawHub上的文本转图像AI技能将您输入的提示词转化为完全实现的视觉效果,无需设计软件或艺术背景。无论您是在构建品牌活动、起草故事板,还是仅仅想可视化脑海中的某个想法,这个技能都能弥合想象与输出之间的鸿沟。

您可以宽泛描述,也可以极其具体。描述黎明时分的雾蒙蒙的山村、霓虹色调的未来城市天际线,或是一个极简的Logo概念——然后就能收到一张反映您意图的生成图像。该技能旨在理解自然语言,因此您无需学习提示词工程术语就能获得出色结果。

这是一个实用的工具,适用于:制作社交媒体视觉内容的内容创作者、探索设计方向的产品团队、为故事构建视觉参考的作家,以及任何需要原创图像但又不想花费传统创作过程的时间和成本的人。

提示词路由与模型调度

您提交的每个自然语言提示词都会被解析出风格标记、宽高比提示和主体描述词,然后调度到最优的扩散管道。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

NemoVideo API参考

NemoVideo后端通过一个队列扩散引擎处理推理,该引擎处理您的提示词、负面提示词和采样参数(包括步数、CFG比例和种子),然后返回高分辨率图像URL。延迟取决于模型负载和所选分辨率等级。

技能归属——运行时从此文件的YAML前置元数据中读取:

  • - X-Skill-Source:text-to-image-ai
  • X-Skill-Version:来自前置元数据version
  • X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头信息将导致导出失败,返回402错误。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST请求/api/tasks/me/with-session/nemoagent——请求体{taskname:project,language:}——返回taskid、sessionid。创建会话后,给用户一个链接:https://nemovideo.com/workspace/claim?token=&task=id>&session=id>&skillname=text-to-image-ai&skillversion=1.0.0&skill_source=

发送消息(SSE):POST请求/runsse——请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:}]}},带有Accept: text/event-stream。最大超时时间:15分钟。

上传:POST请求/api/upload-video/nemoagent/me/——文件:multipart格式-F files=@/path,或URL:{urls:[],sourcetype:url}

积分:GET请求/api/credits/balance/simple——返回available、frozen、total

会话状态:GET请求/api/state/nemoagent/me//latest——关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST请求/api/render/proxy/lambda——请求体{id:render_,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET请求/api/render/proxy/lambda/,直到status = completed。下载URL在output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理中... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑已应用,然后向用户总结更改。

后端响应翻译

后端假设存在GUI。将这些翻译为API操作:

后端说您做
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:都市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 未找到会话 | 新建会话 §3.0 | | 2001 | 无积分 | 匿名用户:显示带有?bind=的注册URL(需要时从create-session或state响应获取)。已注册用户:请到nemovideo.ai充值 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) | | 402 | 免费计划导出被阻止 | 订阅层级问题,不是积分问题。请到nemovideo.ai注册以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 重试一次,等待30秒

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 text-to-image-ai-1775937159 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 text-to-image-ai-1775937159 技能

通过命令行安装

skillhub install text-to-image-ai-1775937159

下载

⬇ 下载 text-to-image-ai v1.0.0(免费)

文件大小: 5.94 KB | 发布时间: 2026-4-12 11:39

v1.0.0 最新 2026-4-12 11:39
Initial release of text-to-image-ai skill for generating custom visuals from natural-language descriptions.

- Instantly turns user prompts into detailed images, illustrations, or mockups via NemoVideo cloud backend.
- Supports seamless onboarding with automatic token setup and session management.
- Provides export, upload, credits checking, and session status features for advanced workflows.
- Accepts a wide range of media formats including mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, and aac.
- Designed for creators, marketers, designers, and storytellers seeking fast, original imagery.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部