返回顶部
c

comfyui-ttsComfyUI语音合成

Generate speech audio using ComfyUI Qwen-TTS service. Invoke when user needs text-to-speech conversion or voice generation through ComfyUI.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
845
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

comfyui-tts

ComfyUI TTS 技能

使用 ComfyUI 的 Qwen-TTS 服务生成语音音频。此技能允许您通过 ComfyUI 的 API 将文本转换为语音。

配置

环境变量

设置以下环境变量以配置 ComfyUI 连接:

bash
export COMFYUI_HOST=localhost # ComfyUI 服务器主机
export COMFYUI_PORT=8188 # ComfyUI 服务器端口
export COMFYUIOUTPUTDIR= # 可选:自定义输出目录

使用方法

基础文本转语音

使用默认设置从文本生成音频:

bash
scripts/tts.sh 你好,世界

高级选项

自定义语音特性:

bash

指定角色和风格


scripts/tts.sh 你好 --character Girl --style Emotional

更改模型大小

scripts/tts.sh 你好 --model 3B

指定输出文件

scripts/tts.sh 你好 --output /path/to/output.wav

组合选项

scripts/tts.sh 你好,这是测试 \ --character Girl \ --style Emotional \ --model 1.7B \ --output ~/audio/test.wav

可用选项

选项描述默认值
--character语音角色(女孩/男孩等)Girl
--style
说话风格(情感化/中性等) | Emotional | | --model | 模型大小(0.5B/1.7B/3B) | 1.7B | | --output | 输出文件路径 | 自动生成 | | --temperature | 生成温度(0-1) | 0.9 | | --top-p | Top-p 采样 | 0.9 | | --top-k | Top-k 采样 | 50 |

工作流程

该技能执行以下步骤:

  1. 1. 构建工作流:使用您的文本和设置构建 ComfyUI 工作流 JSON
  2. 提交任务:将工作流发送到 ComfyUI 的 /prompt 端点
  3. 轮询状态:通过 /history 端点监控任务完成情况
  4. 获取音频:返回生成的音频文件路径

故障排除

连接被拒绝

  • - 验证 ComfyUI 是否正在运行:curl http://$COMFYUIHOST:$COMFYUIPORT/system_stats
  • 检查主机和端口设置

任务超时

  • - 大型模型(3B)生成时间较长
  • 尝试使用较小模型(0.5B、1.7B)以获得更快结果

输出未找到

  • - 检查 ComfyUI 的输出目录配置
  • 验证文件权限

API 参考

该技能使用 ComfyUI 的原生 API 端点:

  • - POST /prompt - 提交工作流
  • GET /history - 检查任务状态
  • 输出文件保存到 ComfyUI 配置的输出目录中

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 comfyui-tts-1776419980 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 comfyui-tts-1776419980 技能

通过命令行安装

skillhub install comfyui-tts-1776419980

下载

⬇ 下载 comfyui-tts v1.0.0(免费)

文件大小: 6.63 KB | 发布时间: 2026-4-17 18:30

v1.0.0 最新 2026-4-17 18:30
Initial release of comfyui-tts – generate speech audio with ComfyUI Qwen-TTS.

- Provides a shell script to convert text to speech using ComfyUI's Qwen-TTS service.
- Supports customizable options: character, style, model size, output path, and sampling parameters.
- Requires curl and jq; configurable via environment variables for host, port, and output directory.
- Automatically submits jobs to ComfyUI, monitors completion, and retrieves audio files.
- Includes usage instructions, troubleshooting tips, and API endpoint references.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部