返回顶部
a

alicloud-ai-audio-tts-realtime阿里云实时语音合成

Real-time speech synthesis with Alibaba Cloud Model Studio Qwen TTS Realtime models. Use when low-latency interactive speech is required, including instruction-controlled realtime synthesis.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
782
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

alicloud-ai-audio-tts-realtime

技能名称: alicloud-ai-audio-tts-realtime

详细描述:
分类: 提供商

Model Studio Qwen TTS 实时

使用实时TTS模型实现低延迟的流式语音输出。

关键模型名称

使用以下精确的模型字符串之一:

  • - qwen3-tts-flash-realtime
  • qwen3-tts-instruct-flash-realtime
  • qwen3-tts-instruct-flash-realtime-2026-01-22
  • qwen3-tts-vd-realtime-2026-01-15
  • qwen3-tts-vc-realtime-2026-01-15

前提条件

  • - 在虚拟环境中安装SDK:

bash
python3 -m venv .venv
. .venv/bin/activate
python -m pip install dashscope

  • - 在环境中设置 DASHSCOPEAPIKEY,或将 dashscopeapikey 添加到 ~/.alibabacloud/credentials。

标准化接口 (tts.realtime)

请求

  • - text (字符串,必填)
  • voice (字符串,必填)
  • instruction (字符串,可选)
  • sample_rate (整数,可选)

响应

  • - audiobase64pcmchunks (数组<字符串>)
  • samplerate (整数)
  • finish_reason (字符串)

操作指南

  • - 使用WebSocket或流式端点实现实时模式。
  • 保持每次发声简短以降低延迟。
  • 对于指令模型,保持指令明确且简洁。
  • 某些SDK/运行时组合可能拒绝通过 MultiModalConversation 调用实时模型;请使用下面的探测脚本验证兼容性。

本地演示脚本

使用探测脚本验证当前SDK/运行时中的实时兼容性,并可选择回退到非实时模型以立即输出:

bash
.venv/bin/python skills/ai/audio/alicloud-ai-audio-tts-realtime/scripts/realtimettsdemo.py \
--text 这是一个实时语音演示。 \
--fallback \
--output output/ai-audio-tts-realtime/audio/fallback-demo.wav

严格模式(用于CI/门控):

bash
.venv/bin/python skills/ai/audio/alicloud-ai-audio-tts-realtime/scripts/realtimettsdemo.py \
--text 实时健康检查 \
--strict

输出位置

  • - 默认输出:output/ai-audio-tts-realtime/audio/
  • 通过 OUTPUT_DIR 覆盖基础目录。

验证

bash
mkdir -p output/alicloud-ai-audio-tts-realtime
for f in skills/ai/audio/alicloud-ai-audio-tts-realtime/scripts/*.py; do
python3 -m py_compile $f
done
echo pycompileok > output/alicloud-ai-audio-tts-realtime/validate.txt

通过标准:命令退出码为0,且生成 output/alicloud-ai-audio-tts-realtime/validate.txt。

输出与证据

  • - 将工件、命令输出和API响应摘要保存在 output/alicloud-ai-audio-tts-realtime/ 下。
  • 在证据文件中包含关键参数(区域/资源ID/时间范围)以确保可复现性。

工作流程

1) 确认用户意图、区域、标识符以及操作是只读还是修改性。
2) 首先运行一个最小的只读查询以验证连接性和权限。
3) 使用显式参数和限定范围执行目标操作。
4) 验证结果并保存输出/证据文件。

参考

  • - references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 alicloud-ai-audio-tts-realtime-1776419938 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 alicloud-ai-audio-tts-realtime-1776419938 技能

通过命令行安装

skillhub install alicloud-ai-audio-tts-realtime-1776419938

下载

⬇ 下载 alicloud-ai-audio-tts-realtime v1.0.1(免费)

文件大小: 5.33 KB | 发布时间: 2026-4-17 19:04

v1.0.1 最新 2026-4-17 19:04
batch publish from alicloud-skills on 2026-03-11

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部