返回顶部
a

aliyun-qwen-asr-realtime阿里云通义实时语音识别

Use when low-latency realtime speech recognition is needed with Alibaba Cloud Model Studio Qwen ASR Realtime models, including streaming microphone input, live captions, or duplex voice agents.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
86
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

aliyun-qwen-asr-realtime

技能名称: aliyun-qwen-asr-realtime

详细描述:
类别: provider

Model Studio Qwen ASR 实时

验证

bash
mkdir -p output/aliyun-qwen-asr-realtime
python -m pycompile skills/ai/audio/aliyun-qwen-asr-realtime/scripts/preparerealtimeasrrequest.py && echo pycompileok > output/aliyun-qwen-asr-realtime/validate.txt

通过标准:命令退出码为 0,且生成了 output/aliyun-qwen-asr-realtime/validate.txt 文件。

输出与证据

  • - 将会话负载和响应样本保存到 output/aliyun-qwen-asr-realtime/ 目录下。

关键模型名称

使用以下精确的模型字符串之一:

  • - qwen3-asr-flash-realtime
  • qwen3-asr-flash-realtime-2026-02-10

使用场景

  • - 实时字幕和标题
  • 语音代理双工输入
  • 浏览器或终端客户端中的流式语音转文本

前提条件

  • - 在环境中设置 DASHSCOPEAPIKEY,或将 dashscopeapikey 添加到 ~/.alibabacloud/credentials 文件中。
  • 实时会话通常需要在客户端处理 WebSocket 或流式会话。

标准化接口 (asr.realtime)

请求

  • - model (字符串,可选):默认为 qwen3-asr-flash-realtime
  • languagehints (字符串数组,可选)
  • format (字符串,可选):例如 pcm、wav
  • samplerate (整数,可选):例如 16000
  • chunk_ms (整数,可选):以毫秒为单位的帧大小

响应

  • - text (字符串):识别出的转录片段
  • is_final (布尔值):结束标记
  • usage (对象,可选)

快速开始

生成请求模板:

bash
python skills/ai/audio/aliyun-qwen-asr-realtime/scripts/preparerealtimeasr_request.py \
--output output/aliyun-qwen-asr-realtime/request.json

操作指南

  • - 除非你的客户端技术栈要求其他格式,否则优先使用 16kHz 单声道 PCM。
  • 保持数据块足够小,以便获得响应灵敏的部分结果。
  • 如果你只有录音文件,请改用 skills/ai/audio/aliyun-qwen-asr/。

参考

  • - references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aliyun-qwen-asr-realtime-1775887742 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aliyun-qwen-asr-realtime-1775887742 技能

通过命令行安装

skillhub install aliyun-qwen-asr-realtime-1775887742

下载

⬇ 下载 aliyun-qwen-asr-realtime v1.0.0(免费)

文件大小: 3 KB | 发布时间: 2026-4-12 08:57

v1.0.0 最新 2026-4-12 08:57
Initial release supporting Alibaba Cloud Qwen ASR Realtime speech recognition.

- Provides low-latency realtime speech recognition with Qwen ASR Realtime models.
- Supports use cases such as live captions, streaming microphone input, and duplex voice agents.
- Exposes a normalized asr.realtime interface for request and response handling.
- Includes setup, model selection, and operational usage guidance.
- Requires a valid DASHSCOPE_API_KEY for operation.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部