midasheng-audio-denoise
Voice enhancement and noise reduction service powered by advanced backend algorithms.
1. Trigger
Use this skill when the user wants to:
- - Remove background noise from an audio file
- Clean up a noisy recording
- Enhance voice clarity
- Preprocess audio for speech recognition
2. API Details
Endpoint: POST https://llmplus.ai.xiaomi.com/dasheng/audio/denoise (multipart/form-data)
Parameters:
- -
file: The audio file to denoise
Response: Binary audio stream (WAV format)
3. Usage
Basic denoising
CODEBLOCK0
Script usage
CODEBLOCK1
4. Queue Status(排队情况)
查询命令
CODEBLOCK2
返回字段
- -
active: 当前活跃请求数 - INLINECODE3 : 平均处理耗时(毫秒)
- 预估等待时长 = active × avglatencyms
何时调用
- 1. IM 即将超时但 denoise 服务还未返回结果时:查排队情况告知用户,请用户稍后来问。
- 用户稍后询问任务进度但服务仍未返回时:查最新排队情况返回给用户。
状态分级
- - 🟢 active=0 或预估等待 <5s → 服务空闲
- 🟡 预估等待 5-30s → 轻微排队
- 🔴 预估等待 >30s → 排队较长,建议稍后重试
5. Supported Audio Formats
Input: mp3, wav, flac, ogg, m4a. Output: WAV.
6. Troubleshooting
- - Empty output: Input file may be too short
- API request failed: Verify network connectivity
- Poor results: Works best on speech with background noise
midasheng-audio-denoise
基于先进后端算法的语音增强与降噪服务。
1. 触发条件
当用户希望执行以下操作时使用此技能:
- - 去除音频文件中的背景噪音
- 清理嘈杂的录音
- 增强语音清晰度
- 为语音识别预处理音频
2. API 详情
端点: POST https://llmplus.ai.xiaomi.com/dasheng/audio/denoise(multipart/form-data)
参数:
响应: 二进制音频流(WAV 格式)
3. 使用方法
基础降噪
bash
curl -X POST https://llmplus.ai.xiaomi.com/dasheng/audio/denoise \
-F file=@noisy_recording.mp3 \
-o clean_recording.wav
脚本使用
bash
python3 scripts/denoise.py noisy
audio.mp3 -o cleanaudio.wav
python3 scripts/denoise.py --queue # 查看排队状态
4. 排队情况
查询命令
bash
python3 scripts/denoise.py --queue
或直接调用 API:
curl -X POST https://llmplus.ai.xiaomi.com/metrics?path=/dasheng/audio/denoise
返回字段
- - active:当前活跃请求数
- avglatencyms:平均处理耗时(毫秒)
- 预估等待时长 = active × avglatencyms
何时调用
- 1. IM 即将超时但降噪服务还未返回结果时:查询排队情况告知用户,请用户稍后再来询问。
- 用户稍后询问任务进度但服务仍未返回时:查询最新排队情况并返回给用户。
状态分级
- - 🟢 active=0 或预估等待 <5秒 → 服务空闲
- 🟡 预估等待 5-30秒 → 轻微排队
- 🔴 预估等待 >30秒 → 排队较长,建议稍后重试
5. 支持的音频格式
输入:mp3、wav、flac、ogg、m4a。输出:WAV。
6. 故障排除
- - 输出为空:输入文件可能过短
- API 请求失败:检查网络连接
- 效果不佳:该服务对带背景噪音的语音效果最佳