Transcribe audio files with speaker diarization (who speaks when). Supports 100+ languages, automatic language detection, and timestamps. Use for meetings, interviews, podcasts, or voice messages. Requires AssemblyAI API key.
使用说话人分离功能(谁在何时说话)转录音频文件。
bash
export ASSEMBLYAIAPIKEY=your-api-key
或保存到配置文件:
json
// ~/.assemblyai_config.json
{
apikey: YOURAPI_KEY
}
bash
python3 scripts/transcribe.py /path/to/recording.mp3
bash
python3 scripts/transcribe.py https://example.com/meeting.mp3
bash
python3 scripts/transcribe.py audio.mp3 --no-diarization # 跳过说话人标签
python3 scripts/transcribe.py audio.mp3 --json # 原始JSON输出
语言:中文
时长:05:32
说话人A [00:00]:大家好,欢迎参加本次会议。
说话人B [00:03]:谢谢!很高兴来到这里。
说话人A [00:06]:让我们从第一个议题开始...
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 assemblyai-transcriber-1776339086 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 assemblyai-transcriber-1776339086 技能
skillhub install assemblyai-transcriber-1776339086
文件大小: 4.75 KB | 发布时间: 2026-4-17 14:12