返回顶部
a

audio-transcribe-summarize音频转录摘要

Transcribe audio/video files to text and generate structured summaries using SenseAudio ASR API. Use when the user asks to transcribe, summarize, or take notes from audio files, video files, recordings, meetings, lectures, podcasts, or interviews.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
184
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

audio-transcribe-summarize

音频/视频转录与摘要

使用 SenseASR API(api.senseaudio.cn)转录音频/视频文件,然后将内容总结为结构化笔记。

{baseDir} 指代本技能的目录。

前置条件

  • - 已配置环境变量 SENSEAUDIOAPIKEY(在 https://senseaudio.cn/platform/api-key 获取密钥)
  • 已安装 Python 3.8+ 并安装 requests 库
  • 对于大文件(>10MB):需安装 ffmpeg 用于分割(macOS:brew install ffmpeg,Windows:从 ffmpeg.org 下载并加入 PATH,Linux:apt install ffmpeg)

快速开始

  1. 1. 运行转录脚本:

bash
python {baseDir}/scripts/transcribe.py <音频文件> [--model sense-asr-pro] [--language zh] [--speakers] [--sentiment] [--translate en]

  1. 2. 脚本会在源文件旁输出一个 .txt 格式的转录文件
  2. 阅读转录内容并生成摘要(参见下方摘要格式)

工作流程

步骤 1:评估音频文件

检查文件大小和格式:

  • - 支持的格式:wav、mp3、ogg、flac、aac、m4a、mp4
  • 单次请求最大文件大小:10MB
  • 如果文件 > 10MB,脚本会自动使用 ffmpeg 进行分割

步骤 2:选择合适的模型

模型适用场景
sense-asr-lite快速批量转录、简单音频、对成本敏感
sense-asr
通用转录,需要说话人分离或时间戳 | | sense-asr-pro | 需要高精度:会议、访谈、复杂音频 | | sense-asr-deepthink | 嘈杂音频、方言、大量专业术语、语音转纯净文本 |

默认使用 sense-asr-pro 以获得最佳质量。

步骤 3:转录

运行转录脚本。关键选项:

bash

基础转录


python {baseDir}/scripts/transcribe.py recording.mp3

多人会议 + 情感分析

python {baseDir}/scripts/transcribe.py meeting.wav \ --model sense-asr-pro \ --speakers --max-speakers 4 \ --sentiment \ --timestamps segment

转录并翻译为英文

python {baseDir}/scripts/transcribe.py lecture.mp3 \ --model sense-asr \ --translate en

步骤 4:生成摘要

转录完成后,阅读转录文件并使用以下格式生成摘要。

摘要格式

按以下结构生成摘要:

markdown

[标题 - 从内容推断]

来源:filename.mp3
时长:X 分 Y 秒
日期:YYYY-MM-DD
说话人:[如果使用了说话人分离]

要点

  • - 要点 1
  • 要点 2
  • ...

详细摘要

[按主题/时间顺序组织的 2-4 段内容摘要]

待办事项

  • - [ ] 待办事项 1(如适用,分配给说话人 X)
  • [ ] 待办事项 2

精彩引述

转录中的直接引语 — 说话人 X,[如有时间戳]

完整转录

点击展开完整转录

[完整转录文本,如有说话人标签和时间戳]

根据内容类型调整模板:

  • - 会议:强调待办事项、决策、说话人贡献
  • 讲座/演讲:强调关键概念、学习要点、结构
  • 访谈:强调问答对、关键回答
  • 播客:强调讨论的话题、有趣见解

API 参考

有关完整的 SenseASR API 参数和响应格式,请参阅 api-reference.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 audio-transcribe-summarize-1776203342 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 audio-transcribe-summarize-1776203342 技能

通过命令行安装

skillhub install audio-transcribe-summarize-1776203342

下载

⬇ 下载 audio-transcribe-summarize v1.0.1(免费)

文件大小: 7.73 KB | 发布时间: 2026-4-17 14:08

v1.0.1 最新 2026-4-17 14:08
- Removed the `.env` file from the repository.
- Updated setup instructions: now require configuring the `SENSEAUDIO_API_KEY` environment variable instead of using a `.env` file.
- Prerequisites section now provides OS-specific installation steps for ffmpeg.
- Dependency on `python-dotenv` is no longer mentioned; only `requests` is required.
- Maintains existing workflow and summary guidelines.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部