Appearance
将音频录音快速转换为专业 Markdown 会议纪要
解决录音整理低效痛点:通过 AI 自动将音频/视频文件转录为文本,并智能提取关键信息,直接输出包含元数据、会议纪要和执行摘要的专业 Markdown 报告。
为什么需要这个技能
无论是会议记录、访谈录音还是讲座音频,手动整理转录文本不仅耗时,且难以快速提取核心结论。传统的转录工具仅能提供“纯文本堆砌”,缺乏结构化的分析。
本技能通过集成 Faster-Whisper 或 OpenAI Whisper,实现了从“音频 文本 结构化文档”的全自动化流程。它不仅能识别语言和说话人,还能利用 LLM(如 Claude/GPT)将冗长的对话转化为具有行动导向的会议纪要,让录音真正成为可执行的文档。
适用场景
- 会议总结:快速将团队周会、客户沟通录音转化为标准会议纪要。
- 内容创作:将播客或访谈音频转换为文章草稿或结构化笔记。
- 学术研究:将讲座录音快速转录并提取核心知识点。
- 字幕制作:生成 SRT 或 VTT 格式的字幕文件。
- 批量处理:一次性处理文件夹内所有音频文件并生成对应的 Markdown 报告。
核心工作流
环境自检与依赖安装:
- 自动检测系统中是否安装了
faster-whisper(推荐)或whisper。 - 检查
ffmpeg是否可用,用于支持多种音频格式(MP3, WAV, M4A 等)的转换。 - 若缺失依赖,提供一键安装脚本。
- 自动检测系统中是否安装了
音频验证与预处理:
- 验证文件路径,提取时长、文件大小等元数据。
- 针对大文件发出预警,并在必要时使用
ffmpeg将非标准格式转换为 WAV。
智能转录与分析:
- 调用 Whisper 模型进行语音转文字,识别语言并进行说话人分离(Diarization)。
- 将转录文本交给 LLM,通过“密度链(Chain of Density)”方法生成精简的执行摘要。
结构化输出:
- 生成包含【元数据表格】 【参会人员】 【讨论议题】 【决定项】 【待办事项】的 Markdown 报告。
bash
# 示例:基础转录指令
copilot> transcribe audio to markdown: meeting-2026-02-02.mp3下载和安装
下载 audio-transcriber 中文版 Skill ZIP
解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。
你可能还需要
暂无推荐