将音频录音快速转换为专业 Markdown 会议纪要

解决录音整理低效痛点：通过 AI 自动将音频/视频文件转录为文本，并智能提取关键信息，直接输出包含元数据、会议纪要和执行摘要的专业 Markdown 报告。

为什么需要这个技能

无论是会议记录、访谈录音还是讲座音频，手动整理转录文本不仅耗时，且难以快速提取核心结论。传统的转录工具仅能提供“纯文本堆砌”，缺乏结构化的分析。

本技能通过集成 Faster-Whisper 或 OpenAI Whisper，实现了从“音频 $\to$ 文本 $\to$ 结构化文档”的全自动化流程。它不仅能识别语言和说话人，还能利用 LLM（如 Claude/GPT）将冗长的对话转化为具有行动导向的会议纪要，让录音真正成为可执行的文档。

环境自检与依赖安装：
- 自动检测系统中是否安装了 faster-whisper（推荐）或 whisper。
- 检查 ffmpeg 是否可用，用于支持多种音频格式（MP3, WAV, M4A 等）的转换。
- 若缺失依赖，提供一键安装脚本。
音频验证与预处理：
- 验证文件路径，提取时长、文件大小等元数据。
- 针对大文件发出预警，并在必要时使用 ffmpeg 将非标准格式转换为 WAV。
智能转录与分析：
- 调用 Whisper 模型进行语音转文字，识别语言并进行说话人分离（Diarization）。
- 将转录文本交给 LLM，通过“密度链（Chain of Density）”方法生成精简的执行摘要。
结构化输出：
- 生成包含【元数据表格】 $\to$ 【参会人员】 $\to$ 【讨论议题】 $\to$ 【决定项】 $\to$ 【待办事项】的 Markdown 报告。

# 示例：基础转录指令
copilot> transcribe audio to markdown: meeting-2026-02-02.mp3

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐