Skip to content

将音频录音快速转换为专业 Markdown 会议纪要

解决录音整理低效痛点:通过 AI 自动将音频/视频文件转录为文本,并智能提取关键信息,直接输出包含元数据、会议纪要和执行摘要的专业 Markdown 报告。

为什么需要这个技能

无论是会议记录、访谈录音还是讲座音频,手动整理转录文本不仅耗时,且难以快速提取核心结论。传统的转录工具仅能提供“纯文本堆砌”,缺乏结构化的分析。

本技能通过集成 Faster-Whisper 或 OpenAI Whisper,实现了从“音频 文本 结构化文档”的全自动化流程。它不仅能识别语言和说话人,还能利用 LLM(如 Claude/GPT)将冗长的对话转化为具有行动导向的会议纪要,让录音真正成为可执行的文档。

适用场景

  • 会议总结:快速将团队周会、客户沟通录音转化为标准会议纪要。
  • 内容创作:将播客或访谈音频转换为文章草稿或结构化笔记。
  • 学术研究:将讲座录音快速转录并提取核心知识点。
  • 字幕制作:生成 SRT 或 VTT 格式的字幕文件。
  • 批量处理:一次性处理文件夹内所有音频文件并生成对应的 Markdown 报告。

核心工作流

  1. 环境自检与依赖安装

    • 自动检测系统中是否安装了 faster-whisper(推荐)或 whisper
    • 检查 ffmpeg 是否可用,用于支持多种音频格式(MP3, WAV, M4A 等)的转换。
    • 若缺失依赖,提供一键安装脚本。
  2. 音频验证与预处理

    • 验证文件路径,提取时长、文件大小等元数据。
    • 针对大文件发出预警,并在必要时使用 ffmpeg 将非标准格式转换为 WAV。
  3. 智能转录与分析

    • 调用 Whisper 模型进行语音转文字,识别语言并进行说话人分离(Diarization)。
    • 将转录文本交给 LLM,通过“密度链(Chain of Density)”方法生成精简的执行摘要。
  4. 结构化输出

    • 生成包含【元数据表格】 【参会人员】 【讨论议题】 【决定项】 【待办事项】的 Markdown 报告。
bash
# 示例:基础转录指令
copilot> transcribe audio to markdown: meeting-2026-02-02.mp3

下载和安装

下载 audio-transcriber 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md

你可能还需要

暂无推荐