Skip to content

Everything Claude Code 的 video-editing Skill 专为开发者和内容创作者打造,聚合 FFmpeg、Remotion、ElevenLabs、fal.ai 等多工具,形成一套高效、可自动化的视频剪辑 AI 工作流。它解决了传统视频编辑繁琐、低效、重复性高的问题,实现了从原始素材整理、自动切段、结构规划、批量处理到智能生成配乐配音的全流程提效。无论是 vlog、教程还是产品演示,均可大幅提升视频内容生产效率和一致性。

Everything Claude Code Video Editing Skill:FFmpeg/Remotion/ElevenLabs/fal.ai 完整视频剪辑 AI 工作流

在 AI 编程助手体系下,video-editing Skill 是 Everything Claude Code 针对“已有视频素材剪辑”场景的旗舰能力。它并非 prompt 生成式视频,而是专注于用 AI 自动化处理真实拍摄或录屏素材,实现高效、结构化、可复用的视频内容生产。Skill 通过整合 FFmpeg、Remotion、ElevenLabs、fal.ai 等行业领先工具,将原本繁琐的手工视频剪辑流程,升级为可自动触发、可批量处理、可编程扩展的智能工作流。

1. video-editing Skill 解决了什么问题?

传统做法的痛点:

  • 手动浏览、剪切、拼接长时间录制的视频,效率低且易出错
  • 结构规划、内容筛选、添加字幕/配音/音乐等需多工具反复切换
  • 不同平台(YouTube、TikTok、Instagram)需要不同画幅和时长,手动适配繁琐
  • 缺乏自动化批量处理和可复用的编辑模板,难以快速规模化生产内容

Skill 带来的变化:

  • 一键激活 AI 驱动的视频剪辑全流程,从素材整理到成片输出自动化
  • 结构规划、无效片段识别、剪辑点生成、批量切段全部自动完成
  • 可编程的 Remotion 组件实现批量叠加字幕、品牌元素、动画等
  • 配合 ElevenLabs、fal.ai 实现智能配音、音乐、SFX 生成,补足缺失素材
  • 支持多平台自动画幅适配、智能场景切换、热点片段提取
  • 结合 videodbfal-ai-media 等 Skill,打造端到端视频内容流水线

2. 什么时候会自动激活 video-editing Skill?

  • 你在 Claude Code、Codex、Cursor 等 AI 编程助手中输入“剪辑视频”、“cut this footage”、“生成 vlog”、“视频工作流”等指令
  • 需要将长录屏、会议、访谈等素材压缩为短视频、教程、demo
  • 想批量添加字幕、配音、音乐、转场、品牌元素等
  • 需要自动适配不同平台(如 YouTube 16:9、TikTok 9:16、Instagram 1:1)的视频尺寸
  • 需要根据转录文本、场景变化自动提取高亮片段

3. 完整使用流程(Step by Step)

Step 1:素材采集与准备

  • 使用 Screen Studio 录制屏幕、桌面或软件演示,或直接导入相机原始视频
  • 也可结合 videodb Skill 实现桌面会话录制与实时上下文采集
  • 输出为原始 mp4、mov 等格式文件

Step 2:AI 结构规划与剪辑点生成

  • 在 Claude Code/Codex 中上传视频转录文本,或直接输入“帮我剪辑这段 2 小时录屏为 10 分钟教程”
  • Skill 自动调用 AI,完成以下任务:
    • 自动转录与主题分段
    • 标记无效片段(长暂停、跑题、重复)
    • 生成剪辑决策表(Edit Decision List,含起止时间戳、保留片段说明)
    • 输出 FFmpeg 批量切段命令或 Remotion 代码 scaffold

示例 prompt:

这是 4 小时录音的转录文本,请找出最精彩的 8 个片段,生成每个片段的 FFmpeg 剪切命令,目标做成 24 分钟 vlog。

Step 3:FFmpeg 批量切段与预处理

  • Skill 自动生成并执行 FFmpeg 命令,完成:
    • 按时间戳批量切段(见下方 Bash 示例)
    • 拼接片段为粗剪成片
    • 生成低码率 proxy 文件,加速后续编辑
    • 提取音频用于后续转录或配音
    • 标准化音量、降噪、格式转换

批量切段 Bash 示例:

bash
#!/bin/bash
# cuts.txt: start,end,label
while IFS=, read -r start end label; do
  ffmpeg -i raw.mp4 -ss "$start" -to "$end" -c copy "segments/${label}.mp4"
done < cuts.txt

Step 4:Remotion 编程式合成与模板化叠加

  • Skill 自动 scaffold Remotion 组件,实现:
    • 批量叠加字幕、品牌 Logo、下三分之一、动画等
    • 多段视频拼接、可复用场景模板
    • 数据可视化、动态数字、产品演示动画
    • 复用代码模板,快速批量生成风格统一的视频

Remotion 代码片段:

typescript
import { AbsoluteFill, Sequence, Video } from "remotion";

export const VlogComposition: React.FC = () => (
  <AbsoluteFill>
    <Sequence from={0} durationInFrames={300}>
      <Video src="/segments/intro.mp4" />
    </Sequence>
    <Sequence from={30} durationInFrames={90}>
      <AbsoluteFill style={{ justifyContent: "center", alignItems: "center" }}>
        <h1 style={{ fontSize: 72, color: "white" }}>The AI Editing Stack</h1>
      </AbsoluteFill>
    </Sequence>
    <Sequence from={300} durationInFrames={450}>
      <Video src="/segments/demo.mp4" />
    </Sequence>
  </AbsoluteFill>
);

渲染命令:

bash
npx remotion render src/index.ts VlogComposition output.mp4

Step 5:智能配音、音乐、SFX 生成(ElevenLabs / fal.ai)

  • Skill 自动集成 ElevenLabs API,批量生成高质量配音
  • 调用 fal-ai-media Skill,生成背景音乐、转场音效、缺失视觉素材
  • 只生成必要资产,避免全视频 AI 生成导致不一致

ElevenLabs 配音示例:

python
import requests
resp = requests.post(
    "https://api.elevenlabs.io/v1/text-to-speech/{voice_id}",
    headers={"xi-api-key": "你的API密钥", "Content-Type": "application/json"},
    json={"text": "旁白内容", "model_id": "eleven_turbo_v2_5"}
)
with open("voiceover.mp3", "wb") as f:
    f.write(resp.content)

Step 6:最终精修与导出(Descript / CapCut)

  • Skill 输出初步成片后,推荐在 Descript、CapCut 等传统编辑器中:
    • 微调节奏、修正自动字幕
    • 基础调色、音量平衡
    • 按平台导出最佳格式

Step 7:多平台适配与热点片段提取

  • Skill 自动生成 FFmpeg/VideoDB 脚本,适配 YouTube(16:9)、TikTok(9:16)、Instagram(1:1)等比例
  • 支持 AI 场景检测、静音检测,自动提取高亮片段用于短视频分发
  • 结合 content-engine Skill,实现多平台内容分发自动化

FFmpeg 画幅适配示例:

bash
# 16:9 转 9:16
ffmpeg -i input.mp4 -vf "crop=ih*9/16:ih,scale=1080:1920" vertical.mp4

4. 输出示例

  • 自动生成的剪辑决策表(含时间戳、主题、保留原因)
  • 批量 FFmpeg 切段、拼接、格式转换脚本
  • Remotion 组件代码 scaffold
  • ElevenLabs 配音、fal.ai 音乐/视觉素材
  • 多平台适配后的视频文件
  • 高亮片段清单(适合社交媒体二次分发)

5. 常见配套 Agent 与 Skill 协作

  • fal-ai-media:自动生成缺失的音乐、SFX、B-roll 等资产
  • videodb:实现视频的服务端处理、索引、智能重构
  • content-engine:多平台内容分发与运营自动化
  • documentation-lookup:查找 FFmpeg/Remotion 等工具的最新用法
  • agentic-engineering:串联多 Agent,自动化复杂视频批量生产
  • Hooks 体系结合,可实现每次素材上传自动触发批量剪辑与分发

6. 注意事项与最佳实践

  • 结构优先,风格其次:先用 AI 规划好结构,再进入视觉和风格调整
  • FFmpeg 是骨干:所有批量切段、拼接、格式转换都建议用 FFmpeg 自动化完成
  • Remotion 适合可复用场景:如批量 vlog、教程、产品演示,建议将常用动画/模板写成组件
  • 生成只做补充:AI 生成仅用于缺失配音/音乐/插图,避免全视频生成导致风格不统一
  • 最终审美人工把关:AI 负责重复性工作,节奏、风格、质量把控仍建议人工精修

更多 ECC Agent/Skill 体系的高阶用法,推荐阅读 Everything Claude Code 完全指南:38 Agent + 156 Skill 的生产级 AI 编程插件Claude Code 快速上手指南:Skills、Hooks、Subagents、MCP 实战配置


FAQ

Q: video-editing Skill 能自动“生成”视频吗? A: 不是生成式视频,而是自动剪辑和增强真实素材。它专注于高效处理已有录制内容,而非从零生成。

Q: 支持哪些自动化环节? A: 包括自动结构规划、批量切段、拼接、字幕/配音/音乐生成、多平台适配、热点片段提取等,绝大部分可全流程自动化。

Q: 需要手动操作哪些步骤? A: 最终的节奏调整、风格把控、细节润色建议在 Descript/CapCut 等传统编辑器中人工完成,确保成品质量和个性化。