Skip to content

利用 AI 精确创建、编辑与分析 Word (.docx) 文档

解决 AI 生成文档格式不统一、难以精准修改局部内容的痛点:通过 docx-js 库构建结构化文档,并利用 XML 解包技术实现对 Word 修订记录(Tracked Changes)和评论的底层控制。

为什么需要这个技能

传统的 AI 生成 Word 文档往往只能提供纯文本或简单的 Markdown 转换,无法满足专业办公场景对格式的苛刻要求。例如,目录(TOC)的层级、精准的页边距、复杂的表格宽度控制以及企业级报告中必需的“修订模式”。

本技能通过将 .docx 文件视为 ZIP 压缩的 XML 集合,允许 AI 在底层进行“手术级”的编辑,确保生成的文档在任何 Word 软件中都能完美渲染,且支持标准的协作修订流程。

适用场景

  • 专业报告生成:需要包含页码、页眉页脚、标准 A4/US Letter 纸张尺寸和多级目录的正式文档。
  • 精密文档修改:在现有 Word 模板中替换特定文字,且必须保留原有的复杂格式。
  • 自动化协作评审:AI 自动在文档中插入修订记录(删除/插入)和评审评论。
  • 格式转换与分析:将旧版 .doc 转换为 .docx,或将 Word 内容高效提取为 Markdown。

核心工作流

1. 创建新文档(基于 docx-js

AI 使用 JavaScript 库构建文档对象,重点关注以下关键点以避免渲染失效:

  • 显式定义纸张:默认 A4 并不总是适用,需根据需求定义 DXA 单位(1440 DXA = 1 inch)。
  • 表格双重宽度:必须同时设置 columnWidths 数组和每个单元格的 width,否则在 Google Docs 等平台会变形。
  • 禁止 Unicode 符号:列表项必须使用 LevelFormat.BULLET 配置,而非直接输入 字符。

2. 编辑现有文档(XML 三步法)

对于需要修改的现有文件,遵循 Unpack Edit Pack 流程:

  • 解包 (Unpack):使用脚本将 .docx 拆解为 XML 文件夹。
  • 底层编辑 (Edit):直接修改 word/document.xml。在处理修订时,使用 <w:ins>(插入)和 <w:del>(删除)标签,并指定 w:author="Claude"
  • 回装 (Pack):将 XML 重新打包并进行自动修复(Auto-repair),确保 schema 合规。

3. 格式转换与提取

  • 文本提取:通过 pandoc 提取包含修订记录的纯文本。
  • PDF/图像转换:利用 LibreOffice (soffice) 将最终文档转换为 PDF 或 JPEG 预览图。

下载和安装

下载 docx 中文版 Skill ZIP

解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md

你可能还需要

暂无推荐