Appearance
利用 AI 精确创建、编辑与分析 Word (.docx) 文档
解决 AI 生成文档格式不统一、难以精准修改局部内容的痛点:通过 docx-js 库构建结构化文档,并利用 XML 解包技术实现对 Word 修订记录(Tracked Changes)和评论的底层控制。
为什么需要这个技能
传统的 AI 生成 Word 文档往往只能提供纯文本或简单的 Markdown 转换,无法满足专业办公场景对格式的苛刻要求。例如,目录(TOC)的层级、精准的页边距、复杂的表格宽度控制以及企业级报告中必需的“修订模式”。
本技能通过将 .docx 文件视为 ZIP 压缩的 XML 集合,允许 AI 在底层进行“手术级”的编辑,确保生成的文档在任何 Word 软件中都能完美渲染,且支持标准的协作修订流程。
适用场景
- 专业报告生成:需要包含页码、页眉页脚、标准 A4/US Letter 纸张尺寸和多级目录的正式文档。
- 精密文档修改:在现有 Word 模板中替换特定文字,且必须保留原有的复杂格式。
- 自动化协作评审:AI 自动在文档中插入修订记录(删除/插入)和评审评论。
- 格式转换与分析:将旧版
.doc转换为.docx,或将 Word 内容高效提取为 Markdown。
核心工作流
1. 创建新文档(基于 docx-js)
AI 使用 JavaScript 库构建文档对象,重点关注以下关键点以避免渲染失效:
- 显式定义纸张:默认 A4 并不总是适用,需根据需求定义 DXA 单位(1440 DXA = 1 inch)。
- 表格双重宽度:必须同时设置
columnWidths数组和每个单元格的width,否则在 Google Docs 等平台会变形。 - 禁止 Unicode 符号:列表项必须使用
LevelFormat.BULLET配置,而非直接输入•字符。
2. 编辑现有文档(XML 三步法)
对于需要修改的现有文件,遵循 Unpack Edit Pack 流程:
- 解包 (Unpack):使用脚本将
.docx拆解为 XML 文件夹。 - 底层编辑 (Edit):直接修改
word/document.xml。在处理修订时,使用<w:ins>(插入)和<w:del>(删除)标签,并指定w:author="Claude"。 - 回装 (Pack):将 XML 重新打包并进行自动修复(Auto-repair),确保 schema 合规。
3. 格式转换与提取
- 文本提取:通过
pandoc提取包含修订记录的纯文本。 - PDF/图像转换:利用 LibreOffice (soffice) 将最终文档转换为 PDF 或 JPEG 预览图。
下载和安装
解压后将目录放入你的 AI 工具 skills 文件夹,重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。
你可能还需要
暂无推荐