Everything Claude Code PyTorch Patterns Skill 是专为深度学习开发者打造的 PyTorch 生产级范式库，聚焦训练 Pipeline、模型架构、DataLoader、可复现性与性能优化等高价值场景。通过一键激活，Skill 能让 Claude Code、Cursor 等 AI 编程助手生成、审查和重构代码时自动遵循最佳实践，显著提升模型训练效率、代码健壮性和复现实验能力，适用于新项目起步、代码审查、性能调优等全周期开发流程。

Everything Claude Code PyTorch Patterns Skill：深度学习训练 Pipeline、模型架构与 DataLoader 最佳实践

在深度学习项目中，PyTorch 虽然灵活强大，但实际开发中常见诸如设备兼容性、实验不可复现、数据加载瓶颈、模型结构混乱等问题。Everything Claude Code PyTorch Patterns Skill 正是为了解决这些“隐性踩坑”而设计：它为 Claude Code、Codex、Cursor 等 AI 编程助手注入一套经过生产验证的 PyTorch 最佳实践，无论是新建模型、编写训练循环、配置 DataLoader 还是做性能优化，Skill 都能让 AI 自动生成高质量、健壮且高效的代码结构。

本指南将详细介绍该 Skill 的应用场景、触发条件、完整的使用流程、实际输出示例，以及与常见 Agent、其他 Skill 的协作方式，帮助你在实际项目中系统性用好 PyTorch Patterns Skill。

1. 适用场景与激活时机

PyTorch Patterns Skill 适用于以下典型场景：

新建模型/训练脚本：希望生成符合生产标准的训练代码和模型架构。
代码审查/重构：让 AI 自动识别并修正反模式（如硬编码设备、无 seed 控制、数据加载低效等）。
训练调优/性能排查：需要自动建议 GPU/CPU 兼容、混合精度、梯度检查点等优化手段。
实验可复现性保障：一键插入完整随机种子与 cudnn 配置，确保结果可复现。
数据管道/自定义 Dataset/Loader：自动生成类型标注、批量处理、并行加载等高效范式。

Skill 可在 Claude Code 的「代码生成」「代码审查」「训练脚本重构」等场景下自动激活，也可通过 Agent/Skill 手动调用。

2. 使用流程 Step by Step

Step 1：激活 Skill（自动/手动）

自动激活：当你在 Claude Code/Cursor 等 AI 编程助手中输入“请帮我写一个 PyTorch 图像分类训练脚本”或“优化下这个训练循环”等需求时，Skill 会自动介入，确保输出遵循最佳实践。
手动指定：在 Skill 面板或 Agent 配置中勾选 pytorch-patterns，或通过命令行参数指定。

Step 2：生成/审查训练 Pipeline

设备无关：Skill 会自动插入如下设备选择与模型迁移代码，避免硬编码 GPU/CPU：

python

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = MyModel().to(device)
data = data.to(device)

可复现性保障：自动补全完整随机种子设置，确保每次实验一致：

python

def set_seed(seed: int = 42) -> None:
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

训练/验证循环标准化：Skill 输出的训练循环包含梯度裁剪、混合精度、模式切换、损失统计等完整流程：

python

def train_one_epoch(model, dataloader, optimizer, criterion, device, scaler=None):
    model.train()
    total_loss = 0.0

    for data, target in dataloader:
        data, target = data.to(device), target.to(device)
        optimizer.zero_grad(set_to_none=True)
        with torch.amp.autocast("cuda", enabled=scaler is not None):
            output = model(data)
            loss = criterion(output, target)
        if scaler:
            scaler.scale(loss).backward()
            scaler.unscale_(optimizer)
            torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
            scaler.step(optimizer)
            scaler.update()
        else:
            loss.backward()
            torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
            optimizer.step()
        total_loss += loss.item()
    return total_loss / len(dataloader)

验证循环自动加 @torch.no_grad，避免忘记关闭梯度、提升推理效率。

Step 3：模型架构与权重初始化

结构清晰：Skill 会建议将特征提取、分类器等拆分为子模块，forward 注释张量 shape，便于维护。

权重初始化：自动补全 Kaiming/He 初始化、BatchNorm 权重归一化等惯用写法。

python

def _init_weights(self, module: nn.Module) -> None:
    if isinstance(module, nn.Linear):
        nn.init.kaiming_normal_(module.weight, mode="fan_out", nonlinearity="relu")
        if module.bias is not None:
            nn.init.zeros_(module.bias)
    # ... 其他类型
model.apply(model._init_weights)

Step 4：数据加载与 Dataset/Loader 配置

自定义 Dataset：Skill 会为 getitem、len 自动加类型注解，支持 transform 传参，提升类型安全和 IDE 体验。
高效 DataLoader：自动建议 num_workers>0、pin_memory=True、persistent_workers=True、drop_last=True 等参数组合，提升加载效率并兼容 BatchNorm。

变长数据 Collate：Skill 能自动生成 padding 逻辑，适配 NLP/语音等变长输入场景。

python

def collate_fn(batch):
    sequences, labels = zip(*batch)
    padded = nn.utils.rnn.pad_sequence(sequences, batch_first=True, padding_value=0)
    return padded, torch.tensor(labels)
dataloader = DataLoader(dataset, batch_size=32, collate_fn=collate_fn)

Step 5：性能优化与实验管理

混合精度训练：Skill 自动插入 torch.amp.autocast、GradScaler 相关代码，提升训练速度、降低显存占用。
梯度检查点：建议大模型分块 checkpoint，节省内存。
torch.compile：对 PyTorch 2.0+，Skill 会自动加速模型推理/训练。

Checkpoint 保存/恢复：Skill 生成的保存/加载函数会完整保存 epoch、optimizer、loss 等状态，支持断点续训。

python

def save_checkpoint(model, optimizer, epoch, loss, path):
    torch.save({
        "epoch": epoch,
        "model_state_dict": model.state_dict(),
        "optimizer_state_dict": optimizer.state_dict(),
        "loss": loss,
    }, path)

3. 输出示例

示例 1：一键生成标准训练 Pipeline

python

set_seed(42)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = MyModel().to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=1e-3)
scaler = torch.amp.GradScaler("cuda")
for epoch in range(10):
    train_loss = train_one_epoch(model, train_loader, optimizer, criterion, device, scaler)
    val_loss, val_acc = evaluate(model, val_loader, criterion, device)
    save_checkpoint(model, optimizer, epoch, train_loss, f"ckpt_{epoch}.pt")

示例 2：自动优化 DataLoader 配置

python

dataloader = DataLoader(
    dataset,
    batch_size=32,
    shuffle=True,
    num_workers=4,
    pin_memory=True,
    persistent_workers=True,
    drop_last=True,
)

示例 3：反模式自动修正

检查出硬编码 .cuda()、未设置随机种子、未调用 model.eval() 等问题，自动建议并修正。

4. 常见配套 Agent 与 Skill 协作

与 PyTorch Build Resolver Agent 协作：自动修复 CUDA/shape/DataLoader 相关报错时，优先采用本 Skill 推荐的模式。
与 Python Reviewer Agent 协作：在代码审查阶段，检测反模式并建议符合 Skill 的重构方案。
与 AI Regression Testing Skill 配合：保障训练代码变更后行为一致性。
与 Agent Harness Construction Skill 协作：用于 Agent 自动生成/优化 PyTorch 相关 action space 时，确保代码符合最佳实践。

更多 Skill 体系协作与自动化集成，可参考 Everything Claude Code 完全指南和 Hooks 实战。

FAQ

Q: Skill 能自动检测并修正已有 PyTorch 代码中的反模式吗？
A: 可以。Skill 在代码审查、重构或报错修复场景下，能自动识别硬编码设备、无 seed、低效 DataLoader、梯度断链等反模式并建议修正。

Q: 如何与自定义 Dataset、复杂数据管道结合？
A: Skill 支持自动生成带类型标注的 Dataset、定制 collate_fn 及高效 DataLoader 配置，适配图像、NLP、音频等多种数据场景。

Q: 对 PyTorch 2.0+ 新特性如 torch.compile、AMP 支持如何？
A: Skill 已内置 torch.compile、torch.amp.autocast、GradScaler 等最新用法，生成代码时会根据环境自动推荐最优配置。

Everything Claude Code PyTorch Patterns Skill：深度学习训练 Pipeline、模型架构与 DataLoader 最佳实践 ​

1. 适用场景与激活时机 ​

2. 使用流程 Step by Step ​

Step 1：激活 Skill（自动/手动） ​

Step 2：生成/审查训练 Pipeline ​

Step 3：模型架构与权重初始化 ​

Step 4：数据加载与 Dataset/Loader 配置 ​

Step 5：性能优化与实验管理 ​

3. 输出示例 ​

4. 常见配套 Agent 与 Skill 协作 ​

FAQ ​

Everything Claude Code PyTorch Patterns Skill：深度学习训练 Pipeline、模型架构与 DataLoader 最佳实践

1. 适用场景与激活时机

2. 使用流程 Step by Step

Step 1：激活 Skill（自动/手动）

Step 2：生成/审查训练 Pipeline

Step 3：模型架构与权重初始化

Step 4：数据加载与 Dataset/Loader 配置

Step 5：性能优化与实验管理

3. 输出示例

4. 常见配套 Agent 与 Skill 协作

FAQ