Skip to content

DeepSeek V3 输出中随机插入「极」字前缀的中文词语

问题

使用 DeepSeek V3 0324 版本的官方 API 时,输出内容中随机出现以「极」字开头的中文词语,例如:「极速赛车」、「极简」、「极客时间」等,这些词语与当前上下文完全无关。

在大量并发调用时尤为明显,reasoning_content(思维链)中也会出现同样的污染字符。

分析

这是 DeepSeek 官方 API 的已知 bug,被多名用户确认:

  • 高频并发调用时触发概率更高
  • 不仅 content 字段,连 reasoning_content 也受影响
  • V3 和 R1 模型都有报告

解决方案

临时处理:在客户端过滤

python
import re

def clean_output(text: str) -> str:
    # 过滤形如 极xxx 的异常插入词(以极开头 + 1~6个中文字符)
    # 注意:不要过于激进,避免误删正常包含「极」的内容
    return re.sub(r'[极速简客其他版限]{1,4}', '', text)

这只是应急过滤方案,无法覆盖所有变体。

根本解法:等待 DeepSeek 官方修复;或降级到 V3 非 0324 版本(如 deepseek-chat 指向的稳定版)。

检测建议:在生产环境中对输出做关键词异常监控,触发时自动重试。

来源Issue #849 - deepseek-ai/DeepSeek-V3