Appearance
DeepSeek V3 输出中随机插入「极」字前缀的中文词语
问题
使用 DeepSeek V3 0324 版本的官方 API 时,输出内容中随机出现以「极」字开头的中文词语,例如:「极速赛车」、「极简」、「极客时间」等,这些词语与当前上下文完全无关。
在大量并发调用时尤为明显,reasoning_content(思维链)中也会出现同样的污染字符。
分析
这是 DeepSeek 官方 API 的已知 bug,被多名用户确认:
- 高频并发调用时触发概率更高
- 不仅
content字段,连reasoning_content也受影响 - V3 和 R1 模型都有报告
解决方案
临时处理:在客户端过滤
python
import re
def clean_output(text: str) -> str:
# 过滤形如 极xxx 的异常插入词(以极开头 + 1~6个中文字符)
# 注意:不要过于激进,避免误删正常包含「极」的内容
return re.sub(r'极[极速简客其他版限]{1,4}', '', text)这只是应急过滤方案,无法覆盖所有变体。
根本解法:等待 DeepSeek 官方修复;或降级到 V3 非 0324 版本(如 deepseek-chat 指向的稳定版)。
检测建议:在生产环境中对输出做关键词异常监控,触发时自动重试。