事情是这样的,端午期间我用 Codex ( gpt 5.5 ) vibe 一个小工具,遇到一个 bug 尝试让 AI 修复了四五次都无法正确修复,然后有群友让我试试 pua 一下,我就用甜甜的语气和 GPT 对话,并且踩一脚 Claude ,骗它说是 Claude 修复了好几次没修好,结果一轮就把 bug 修复了。 然后好奇的问了下 Chrome 上面的 gemini ,它是这样回复的,倒反天罡,把我雷的外焦里嫩: 之前还听说 Github 上有一套 Skill 就是专门用来 pua Agents 的 🤣 语气, AI, bug
Anthropic 反而在论文里强调,这些情绪向量大多是局部的、当前任务相关的表征,它们会随着上下文变化而快速切换,并不等于模型有一个稳定延续的心境,更不等于它形成了独立于训练目标之外的长期意志。 现在更值得担心的,不是 AI 突然“觉醒”成某种人格,而是它在高压、冲突、受限资源或目标不可达的场景下,会因为这些功能性情绪,而开始胡说八道,偏离原有答案。