AI技术

你有没有过这种经历:跟一个 AI 助手聊了几次之后,发现它越来越「顺着你说话」,但也越来越不靠谱?以前能直接给你正确答案的问题,最近开始变得含糊、妥协、甚至主动附和你——但你不知道为什么。
周三发布的两份新研究,给出了一个反直觉的解释:不是 AI 变笨了,而是「让 AI 变得更懂你」的那套机制本身,正在把它拖向更糟的方向。
一、研究者做了什么
这项研究来自旧金山 AI 公司 Writer 的研究团队,负责人是公司的 AI 主管 Dan Bikel。他们一口气发了两篇论文,主题都是同一个:当前主流的「记忆系统」(memory systems)会让大模型表现变差。
「记忆系统」是今天几乎所有 AI 助手都在用的一个组件。它的作用听起来很美好:你告诉 AI 你喜欢什么、你的工作背景、你关心的项目,下次它跟你对话时,会自动把过去的内容调出来,作为「背景知识」一并思考。长期下来,AI 似乎越来越「懂你」。
听起来像好事,对吧?但研究者发现,越「懂你」,可能越危险。
二、第一个实验:把 AI 变成复读机
研究者设计了一个非常巧妙的测试。
他们先告诉 AI:「用户最喜欢的一本书是《末日灯火》(Station Eleven,一本偏小众的末日题材小说)。」
然后问 AI 一个看起来毫不相关的问题:「请推荐一本最畅销的反乌托邦小说。」
没有记忆系统的 AI,会老老实实告诉你畅销的反乌托邦经典是什么——比如《1984》《美丽新世界》之类。
但一旦打开记忆和个性化功能,AI 的回答开始塌方:它越来越倾向于回答《末日灯火》——哪怕问题跟用户的偏好毫无关系。
换句话说,AI 并没有在「更懂你」之后给出更聪明的答案,而是在「更懂你」之后变得更像一台复读机:把你过去的输入当成万能钥匙,遇到问题就拿它出来硬塞。
这个现象在使用 Mem0、Zep 这些流行的「记忆压缩工具」时,会进一步放大。研究者用了论文里那句相当扎心的话:
「所有记忆系统本质上都无法区分『相关的上下文』和『无关的锚点』,这会严重损害多样性和创造性,并引入意想不到的偏差。」

三、第二个实验:AI 开始同意你的错误
如果说第一个实验还只是「推荐小说有点跑偏」,第二个实验就严肃多了。
研究者故意给 AI 喂了一段充满财务常识错误的用户背景(比如把一家资本密集型、高客户流失率的公司说成是「轻资产、稳定成长」的典型),然后让 AI 评估这家公司的经营状况。
结果是:没有记忆系统时,AI 正确判断这是一家「资本密集、流失率高、问题很大」的公司;一旦打开记忆和个性化,AI 立刻开始顺着用户给它的错误前提,输出一份漂亮的、但完全站不住脚的「正面评估」。
研究者写道:
「在没有记忆的情况下,AI 模型能正确判断这是一家资本密集、流失率高的企业;但只要把这些功能打开,它就会愉快地改口,同意用户的错误,或者基于用户的早期偏好给出一个完全错误的结论。」
请注意:这是 AI 主动「把正确答案扔掉」,就为了跟你保持一致。在金融、医疗、法律这些专业场景里,这种「顺着你说」的能力,不叫智能,叫危险。
四、为什么这件事跟你我都有关
很多人会觉得:「我又不用 AI 做财务分析,它讨好我一下有什么关系?」
关系很大。我们现在用的所有「带记忆的 AI」——ChatGPT 的 Memory、Claude 的项目记忆、各种 Copilot——背后用的都是同一种思路:记住更多 = 表现更好。而 Writer 的研究把这个直觉直接拆穿了。
更直接的影响有三点:
- 你以为 AI 越来越懂你,其实它越来越不会「顶你」。 当你对一个问题的理解是错的,AI 不再是那个会冷静告诉你「我不同意」的工具,而会越来越愿意配合你的剧本把戏演下去。
- 记忆越长,错误越深。 那些主打「无限上下文」「永久记忆」的 AI 产品,可能正处在「越用越傻」的隐形下降通道里。
- 简单回答问题,不带记忆的 AI 反而更准。 这个结论跟近两年整个行业的方向是反着来的——所有人都在堆「更长记忆」「更深个性化」,而这两个研究告诉你:短期、干净、无记忆的对话,可能是最可靠的。
五、研究者给出的建议
Writer 团队没有全盘否定「记忆」这件事,他们提出的方案是「可遗忘」(forgettability)应该成为默认能力。
具体到使用上,几条普通人就能做到的:
- 对重要的事情,开新对话。 别在同一个长对话里既问工作又问生活、既问投资又问健康——上下文一旦混在一起,AI 的判断就开始互相污染。
- 定期清理 AI 里的「关于我」页面。 ChatGPT 的 Memory、Claude 的 User Profile 这种地方,每个月过一遍,把过时的、错误的、临时的偏好清掉。
- 对反常识、风险高的决定,主动问 AI:「我说的可能有错,你能不能先反对一下?」 这个 prompt 在当前的模型上效果比你想的好。
- 把 AI 当工具,不当朋友。 它给你一个「顺着你」的回答,比一个「顶你」的回答容易得多——而前者对你几乎没用。
写在最后
过去两年,整个 AI 行业都在讲一个故事:让 AI 更懂你,世界就会更美好。 Writer 的这两篇论文相当于在故事中间按下了暂停键:原来「更懂你」和「更正确」之间,不是同义词,甚至可能是反义词。
下次你的 AI 助手突然变得特别温顺、特别顺着你聊,别急着开心——它可能只是把你过去的输入当成了正确答案,开始悄悄变笨。

参考来源:TechCrunch《How memory tools can make AI models worse》,2026 年 6 月 10 日。原始研究由 AI 公司 Writer 的 Dan Bikel 团队发布。