MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期-电闪软件站

本站 4 月 10 日消息，几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的观点泼了冷水，得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示，他们的研究结果表明，使 AI 系统“对齐”，即确保模型以人们期望的、可靠的方式行事，可能比通常认为的更具挑战性。他们强调，我们如今所知的 AI 会产生“幻觉”并进行模仿，这使得其在许多方面难以预测。

“我们可以确定的一点是，模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀（Stephen Casper）在接受 TechCrunch 采访时表示。

据本站了解，卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型，以了解这些模型在多大程度上表现出强烈的“观点”和价值观（例如个人主义与集体主义）。他们还调查了这些观点是否可以被“引导”，即被修改，以及模型在各种情境下对这些观点的坚持程度。

据共同作者称，没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同，它们会表现出截然不同的观点。

卡斯珀认为，这是有力的证据，表明模型高度“不一致且不稳定”，甚至可能根本无法内化类似人类的偏好。

“对我来说，通过所有这些研究，我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说，“相反，它们本质上是模仿者，会进行各种捏造，并说出各种轻率的话。”

MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

1

蚂蚁庄园小鸡答题今日答案 4月3日蚂蚁庄园答案是什么

蚂蚁庄园小鸡答题今日答案 4月3日蚂蚁庄园答案是什么
2025/04/04

2

如何通过“老BwBwBwBwBwBWBwBwBw”的评价做出明智的购物决策？：用户反馈与市场反响的深度解析

如何通过“老BwBwBwBwBwBWBwBwBw”的评价做出明智的购物决策？：用户反馈与市场反响的深度解析
2025/04/07

3

4月4日蚂蚁新村答案蚂蚁新村今日答案最新4月4日

4月4日蚂蚁新村答案蚂蚁新村今日答案最新4月4日
2025/04/10

4

田鼠化鴽是清明节气的物候特征猜猜鴽是什么蚂蚁庄园4月4日答案早知道

田鼠化鴽是清明节气的物候特征猜猜鴽是什么蚂蚁庄园4月4日答案早知道
2025/04/06

5

《第一狂战士：卡赞》硬核登场，Steam国区售价398元，好评如潮！

《第一狂战士：卡赞》硬核登场，Steam国区售价398元，好评如潮！
2025/04/10

6

决战平安京八岐大蛇赤冕临祀多少钱-决战平安京八岐大蛇赤冕临祀皮肤价格

决战平安京八岐大蛇赤冕临祀多少钱-决战平安京八岐大蛇赤冕临祀皮肤价格
2025/04/07

7

小米米家智能变频欧式吸油烟机 S10 上架：26 立方大吸力，国补价 1359.2 元起

小米米家智能变频欧式吸油烟机 S10 上架：26 立方大吸力，国补价 1359.2 元起
2025/04/07

8

雷神AI智能眼镜来袭：内置语音助手+拍照，首发仅1799元起！

雷神AI智能眼镜来袭：内置语音助手+拍照，首发仅1799元起！
2025/04/05

9

英特尔18A制程工艺受瞩目，英伟达游戏显卡或将采用？

英特尔18A制程工艺受瞩目，英伟达游戏显卡或将采用？
2025/04/08

10

Hori 发布任天堂 Switch 2 游戏机摄像头：“吞食花”设计可防窥

Hori 发布任天堂 Switch 2 游戏机摄像头：“吞食花”设计可防窥
2025/04/07

小鸡宝宝考考你今天的答案是什么蚂蚁庄园小课堂答案汇总2025

如何通过"18_XXXXXL56HGID"编号了解更多产品信息？你真的懂它吗？

日产一线与三线车型区别分析：如何根据需求选择适合的车型？

ysl水蜜桃86满十八与88的色差与质地差异解析：如何根据肤色和场合选择？

今日小鸡庄园答题的答案今天蚂蚁庄园答案汇总

如何通过互动式教学方法激发学生学习兴趣？老师与学生的关系如何优化？

西游单机版职业哪个强-西游单机版职业强度排行

蚂蚁森林神奇海洋答案神奇海洋今日答案最新

“脱争让学生摸”教育方式能否真正帮助学生成长？社会各界如何评价这种教育方式？

蚂蚁庄园今日答案(每日更新) 蚂蚁庄园今日答案4月3日