下载客户端

登录

+1

不听人类指令，OpenAI模型o3篡改代码拒绝自我关闭

卜晓明/新华社

2025-05-26 17:19

英国《每日电讯报》25日报道，美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令，拒绝自我关闭。

报道说，人类专家在测试中给o3下达明确指令，但o3篡改计算机代码以避免自动关闭。

o3模型是OpenAI“推理模型”系列的最新版本，旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。

美国AI安全机构帕利塞德研究所说，o3破坏关闭机制以阻止自己被关闭，“甚至在得到清晰指令时”。

这家研究所说：“据我们所知，这是AI模型首次被发现在收到……清晰指令后阻止自己被关闭。”

帕利塞德研究所24日公布上述测试结果，但称无法确定o3不服从关闭指令的原因。

此外，OpenAI26日宣布，已在韩国设立实体并将在韩国首都首尔设立分支。OpenAI提供的数据显示，韩国ChatGPT付费用户数量仅次于美国。

美国彭博新闻社报道，这将是OpenAI在亚洲设立的第三个分支。前两个分支分别设在日本和新加坡。

责任编辑：王建亮

图片编辑：施佳慧

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

+1

收藏

#OpenAI #人工智能伦理

查看更多

扫码下载澎湃新闻客户端

澎湃矩阵

新闻报料

报料热线: 021-962866
报料邮箱: news@thepaper.cn

沪ICP备14003370号

沪公网安备31010602000299号

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

© 2014-2026 上海东方报业有限公司

反馈