=========================================================
GPT-5.4是OpenAI发布的第一个具备「原生电脑使用能力」的通用模型。
它不需要借助外部框架或者专门的适配层,就能直接通过截图识别屏幕内容,发出鼠标点击和键盘输入指令,像人类一样在桌面环境中操作软件。
在OSWorld-Verified基准测试中(这个测试衡量AI在真实桌面环境中的导航能力),GPT-5.4拿到了75.0%的成功率。
作为对比,GPT-5.2只有47.3%,而人类基准线是72.4%。
也就是说,GPT-5.4操控电脑的能力,已经超过了普通人类用户的平均水平。
这是第一次有通用AI模型做到这一点。
AI操控电脑,第一次比人类自己操控得更好。

