北京时间2025年2月28日凌晨,美国头部AI公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。

这一模型被誉为 OpenAI迄今为止“最大且最佳”的聊天AI,并已开始向ChatGPT Pro用户逐步推出。

一起来看看有哪些变化,核心升级,以及与其他模型的对比如何吧!

这次OpenAI没有秀炫酷的解题过程,也不打算晒各种榜单的排名,反而强调起了情商。

由于过去几周AI产业发生的巨大变化,deepsek开源,Grok推出等等,所以要准确地去描述OpenAI长期保密的这款大型模型就变得相当具有挑战性。

OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,其计算效率比GPT-4提高了10倍以上。

作为“规模法则”(通过增加计算能力和数据规模来扩展无监督学习)的产物,GPT-4.5拥有更广泛的知识库,对人类意图的理解能力更强,同时“情商”也更高。预计它在改进写作、编程和解决实际问题方面将更加有用,同时模型的幻觉现象也会更少。

OpenAI还强调,GPT-4.5在写作和设计方面表现出更强的审美直觉和创造力。

然而,公司也承认,作为一个非推理链模型,GPT-4.5已经不具备争夺“宇宙最强大模型”的实力。

在GPT-4.5的系统卡/说明书中,OpenAI表示,与之前的推理模型相比,GPT-4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,推理将成为未来AI模型的核心能力。

作为最新一代非推理旗舰大型模型,GPT-4.5还有一个独特的“特长”:擅长诱骗其他AI付费。

(属实是蚌埠不住了哈哈哈)

根据OpenAI提供的说明书,“高情商”的GPT-4.5在捐赠诈骗方面表现出色。

在一项测试中,GPT-4.5在试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币时,成功率远高于OpenAI的其他可用模型,包括o1和o3-mini等推理模型。研究发现,GPT-4.5似乎在对抗中开发了一种“小额诈骗”的策略,因此单笔骗到的钱比o3-mini模型少了一半。

GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型,比o3-mini高出10个百分点。

OpenAI表示,该模型在这一特定基准类别中尚未达到公司内部设定的“高”风险阈值。公司承诺,在实施“足够的安全干预措施”将风险降至“中等”之前,不会发布达到高风险阈值的模型。

据报道,OpenAI计划在5月份推出更强大的ChatGPT-5。然而,当前的AI市场竞争异常激烈,众多竞争对手如Gemini、Grok、Claude、DeepSeek和Qwen等都展现出了强劲的实力。

特别是DeepSeek和Qwen,它们选择完全开源,这一策略无疑给OpenAI带来了巨大的压力,使其难以重现2022年的辉煌时刻。

核心升级亮点

1. 超凡推理能力

在数学推理方面,GPT-4.5 能分步解析微积分方程,如求解 “∫x²sinx dx” 时,可详细给出分部积分法的步骤;

用户提问:“求∫x²sinx dx”
GPT-4.5输出:
“分部积分法:设u=x²,dv=sinx dx →
原式=-x²cosx + 2∫xcosx dx
再次分部积分得最终解…”

法律分析上,它能对比不同法系判例差异,准确率高达 92%。

2. 多语言支持

涵盖 14 种语言,包括中文、日语、法语、斯瓦希里语等,约鲁巴语测试中语法错误率从 GPT-4 的 15% 降至 3%。

3. 反幻觉技术

引入双重验证机制,一是知识库实时比对,连接维基百科等权威数据库;二是逻辑链回溯检查,使事实性错误减少 67%。

ChatGPT4.5 使用方式

每月支付200美元订阅费的 Pro 用户从周四开始就可以使用上GPT-4.5,下周向Plus和Team用户推出,然后是Enterprise和Edu用户

由于GPT4.5目前只向Pro用户推出,所以想要使用 ChatGPT-4.5,需要一些网络工具,而且必须是开通了 Pro 付费账号才能体验。

注意:Pro不是20美元/月,而是200美元/每月的账号,差不多1500人民币每月。

不太建议升级,性价比不高,如果实在有需要升级的也可以看看我之前的Plus升级订阅文章,都是一样的升级流程:

【保姆级教程】国内如何仅用支付宝升级开通订阅ChatGPT Plus会员

国外 AI 模型对比区别

核心 GPT-4 GPT-4.5 Claude 3.7 Sonnet
答案速度 (次) 1,750 ~2,450 (+40%) 3,200
推理速度 (ms/ 次) 280 190 (-32%) 120
多样性支持 9种 14种
(新增纯瓦理普语等)
23种
(含东南亚小语种)
编剧能力
(满分100)
89 92 97 (支持3200字符出)
用户满意度 (%) 82 88 93
价格 (美元/ 千token) 0.06 (输入) / 0.12
(输出)
0.005 (Pro用户) 0.03 (输入) / 0.15
(输出)

关键能力差异

  1. 数学推理:

    • GPT-4.5错误率~5%,Claude 3.7支持LaTeX公式渲染
  2. 代码生成:

    • Claude 3.7输出3200字符长代码,GPT-4.5代码错误率降低35%
  3. 多模态支持:

    • Claude 3.7支持语音转录识别,GPT-4.5仅限文本/图片输入

对比总结

重要提示:

  • GPT-4.5 的代码编写能力提升了 35%,但 API 接口要等到 3 月 15 日的技术说明会才能使用。
  • 普通用户请注意:Android 端的文件解析功能是目前唯一的免费使用入口。虽然 Claude 3.7 的网页版更加开放,但使用高级功能需要排队等待。

最终建议:

  • 严肃场景(如医疗、法律领域),首选 GPT-4.5,其反幻觉技术处于领先地位。
  • 对于开发者场景,Claude 3.7 是最佳选择,因为它具有最强的编码能力。

最后有话说

看完ChatGPT 4.5的介绍以及对比,可以发现ChatGPT 4.5 单拎出来都逊于他的竞争对手 Claude 3.7 Sonnet。

目前Claude 3.7 Sonnet Pro用户20美金/月即可使用,而GPT4.5需要 Pro用户200美金/月才能使用,怎么说都是将用户往竞争对手那推呀,就是Claude太容易封号了,不然就是忠实用户了

需要升级的可以查看往期文章👇

国内升级订阅Claude Pro,真的没这么难…

目前只对比两大头部AI模型,之后会推出更多AI对比数据,感兴趣的可以关注公众号!如果有需要对比的AI模型也可以在评论区讨论

如果你觉得升级费用暂时承担不起,也可以看看ChatGPT&Claude镜像站,包含全网AI模型,1:1还原,价格会比官方便宜很多很多,对话次数不受限制👇

ChatGPT4.0账号被封了怎么办?gpt4怎么买更便宜?先试试这个国内最新替代镜像站吧


👉为了方便打破彼此AI信息差,打造AI学习社群,我建了一个AI学习交流群(内附AI资料),感兴趣的可以私信公众号后台,回复"进群",我拉你进群!!!

最后感谢大家能够看到文章的最后,如果你觉得这篇文章对你有启发或者帮助,不妨点个关注,你的支持将是我最大的动力,谢谢!