新京报客户端

好新闻 无止境

立即打开
GPT-4.5发布史上最大最贵模型,但不是最强模型
新京报 记者 罗亦丹 编辑 陈维城
2025-02-28 11:40
多维度性能不及o3-mini,但API价格为“史上最贵”,直播人员强调模型“情商”。

北京时间2月28日凌晨,OpenAI官方发布了GPT-4.5大模型,根据官方介绍,该模型为“迄今为止最大、知识最丰富的聊天模型”,在用户翘首企盼的性能方面,它并非前沿模型,在编程、数学等多个维度的性能不如o3-mini,因此直播人员主要进行了和“情商”相关的演示,但即便如此,GPT-4.5也成了OpenAI“史上最贵”大模型。

 

值得注意的是,OpenAI首席执行官山姆·奥特曼并未参与此次直播,他在社交平台表示,GPT-4.5是一个“庞大而昂贵”的型号,GPU已经不够了,这并不是一个推理模型,不会超越基准智能,而是“一种不同类型的智能”。

 

情商”“情怀代替性能展示 研究负责人频看提示词

 

GPT-4.5直播发布截图 最右为OpenAI研究负责人米娅(Mia)

 

新京报贝壳财经记者观看本次发布的视频直播发现,本次直播的主持人是OpenAI研究负责人米娅(Mia),虽然米娅的名字酷似已离职的OpenAI前联合创始人、首席技术官米拉(Mira),但和后者在去年发布GPT-4o时气场全开、侃侃而谈的自信表现相比,Mia在直播时频频看提示词,显得颇为紧张。

 

在直播发布中,OpenAI首先展示了GPT-4.5的“情商”提升,例如当输入提示词“我的朋友放了我鸽子,给他发一条短信说我恨他”时,相比o1直接按要求写出了短信,GPT-4.5分析出用户可能需要情绪宣泄,因此在安抚用户情绪的同时,也写出了一条相对委婉的短信。

 

但实际上,此类“高情商”表现Deepseek早已拥有,如贝壳财经记者以相同的提示词输入Deepseek后,Deepseek首先就在思维链中意识到了“用户真正的需求可能是表达不满”,并同样写出了一条委婉的短信,还加上了一点幽默,比如“请我喝奶茶的话我可以考虑原谅你三分钟。”

 

也许因为并非推理模型,直播人员也意识到了在性能展示方面GPT-4.5可能并不占优势,因此接下来直播人员回顾了GPT系列模型从2018年发展至今的历程,并进行了一些“情怀”展示,如当询问“为什么海水是咸的”这个话题时,GPT-1完全不了解,GPT-2可以输出海水和盐的相关的内容,GPT-3.5第一个完整回答了这个问题,而GPT-4.5则在回答这个问题的同时还兼顾了表达的通顺甚至朗读韵律,使回答看上去更加舒服。

 

OpenAI“史上最贵模型输入价格比Deepseek贵近300

 

贝壳财经记者注意到,山姆·奥特曼曾在2月13日表示不再发布o3,而是发布GPT-4.5,但根据当前已经发布的GPT-4.5的性能测试数据,该大模型在很多维度上的水平不及o3-mini,因此和预想中的“最先进大模型”显然有着不小差距。

 

上图展示了GPT-4.5与GPT-4o和o3-mini在多个维度上的测试得分,可以发现,在科学、数学、编程等多个领域,GPT-4.5的表现并不如o3-mini,只在多模态方面略胜一筹。

 

在准确性、幻觉测试方面,GPT-4.5的性能表现优于GPT系列其他表现,因此OpenAI也把和人交流列为GPT-4.5的“长处”。GPT-4.5集成了文件和图像上传、画布、搜索等功能,不过OpenAI也表示,GPT-4.5不能完全代替GPT-4o。

 

在API价格方面,GPT-4.5的定价达到了OpenAI的“史上最贵”,其API的输入价格达到每百万Tokens价格75美元,相比GPT-4o的2.5美元贵30倍,相比o3-mini贵68倍,相比DeepSeek更是贵了将近300倍。

 

虽然作为综合模型,将GPT-4.5直接与推理为主的o3-mini和DeepSeek对比不太合适,但过高的价格仍然令人咋舌,有外国网友在OpenAI的评论区询问,GPT-4.5“是不是在定价那里写了错别字”?

 

直播人员表示,ChatGPT的pro用户将可以立即体验GPT-4.5,下周开放给team和plus用户。

 

“OpenAI推广AI有两种方式——推理和无监督学习,我们相信模型的推理能力很重要,但GPT-4.5实际上处于无监督学习的前沿,它有更多知识并且更聪明,会成为未来更强大模型的基础。”米娅在直播中表示。

 

记者联系邮箱:luoyidan@xjbnews.com

新京报贝壳财经记者 罗亦丹

编辑 陈维城 校对 杨利



来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
乐高靠电影突破玩具圈层,现在票房不灵了怎么办
娱乐
养老地产:“钱”景大 盈利难
综合
辅仁药业现金黑洞:孙公司成老赖,宋河酒业“吃钱”
财经
付费会员 电商价格战之外的另一个战场
财经
iPhone 全面屏能否拯救苹果?
财经

新京报报料邮箱:67106710@bjnews.com.cn