专栏名称: 极客公园
科技创新者的大本营。汇聚优秀的产品报道、评测视频和高质量的线下活动。
目录
相关文章推荐
新浪科技  ·  #王自如下周或恢复更新# ... ·  2 天前  
51好读  ›  专栏  ›  极客公园

Altman 「喜当爹」,OpenAI 连夜发的 GPT-4.5 都「更有人味」了

极客公园  · 公众号  · 科技媒体  · 2025-02-28 08:11

正文

请到「今天看啥」查看全文


OpenAI 在演示中展示了这张图,可以看出,GPT-4.5 在简单回答上的准确度,是一系列模型中最高的。同时在简单回答中,幻觉率是最低的。

和上一代基础模型 GPT-4o 比较起来,在简单的问答,专业的问答和创造力的智能表现中都有一定提升。

不过模型最大的亮点,还是在于其回答更「人性化」。

Sam Altman 在 X 上表示,「 这是第一个模型,真的让我感觉像是在和一个有思想的人交谈。 我好几次坐在椅子上,惊讶地意识到,原来人工智能真的能给我很好的建议。

OpenAI 的 Mia Glaese 对此进行解释:

•推理教会模型在回答之前先进行思考,这在需要推理的任务中尤其有用,比如科学、数学以及其他复杂问题。

• 而无监督学习则有助于模型提升词汇模型的准确性和直觉性。

换言之, 无监督的预训练,主要能够提升模型的感性能力。

OpenAI 也在演示中给出了一个很微妙的演示。在提问为什么海是咸的问题中,GPT-4T 给出的答案是这样的。

海是咸的,因为它含有地球岩石中的矿物质。随后解释了这些矿物质是怎么被溶解,流入海里的。

而 GPT-4.5 给出的答案,虽然本质上仍然是一样的,但是更有一种语言的韵律感。

先来了一个头韵单押「rain,rivers,and rocks. 海是咸的是因为雨水、河流和岩石!

接下来的讲解也更简单。除去了一些大词和长难句,用更容易理解的方式对这个过程进行了讲解。比如在最后一个阶段,4T 的用词是 accumulation,累积。这是一个中高级词汇,GPT 提示我这是一个雅思 (IELTS)6.5 - 8.0 分水平需要掌握的词汇。而 GPT-4.5 选择使用了「salts build up」,盐堆积了起来,更形象,也更简单。

可以想象,更形象,更简单的用词,对于教育、情感交流、营销、创意写作方面,都是一个更好的选择。

之前 DeepSeek 一个出圈的点,正是在于其文笔好。对于很多普通用户而言,专业推理并不一定经常使用,但是文笔好,却是一个虽然不太能很好地量化,但是非常直观且重要的点。

在 X 上,一些提前试用的用户,也称赞了 GPT-4.5 的文笔。

@benhylak 表示,这是第一个很能写的模型,是写作的 Midjourney 时刻,并贴出了在要求 GPT 写作一篇恐怖且反转的故事时,GPT-4o 和 GPT-4.5 的对比。

GPT-4.5 的文章:

深夜,我独自一人在破烂的公寓里,听到冰箱底下传来轻柔、湿润的低语声,它们承诺要爬进我的身体,把我掏空,再穿上我当睡衣。

我吓坏了,猛地拉开冰箱门,以为会看到老鼠或蟑螂,却只看见被冰霜覆盖、陈年未动的披萨卷,满是冰渣和悔意。

突然,那些披萨卷动了起来,裂开一道缝隙,露出针状的利齿,齐声低语着:「我们等了你很多年,混蛋。」

我还没来得及尖叫,它们就从冰箱里喷涌而出,如油腻的虫群一般钻入我的皮肤,让我猛然意识到——该死的,我午夜的馋瘾终于报复回来了。

GPT-4o 的版本:

深夜,Jake 在阁楼里偶然发现了一本陈旧且布满灰尘的书,书页中低语着超自然恐怖的秘密。







请到「今天看啥」查看全文