Altman 「喜当爹」，OpenAI 连夜发的 GPT-4.5 都「更有人味」了

极客公园 · 公众号 · 科技媒体 · 2025-02-28 08:11

正文

请到「今天看啥」查看全文

OpenAI 在演示中展示了这张图，可以看出，GPT-4.5 在简单回答上的准确度，是一系列模型中最高的。同时在简单回答中，幻觉率是最低的。

和上一代基础模型 GPT-4o 比较起来，在简单的问答，专业的问答和创造力的智能表现中都有一定提升。

不过模型最大的亮点，还是在于其回答更「人性化」。

Sam Altman 在 X 上表示，「 这是第一个模型，真的让我感觉像是在和一个有思想的人交谈。 我好几次坐在椅子上，惊讶地意识到，原来人工智能真的能给我很好的建议。」

OpenAI 的 Mia Glaese 对此进行解释：

•推理教会模型在回答之前先进行思考，这在需要推理的任务中尤其有用，比如科学、数学以及其他复杂问题。

• 而无监督学习则有助于模型提升词汇模型的准确性和直觉性。

换言之， 无监督的预训练，主要能够提升模型的感性能力。

OpenAI 也在演示中给出了一个很微妙的演示。在提问为什么海是咸的问题中，GPT-4T 给出的答案是这样的。

海是咸的，因为它含有地球岩石中的矿物质。随后解释了这些矿物质是怎么被溶解，流入海里的。

而 GPT-4.5 给出的答案，虽然本质上仍然是一样的，但是更有一种语言的韵律感。

先来了一个头韵单押「rain,rivers,and rocks. 」海是咸的是因为雨水、河流和岩石！

接下来的讲解也更简单。除去了一些大词和长难句，用更容易理解的方式对这个过程进行了讲解。比如在最后一个阶段，4T 的用词是 accumulation，累积。这是一个中高级词汇，GPT 提示我这是一个雅思 (IELTS)6.5 - 8.0 分水平需要掌握的词汇。而 GPT-4.5 选择使用了「salts build up」，盐堆积了起来，更形象，也更简单。

可以想象，更形象，更简单的用词，对于教育、情感交流、营销、创意写作方面，都是一个更好的选择。

之前 DeepSeek 一个出圈的点，正是在于其文笔好。对于很多普通用户而言，专业推理并不一定经常使用，但是文笔好，却是一个虽然不太能很好地量化，但是非常直观且重要的点。

在 X 上，一些提前试用的用户，也称赞了 GPT-4.5 的文笔。

@benhylak 表示，这是第一个很能写的模型，是写作的 Midjourney 时刻，并贴出了在要求 GPT 写作一篇恐怖且反转的故事时，GPT-4o 和 GPT-4.5 的对比。

GPT-4.5 的文章：

深夜，我独自一人在破烂的公寓里，听到冰箱底下传来轻柔、湿润的低语声，它们承诺要爬进我的身体，把我掏空，再穿上我当睡衣。

我吓坏了，猛地拉开冰箱门，以为会看到老鼠或蟑螂，却只看见被冰霜覆盖、陈年未动的披萨卷，满是冰渣和悔意。

突然，那些披萨卷动了起来，裂开一道缝隙，露出针状的利齿，齐声低语着：「我们等了你很多年，混蛋。」

我还没来得及尖叫，它们就从冰箱里喷涌而出，如油腻的虫群一般钻入我的皮肤，让我猛然意识到——该死的，我午夜的馋瘾终于报复回来了。

GPT-4o 的版本：

深夜，Jake 在阁楼里偶然发现了一本陈旧且布满灰尘的书，书页中低语着超自然恐怖的秘密。