主要观点总结
OpenAI开启了“Shipmas”产品发布季,启动12天连发活动。在第一天发布会上,推出了o1模型的满血正式版和ChatGPT Pro订阅计划两个重磅更新。o1模型在处理复杂问题上的错误率降低了34%,且在多个测试中都表现出强劲实力。另外,它还支持多模态识别。而ChatGPT Pro提供更强的稳定性和一致性,以及无限使用GPT-4o的权限。未来还会有更多产品发布。
关键观点总结
关键观点1: OpenAI开启“Shipmas”产品发布季
这是受到圣诞日历传统启发的12天连发活动,旨在给全球科技圈每天送上“圣诞礼物”。今天发布了两个重磅更新:o1模型的满血正式版和ChatGPT Pro订阅计划。
关键观点2: o1模型的新特性
新版o1在处理复杂问题上的错误率降低了34%,根据题目难易程度调节处理时间。在多个测试(如国际数学奥林匹克预选赛题目、编程能力测试、博士级科学问题等)中展现出强劲实力,并且支持多模态识别。
关键观点3: ChatGPT Pro的特点
ChatGPT Pro提供了o1 pro mode,增强了稳定性和一致性。在严格测试中,其在竞赛数学、编程和科学问题上的表现超过了普通版o1。此外,还提供无限使用GPT-4o的权限。
关键观点4: 接下来的产品发布预测
OpenAI在接下来的几天内可能还会发布更多新产品和功能更新。谷歌可能会发布Gemini 2,而Anthrophic也有新模型计划在圣诞节前上线。
正文
因为太空中没法水冷,因此散热需要靠一张巨大的散热片。研究员让o1去计算,如果要给的数据中心供给1 GW的电,它需要多大的散热片才能保证GPU阵列的正常运作。
o1完全准确的识别和理解了图片的内容,并经过了超过3屏的精密分析和计算,给出了正确答案——需要242万平方米的一块巨大散热片才够。
而回答这个问题仅仅用了o1 10s的时间。
可以预见,多模态支持技能一解锁,o1的实用性暴增。医生可以用它分析医学影像,工程师能让它帮忙看图纸,设计师还能让它提供创意建议。
另一道现场测试题则更为复杂:OpenAI的研究员要求o1找到一种符合六个标准的特定蛋白质。
这个问题的挑战在于,需要模型回忆起相当专业的化学领域知识,而对于任何给定的标准,可能会有数十种蛋白质符合该标准。所以模型必须全面考虑所有候选者,然后检查它们是否符合所有标准。
这一问题需要大量思考和排查的问题,o1花了63s做对了。
除此之外,在安全性测试中,o1拿下了84分的高分,比起GPT-4o的22分也有了质的飞跃。看来,OpenAI在让AI既聪明又“懂规矩”这件事上没少下功夫。
o1新模型今日起将面向 ChatGPT Plus 和团队用户开放,而企业和教育用户则从下周开始可使用。
ChatGPT Pro:200美金/月
买个稳定发挥
如果说o1的升级是意料之中,那么月收费200美元的ChatGPT Pro可就真的让人倒吸一口凉气了。虽然之前一直有传闻提到OpenAI会推出200美元收费的套餐,但这个价格过高,业内很多人并不相信。
不过看数据,它确实是目前AI模型界的“旗舰”。
在这个套餐里,OpenAI 提供了最强的o1 pro mode。按Sam Altman自己的解释,这个模式会让o1处理非常难的题目时,获得更多算力和能量。
这听起来似乎才是o1的真正完全体——不卡算力的情况下的o1。
在一般测试中,o1 pro 模式在国际数学奥林匹克预选赛题目(AIME 2024)中,正确率达到了86,超过了o1版本的78。
在编程中它和o1相当,但在处理博士级科学问题(GPQA Diamond)时有5%左右的优势。