专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
新浪科技  ·  【净利跌两成,均价降4万! ... ·  昨天  
新浪科技  ·  【#尾号0000000手机号拍出61.2万# ... ·  2 天前  
51好读  ›  专栏  ›  腾讯科技

OpenAI年末狂欢第一弹:“满血版”o1模型来了,还有个200美元/月的Pro版会员

腾讯科技  · 公众号  · 科技媒体  · 2024-12-06 04:20

主要观点总结

OpenAI开启了“Shipmas”产品发布季,启动12天连发活动。在第一天发布会上,推出了o1模型的满血正式版和ChatGPT Pro订阅计划两个重磅更新。o1模型在处理复杂问题上的错误率降低了34%,且在多个测试中都表现出强劲实力。另外,它还支持多模态识别。而ChatGPT Pro提供更强的稳定性和一致性,以及无限使用GPT-4o的权限。未来还会有更多产品发布。

关键观点总结

关键观点1: OpenAI开启“Shipmas”产品发布季

这是受到圣诞日历传统启发的12天连发活动,旨在给全球科技圈每天送上“圣诞礼物”。今天发布了两个重磅更新:o1模型的满血正式版和ChatGPT Pro订阅计划。

关键观点2: o1模型的新特性

新版o1在处理复杂问题上的错误率降低了34%,根据题目难易程度调节处理时间。在多个测试(如国际数学奥林匹克预选赛题目、编程能力测试、博士级科学问题等)中展现出强劲实力,并且支持多模态识别。

关键观点3: ChatGPT Pro的特点

ChatGPT Pro提供了o1 pro mode,增强了稳定性和一致性。在严格测试中,其在竞赛数学、编程和科学问题上的表现超过了普通版o1。此外,还提供无限使用GPT-4o的权限。

关键观点4: 接下来的产品发布预测

OpenAI在接下来的几天内可能还会发布更多新产品和功能更新。谷歌可能会发布Gemini 2,而Anthrophic也有新模型计划在圣诞节前上线。


正文

请到「今天看啥」查看全文


因为太空中没法水冷,因此散热需要靠一张巨大的散热片。研究员让o1去计算,如果要给的数据中心供给1 GW的电,它需要多大的散热片才能保证GPU阵列的正常运作。

o1完全准确的识别和理解了图片的内容,并经过了超过3屏的精密分析和计算,给出了正确答案——需要242万平方米的一块巨大散热片才够。

而回答这个问题仅仅用了o1 10s的时间。

可以预见,多模态支持技能一解锁,o1的实用性暴增。医生可以用它分析医学影像,工程师能让它帮忙看图纸,设计师还能让它提供创意建议。

另一道现场测试题则更为复杂:OpenAI的研究员要求o1找到一种符合六个标准的特定蛋白质。

这个问题的挑战在于,需要模型回忆起相当专业的化学领域知识,而对于任何给定的标准,可能会有数十种蛋白质符合该标准。所以模型必须全面考虑所有候选者,然后检查它们是否符合所有标准。

这一问题需要大量思考和排查的问题,o1花了63s做对了。

除此之外,在安全性测试中,o1拿下了84分的高分,比起GPT-4o的22分也有了质的飞跃。看来,OpenAI在让AI既聪明又“懂规矩”这件事上没少下功夫。

o1新模型今日起将面向 ChatGPT Plus 和团队用户开放,而企业和教育用户则从下周开始可使用。



ChatGPT Pro:200美金/月

买个稳定发挥


如果说o1的升级是意料之中,那么月收费200美元的ChatGPT Pro可就真的让人倒吸一口凉气了。虽然之前一直有传闻提到OpenAI会推出200美元收费的套餐,但这个价格过高,业内很多人并不相信。

不过看数据,它确实是目前AI模型界的“旗舰”。

在这个套餐里,OpenAI 提供了最强的o1 pro mode。按Sam Altman自己的解释,这个模式会让o1处理非常难的题目时,获得更多算力和能量。

这听起来似乎才是o1的真正完全体——不卡算力的情况下的o1。

在一般测试中,o1 pro 模式在国际数学奥林匹克预选赛题目(AIME 2024)中,正确率达到了86,超过了o1版本的78。

在编程中它和o1相当,但在处理博士级科学问题(GPQA Diamond)时有5%左右的优势。







请到「今天看啥」查看全文