OpenAI第九天：向第三方开发者开放最先进大模型o1，成本下降60%

腾讯科技 · 公众号 · 科技媒体 · 2024-12-18 08:40

主要观点总结

OpenAI开启新一轮发布会，推出了一系列新产品和功能，包括尖端大模型o1系列、实时API更新、新的微调方法和偏好微调等。其中，o1系列模型具备处理复杂任务的能力，并引入结构化输出功能和函数调用功能以增强其功能。此外，OpenAI还宣布了实时API的重大更新，支持语音助手等自然会话体验。同时，推出了新的定价策略、GPT-4o mini等更具成本效益的模型以及面向不同编程环境的SDK。这些更新旨在助力开发者构建更先进、高度可定制的人工智能应用程序。

关键观点总结

关键观点1: 尖端大模型o1系列发布

OpenAI推出了尖端大模型o1系列，包括o1和o1 mini，具备处理复杂任务的能力，并能够进行自我校验确保答案的准确性。此外，它们还具备处理视觉输入的能力，为开发者提供了更多功能。

关键观点2: 实时API更新和定价策略调整

OpenAI宣布了实时API的重大更新，旨在支持语音助手等自然会话体验。同时，OpenAI还推出了新的定价策略，降低了GPT-4o音频的成本，并推出了更具成本效益的GPT-4o mini模型。

关键观点3: 偏好微调功能推出

作为一种创新的模型定制方法，偏好微调能够根据用户和开发者的偏好来优化模型表现。与传统的微调方法不同，它通过成对比较来指导模型选择更优的响应。

关键观点4: 推出新SDK以优化集成流程

OpenAI推出了面向Go和Java开发者的测试版SDK，以优化集成流程。这些新SDK为开发者在不同编程环境中与OpenAI模型进行交互提供了便利。

正文

请到「今天看啥」查看全文

OpenAI的实时API迎来升级

为智能会话语音/音频AI助手提供支持

OpenAI还宣布了其实时API的重大更新，旨在支持低延迟、自然的会话体验，如语音助手、实时翻译工具或虚拟导师等应用场景。

此次更新中，新的WebRTC集成成为一大亮点。它直接支持音频流、噪声抑制和拥塞控制，极大地简化了基于语音的应用程序的构建过程。开发者现在只需进行最小化的设置，即可集成实时功能，即使在多变的网络环境下也能保持稳定的性能。

在定价方面，OpenAI也推出了新的策略，使得GPT-4o音频的成本降低了60%。具体而言，每100万输入Tokens的费用为40美元，每100万输出Tokens的费用为80美元。同时，缓存音频输入的成本也降低了87.5%，现在的定价为每100万输入Tokens 2.5美元。

为了进一步提高性价比，OpenAI还推出了GPT-4o mini，这是一种更小、更具成本效益的模型。其价格更为亲民，每100万输入Tokens的费用为10美元，每100万输出Tokens的费用为20美元。此外，GPT-4o mini的文本Tokens费率也相对较低，输入Tokens的起始价格为0.60美元，输出Tokens的起始价格为2.40美元。

除了定价方面的调整，OpenAI还赋予了开发者对实时API响应的更多控制权。例如，并发的带外响应等特性允许后台任务（如内容审核）在不干扰用户体验的情况下运行。开发者还可以根据实际需求定制输入上下文，专注于对话的特定部分，并控制语音响应的触发时机，从而实现更准确、更无缝的交互体验。

偏好微调提供了新的自定义选项

另一个重要的新增功能是偏好微调，这是一种创新的模型定制方法，能够根据用户和开发者的偏好来优化模型表现。

与传统的依赖于精确输入输出的监督式微调不同，偏好微调采用成对比较的方式来指导模型选择更优的响应。这种方法在处理主观性较强的任务时尤为有效，例如总结、创造性写作或是语气和风格更重要的应用场景。