专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250103

腾讯研究院 · 公众号 · 科技媒体 · 2025-01-03 00:01

主要观点总结

本文主要报道了关于生成式AI领域的多个新闻，涵盖了顶级模型参数、大型语言模型的效率问题、多个科技公司在AI领域的新进展以及专家的观点等内容。

论文给出了GPT-4o-mini为8B参数，Claude 3.5 Sonnet的参数为175B。这些参数数量引发了社区的广泛讨论。

这种现象导致在简单问题上消耗过多计算资源，效率低下。论文提出了新的效率指标，并优化了策略来减少过度思考，保持准确性并降低计算开销。

该功能通过深度分析激发思维，提供多维度解答，并提供了专业智能回复来解决复杂问题。

该模型能在手机上流畅运行，同时图像质量几乎无差异。

该模型采用了创新的FluxTransformer架构和流匹配技术，可应用于多个领域。

该框架通过结合程序化资产与智能规划，支持多种场景的快速构建，大大提高了生成效率。

该模型采用连续动作空间、多步历史信息及专门的历史信息组织模块，增强了模型性能和泛化能力。

该技术突破了光子脉冲神经元的速度限制，在AI任务中展现出卓越的模式识别和序列预测能力。

生成式AI在数据处理、报告生成等岗位中可承担大量工作，大幅提高效率。

包括AI视觉的普及、智能体和具备永久记忆的AI的发展等。同时，也指出了AI的可靠性和法规需要加强。

三、百度Web首页正式上线了自己的AI搜入口，整合大模型能力

1. "AI搜"推出了“灵感探索”功能，通过深度分析激发思维，提供多维度解答；

2. 提供一站式生产力工具，支持文创、图创、AI阅读等功能，专注效率提升；

3. 集成文心智能体平台，提供法律、健康等领域的专业智能回复，解决复杂问题。

四、 1.58比特FLUX：手机也能流畅运行的顶尖AI生图模型量化

1. 字节与POSTECH合作推出1.58-bit FLUX，将AI画图模型压缩7.7倍，便于移动端运行；

2. 采用1.58比特量化技术，大幅降低模型存储、推理内存并提升推理速度；

3. 经过测试，压缩后模型在图像质量上几乎无差异，支持高质量的AI图像生成。

五、英伟达 TangoFlux：秒生成30 秒高质量音频，配音 so easy

1、TangoFlux是由新加坡科技设计大学与NVIDIA合作研发的文本到音频生成模型，能在3.7秒内生成30秒的高质量音频；