专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#三款机型无缘iOS26#】科技媒体 ... ·  13 小时前  
36氪  ·  一条视频涨粉2000万,韦神凭什么? ·  17 小时前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250103

腾讯研究院  · 公众号  · 科技媒体  · 2025-01-03 00:01

主要观点总结

本文主要报道了关于生成式AI领域的多个新闻,涵盖了顶级模型参数、大型语言模型的效率问题、多个科技公司在AI领域的新进展以及专家的观点等内容。

关键观点总结

关键观点1: 微软与华盛顿大学合作的论文透露了多个LLM模型的参数,包括GPT-4和Claude 3.5等。

论文给出了GPT-4o-mini为8B参数,Claude 3.5 Sonnet的参数为175B。这些参数数量引发了社区的广泛讨论。

关键观点2: 腾讯AI Lab和上海交通大学揭示了o1-like超大型语言模型的“过度思考”现象。

这种现象导致在简单问题上消耗过多计算资源,效率低下。论文提出了新的效率指标,并优化了策略来减少过度思考,保持准确性并降低计算开销。

关键观点3: 百度在其Web首页上线了AI搜索功能,推出了“灵感探索”功能。

该功能通过深度分析激发思维,提供多维度解答,并提供了专业智能回复来解决复杂问题。

关键观点4: 字节与POSTECH合作推出了1.58-bit FLUX模型,将AI画图模型压缩了7.7倍。

该模型能在手机上流畅运行,同时图像质量几乎无差异。

关键观点5: 英伟达与新加坡科技设计大学合作研发的TangoFlux文本到音频生成模型能在短时间内生成高质量音频。

该模型采用了创新的FluxTransformer架构和流匹配技术,可应用于多个领域。

关键观点6: 中科院的空间智能新框架SceneX能快速生成高质量的3D场景。

该框架通过结合程序化资产与智能规划,支持多种场景的快速构建,大大提高了生成效率。

关键观点7: 多机构提出的新模型RoboVLMs在视觉语言模型中添加动作预测模块,表现出色。

该模型采用连续动作空间、多步历史信息及专门的历史信息组织模块,增强了模型性能和泛化能力。

关键观点8: 基于量子点激光器的人工神经元具备超快信号处理能力,比生物神经元快10亿倍。

该技术突破了光子脉冲神经元的速度限制,在AI任务中展现出卓越的模式识别和序列预测能力。

关键观点9: 谷歌指出罗马尼亚公共部门69%的工作岗位将被生成式AI补充。

生成式AI在数据处理、报告生成等岗位中可承担大量工作,大幅提高效率。

关键观点10: AI教父警告AI导致人类灭绝的风险翻倍,多位AI专家对2025年的AI发展做出了预测。

包括AI视觉的普及、智能体和具备永久记忆的AI的发展等。同时,也指出了AI的可靠性和法规需要加强。


正文

请到「今天看啥」查看全文


三、  百度Web首页正式上线了自己的AI搜入口,整合大模型能力

1. "AI搜"推出了“灵感探索”功能,通过深度分析激发思维,提供多维度解答;

2. 提供一站式生产力工具,支持文创、图创、AI阅读等功能,专注效率提升;

3. 集成文心智能体平台,提供法律、健康等领域的专业智能回复,解决复杂问题。

https://mp.weixin.qq.com/s/XaRMZ-uJXIFKiDFaZtEqFw

四、  1.58比特FLUX:手机也能流畅运行的顶尖AI生图模型量化

1. 字节与POSTECH合作推出1.58-bit FLUX,将AI画图模型压缩7.7倍,便于移动端运行;

2. 采用1.58比特量化技术,大幅降低模型存储、推理内存并提升推理速度;

3. 经过测试,压缩后模型在图像质量上几乎无差异,支持高质量的AI图像生成。

https://mp.weixin.qq.com/s/DnsQdQQ9kjwoMafm50QjWw

五、  英伟达 TangoFlux:秒生成30 秒高质量音频,配音 so easy

1、TangoFlux是由新加坡科技设计大学与NVIDIA合作研发的文本到音频生成模型,能在3.7秒内生成30秒的高质量音频;







请到「今天看啥」查看全文