主要观点总结
文章综述了九个关于人工智能的最新发展及多个相关话题,包括神秘的AI模型Grok-3的预训练与延期发布、法国建设欧洲版星际之门项目的投资与进展、Meta的新视频生成框架、DeepSeek模型的算力降低及效果提升等。
关键观点总结
关键观点1: 神秘的Grok-3模型完成预训练,性能被预期超越DeepSeek模型。
文章报道了名为Grok-3的神秘AI模型的预训练完成情况,该模型耗费了巨大的算力,被指是DeepSeek模型的超越者。尽管原定发布时间是2024年底,但多次延期反映了当前大模型研发中的行业趋势。
关键观点2: 法国投资建设欧洲版星际之门项目。
马克龙宣布法国将投资1090亿欧元建设欧洲版星际之门项目,该项目包括建设多个数据中心和首个AI集群的建设地点已经确定。同时,Mistral AI的开源模型Le Chat具有显著的优势。
关键观点3: Meta发布新的视频生成框架VideoJAM。
Meta发布了一个新的视频生成框架VideoJAM,该框架通过采用光流和内部引导机制等技术提升运动一致性,并且在双人舞蹈等复杂动作的生成效果上表现突出。
关键观点4: DeepSeek模型的算力需求大幅降低。
DeepSeek模型在算力需求方面取得了重大突破。DreamTech团队推出的Neural4D 2.0模型通过采用新的算法将算力需求降低了80%,同时生成质量达到了人工级水平。
关键观点5: 港大字节视频生成模型Goku引起关注。
港大字节联合推出的Goku视频生成模型基于新的架构和技术,能够在大幅降低视频广告制作成本的同时保持真实自然的效果。此外,该模型还在多项评测中创下新纪录。
关键观点6: 牛津大学证实分布式量子计算的可行性。
牛津大学研究团队首次实现了确定性量子门传送,并成功执行了分布式Grover搜索算法,为构建量子互联网奠定了基础。这一研究证实了分布式量子计算的可行性,对大规模量子计算机的研发具有重要意义。
关键观点7: AI成本暴跌及未来发展趋势。
根据Sam Altman的观察,AI成本每年都在急剧下降,而AI能力则随资源投入呈对数增长。他预测到2035年,每个人都将获得相当于当前全人类智慧总和的智能支持。OpenAI计划通过降低成本或分配计算预算等方式使AGI普惠全人类。
关键观点8: AI领域的专家观点与警告。
AI领域的专家如Bengio对OpenAI的未来发展提出了警告和关注。他指出OpenAI可能不会真正对外分享超级智能,同时强调对AI的发展需要进行全球性的协议和治理机制的制定。
关键观点9: DeepMind CEO对DeepSeek及AGI的看法。
DeepMind CEO Hassabis对DeepSeek模型表达了看法,认为虽然它是中国最好的AI模型之一,但没有实现真正的科学突破。他还预测AGI可能在五年内实现。同时,其他专家指出DeepSeek的成本下降符合行业正常预期,但性能仍然落后于美国顶级模型。
正文
三、 Meta新视频生成框架解锁体操动作,双人舞也能完美同步!
1. Meta发布VideoJAM框架,通过光流和内部引导机制提升运动一致性近20%,在双人舞蹈等复杂动作的生成效果超越Sora
2. 该框架采用联合外观-运动表示,在训练中添加运动预测任务,自然呈现书法书写、球体抛接等精细动作细节
3. VideoJAM可无缝集成不同规模DiT模型,小至4B大至30B均能显著提升运动质量,分别达到93.7和92.4
https://mp.weixin.qq.com/s/rP5bkkJQbRG0wtskpzguqw
四、 3D AIGC领域DeepSeek?算力暴降80%,效果人工水平
1. DreamTech团队推出Neural4D 2.0,采用3D Assembly Generation算法,将3D生成模型的算力需求降低80%,同时生成质量达到"人工级水平"
2. 新模型突破单体生成局限,实现分部件组装式生成,能创建具有200多块骨骼的3D角色模型,支持表情驱动和动作绑定
3. DreamTech发布5步走战略,从3D生成到空间拓扑、物理规律模拟,最终目标是通过世界模型训练出超级人工智能
https://mp.weixin.qq.com/s/TZWkR4zYeYmZswX_U2tEYQ