专栏名称: 计算机司令部
安信计算机:严谨研究 真诚服务。
目录
相关文章推荐
中国交建  ·  中交集团主要领导拜会安徽省省长王清宪 ·  11 小时前  
中国城市规划  ·  学习 | ... ·  2 天前  
成都日报  ·  大修将完工,月底开放交通! ·  昨天  
中国交建  ·  “橡皮泥”上“种”风机 ·  昨天  
中国城市规划  ·  恽爽:以城市更新行动推动城市功能系统化完善 ·  3 天前  
51好读  ›  专栏  ›  计算机司令部

【民生计算机】DeepSeek激活一体机投资机遇全扫描

计算机司令部  · 公众号  ·  · 2025-02-23 16:05

正文

请到「今天看啥」查看全文


DeepSeek:NSA官宣发布,加速推理降低成本,并且不牺牲性能


2月18日消息,DeepSeek今日官宣推出NSA(Native Sparse Attention),这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。NSA的核心组件包括:动态分层稀疏策略、粗粒度token压缩、细粒度token选择;DeepSeek官方表示,该机制可优化现代硬件设计,加速推理同时降低预训练成本,并且不牺牲性能,在通用基准、长上下文任务和基于指令的推理上,其表现与全注意力模型相当或更加优秀。


SambaNova:推出“最快”DeepSeek-R1 671B模型推理云服务


2月21日消息,AI芯片与解决方案企业SambaNova宣布在其基于自研SN40L RDU处理器的云平台上推出号称“市面最快”的DeepSeek-R1 671B模型推理云服务,并表示其token 输出速度可达每prompt每秒198个。SambaNova的SN40L RDU芯片基于台积电5nm制程,BF16算力可达638 TFLOPS。其采用了一种三层存储结构:片上的520MB SRAM缓存、2.5D封装集成的64GB HBM内存、片外的1.5TB超大容量DDR DRAM内存,这使得单芯片能容纳的参数远超一般竞品。此外 SN40L RDU 在结构上的灵活性使得其能动态重新配置硬件资源和数据流,提升计算与访存效率。


OpenAI:GPT-4.5有望下周发布,GPT-5被曝将与o3大一统、定档5月底


2月21日消息,据外媒The Verge消息、了解公司计划的知情人士透露,微软工程师目前正在为OpenAI即将推出的GPT-4.5和GPT-5模型准备服务器容量。GPT-4.5是OpenAI 的下一个前沿模型,代号Orion,也是其最后的非思维链模型。OpenAI已经暗示GPT-4.5可能比GPT-4强大得多,而后续GPT-5模型有望迎来更多重大变化。微软预计GPT-5将在五月底发布,这与Altman承诺的下一代模型将在几个月内到来相符。OpenAI已不再计划单独推出o3推理模型,而是将其集成到GPT-5中,即结合其大型语言模型,最终创建一个更强大的模型,该模型可以被标记为通用人工智能,或AGI。


模速空间平台:国内首个“算力生态超市”在沪发布,聚合AI云计算企业降低算力成本


2月22日消息,据央视新闻报道,在2025年全球开发者先锋大会(2025 GDC)中,上海市徐汇区推出国内首个“算力生态超市”——“模速空间算力生态平台”。针对AI大模型产业链企业,模速空间算力生态平台将提供人工智能企业提供“全周期、全要素、全流程”一站式服务“及算力补贴 + 拎包入驻”叠加的优惠政策,为企业提供物理空间与数字化服务,降低人工智能企业的平均算力成本,让企业能够以更加灵活的轻资产方式开展运营。同时,平台还将积极推动上下游产业协同共进,形成开产业生态,进而助力模速空间夯实人工智能孵化器定位,成为上海人工智能产业创新的核心载体与关键引擎。

3.公司新闻

东方通: 2月17日消息,公司将持有的参股公司上海通办信息服务有限公司15.0326%股权,转让给福建福昕软件开发股份有限公司或其关联方,股权转让交易价格为人民币10,993.8781万元。


锐明技术: 2月18日消息,公司以人民币3,098.55万元向广州广交数科信息产业有限公司和东莞市锐盈投资合伙企业(有限合伙)合计转让所持有的控股子公司深圳市锐明科技有限公司47.67%股权。其中,广交数科以人民币2,730万元受让锐明科技42%股权;锐盈投资以人民币368.55万元受让锐明科技5.67%股权。







请到「今天看啥」查看全文