正文
DeepSeek R1上线后,对贵公司算力销售额产生了怎样的影响?是否有具体数据可以说明?
DeepSeek R1自春节后上线仅两周时间,其带动算力销售额突破千万人民币。这一成绩远超预期,也促使腾讯重新评估年度OKR目标。2024年公司的总收入约为1,600亿元,2025年的目标是突破2000亿元。从目前趋势看,DeepSeek R1已成为推动算力销售的重要驱动力。
当前市场上其他云厂商也在推出类似DeepSeek R1的解决方案,与其相比贵公司的优势体现在哪些方面?
腾讯的核心优势包括较低的算力成本以及长期积累的大量行业核心用户(如交通、教育、金融及泛互联网领域)。此外,与市场上的其他厂商相比,腾讯更注重通过免费开放API让客户体验产品性能,从而提升用户粘性。然而,目前整个行业面临的问题是各家云部署版本稳定性不足,包括腾讯自身也存在扩展集群速度较慢的问题。
为应对当前显卡供应紧张问题,公司采取了哪些措施?未来是否会调整硬件采购策略?
目前腾讯的主要硬件依赖NVIDIA H100和H200显卡,但由于供应紧张,腾讯正在积极联系国内显卡厂商(如华为和沐曦)进行测试,并计划临时拨付新的预算用于补充采购国产显卡。不过具体预算金额尚未确定。此外,一台八卡H200服务器可支持约100个并发请求,这种配置基本满足单个企业独立模型运行需求。
贵公司现有H100、H200等高性能GPU资源规模如何?能否提供一个大致数量范围?
腾讯现有GPU资源总量达到万级别,但具体数量暂无法确认。目前整体资源仍处于高度紧张状态,以满足不断增长的大模型推理需求。
H200的并发能力如何定义?其与QPS(Queries Per Second)之间的关系是什么?
并发能力与QPS是两个不同的概念。并发指的是同时处理请求的能力,而QPS则是每秒查询次数。在某些情况下,20个并发可能会产生100个QPS。H200支持100个并发的意思是其能够同时处理100个请求,但具体到实际应用场景中,需要根据模型调用频率和负载情况进一步评估。
针对高日活用户场景(如微信)的算力需求,腾讯内部是否有相关预估或准备?
针对高日活用户场景,目前腾讯内部尚未有明确的调用量预估数据。现阶段部署的集群在应对大规模调用时可能会出现推理延迟,还会报出500错误。为此,通过限制每位用户可用tokens数量来控制TPS(Token Per Second),但这也导致部分用户无法正常使用服务。目前性能指标尚未达到稳定状态,因为相关系统刚刚上线。
腾讯云近期测试了哪些国产GPU卡?测试结果如何?
腾讯云近期测试了包括华为、沐曦和寒武纪在内的多款国产GPU卡。其中,沐曦C500卡在混合训练和推理方面表现良好,通过了初步验证;而华为卡在混训或混合推理时存在问题,可能是兼容性问题,目前主要考虑沐曦C500卡。
沐曦C500 GPU卡采购计划及成本情况如何
?
沐曦C500 GPU卡预计将在2025年第一季度进行大规模采购,数量在十万级。这一采购得到了政府补贴支持,可覆盖20%-30%的成本。然而,该型号GPU耗电较高,相较于NVIDIA产品能耗表现不佳,这可能增加机房改造及运营成本。
国产GPU供应链是否存在产能波动风险?腾讯对此有何看法?
国产GPU供应链确实存在一定产能波动风险。例如,部分厂商可能仅能提供有限批次产能,这对于长期算力部署而言具有不确定性。不过,据了解,目前慕希已囤积约10万张库存,因此短期内供应相对充足。
腾讯云针对to B业务客户使用国产GPU时面临哪些挑战?有哪些解决方案?
在to B业务场景中,如果客户已有NVIDIA算力基础,再新增国产GPU进行混训容易出现兼容性问题,例如报错等技术障碍。如果单独建立集群用于特定任务(如推理),则难以满足灵活扩展需求。因此,对于公有云服务而言,这种模式不太适用。但对于闭源系统或内部部署,如DeepSeek模型通过API方式提供服务,则可以更好地利用国产硬件资源。此外,大模型应用更多是为了拉动其他产品销售,而非依赖token销售盈利,因此硬件选择需综合考虑整体生态效益。
腾讯云目前基于大模型推出了哪些具体产品?这些产品如何影响营收结构?
基于现有的大模型,包括DeepSeek和混元模型,腾讯推出了一系列产品,如编程助手、ChatBI以及客服解决方案。这些应用主要用于提升客户体验,并推动云计算平台P1、TR Matrix等相关产品销售。由于token销售利润接近零,大模型更多是作为生态驱动力,以带动其他业务增长,而非直接盈利工具。
2025年腾讯云Capex预算是多少?近期是否有所调整?
2025年的具体Capex预算尚未完全披露,但可以确认的是,在最近两周内已追加超过10亿元人民币用于算力采购。这一预算调整仍需提交至总办会审批,并非由腾讯云单独决定。
2025年的资本支出计划数据是否已经明确?
当前尚未掌握2025年资本支出的具体数据。
腾讯未来是否会推出新的AI产品?
现阶段主要是将现有产品接入混元模型。例如,腾讯地图正在接入混元模型,通过整合用户历史兴趣点(POI)和行为习惯数据,优化目的地推荐和路径规划。此外,还计划推出一个终极版的模型(混元pro而非turbo),该版本对算力需求较低,更适用于游戏场景中的多模态应用,例如NPC对话功能和3D生成模型等。第三是世纪恒通正在部署DeepSeek产品,并结合多模态混元大模型,用于车联网服务、内容审核及营销等业务。其中,DeepSeek主要为世纪恒通提供车机系统支持,以满足主机厂商需求。此外,多模态会员大模型显著提升了内容审核效率,例如将原需100人的审核工作缩减至30人完成。