主要观点总结
文章主要介绍了腾讯在AI算力平台调研中的各项工作进展,包括AI领域的产品和服务、市场竞争格局、技术进展以及内部运营效率提升计划等。文章还涉及腾讯AI产品的客户布局、市场竞争态势、国产GPU的应用情况等内容。
关键观点总结
关键观点1: 腾讯在AI领域的整体布局和工作重点
腾讯在AI领域的布局主要围绕自研混元大模型展开,通过该模型赋能内部业务,如腾讯会议、腾讯游戏等。同时,腾讯也关注客户需求,积极应对市场竞争,不断提升产品和服务的质量。
关键观点2: 市场竞争格局和DeepSeek的影响
在AI领域,市场竞争激烈,各大云厂商纷纷推出自有模型以降低跨域调用延迟,吸引客户。DeepSeek的出现使得模型差异化减弱,竞争焦点转向拼算力成本和服务能力。腾讯在市场竞争中积极应对,通过扩大算力资源、优化运营效率等措施提升竞争力。
关键观点3: 产品落地和客户服务
腾讯的AI产品已广泛应用于多个领域,如金融、教育、交通等,为客户提供高效、便捷的服务。同时,腾讯也关注客户需求,积极与客户合作,提供定制化解决方案,提升客户满意度。
关键观点4: 国产GPU的应用和挑战
随着国产化趋势的加强,国产GPU在AI算力领域的应用逐渐增多。腾讯也积极采用国产GPU,但在实际应用中面临兼容性和性能等挑战。未来,随着技术的进步和市场的成熟,国产GPU在AI算力领域的应用将越来越广泛。
关键观点5: 腾讯内部运营效率提升计划
腾讯计划在2025年大幅优化运营效率,通过组织优化、岗位调整等措施提升效率。同时,腾讯也将继续投入研发,推动技术创新,为客户提供更优质的服务。
正文
是的,这些企业通常需要借助外部IT服务提供商(如京北方、长亮科技或宇信科技等)进行内部系统的工程化改造,以便能够支持AI技术的应用。腾讯的角色主要集中在提供云计算和底层算力支持,而不涉及定制化开发或外包服务,专注于通用型原子能力的输出,不直接参与客户业务流中的深度定制化工作。
DeepSeek R1推出后,是否观察到政企客户对AI相关IT平台需求的显著增长?具体表现如何?
是的,自DeepSeek R1上线以来,腾讯观察到政企客户对基于AI技术的平台需求出现了显著增长。目前,智能化客服和知识问答类产品占据了70%的云服务采购比例。这些产品相对搭建较为简单,但如果客户希望更深度地应用AI,则需要依赖传统IT外包公司完成业务流改造。腾讯并不直接参与这些定制化开发工作。
DeepSeek R1上线后,对贵公司算力销售额产生了怎样的影响?是否有具体数据可以说明?
DeepSeek R1自春节后上线仅两周时间,其带动算力销售额突破千万人民币。这一成绩远超预期,也促使腾讯重新评估年度OKR目标。2024年公司的总收入约为1,600亿元,2025年的目标是突破2000亿元。从目前趋势看,DeepSeek R1已成为推动算力销售的重要驱动力。
当前市场上其他云厂商也在推出类似DeepSeek R1的解决方案,与其相比贵公司的优势体现在哪些方面?
腾讯的核心优势包括较低的算力成本以及长期积累的大量行业核心用户(如交通、教育、金融及泛互联网领域)。此外,与市场上的其他厂商相比,腾讯更注重通过免费开放API让客户体验产品性能,从而提升用户粘性。然而,目前整个行业面临的问题是各家云部署版本稳定性不足,包括腾讯自身也存在扩展集群速度较慢的问题。
为应对当前显卡供应紧张问题,公司采取了哪些措施?未来是否会调整硬件采购策略?
目前腾讯的主要硬件依赖NVIDIA H100和H200显卡,但由于供应紧张,腾讯正在积极联系国内显卡厂商(如华为和沐曦)进行测试,并计划临时拨付新的预算用于补充采购国产显卡。不过具体预算金额尚未确定。此外,一台八卡H200服务器可支持约100个并发请求,这种配置基本满足单个企业独立模型运行需求。
贵公司现有H100、H200等高性能GPU资源规模如何?能否提供一个大致数量范围?
腾讯现有GPU资源总量达到万级别,但具体数量暂无法确认。目前整体资源仍处于高度紧张状态,以满足不断增长的大模型推理需求。
H200的并发能力如何定义?其与QPS(Queries Per Second)之间的关系是什么?
并发能力与QPS是两个不同的概念。并发指的是同时处理请求的能力,而QPS则是每秒查询次数。在某些情况下,20个并发可能会产生100个QPS。H200支持100个并发的意思是其能够同时处理100个请求,但具体到实际应用场景中,需要根据模型调用频率和负载情况进一步评估。
针对高日活用户场景(如微信)的算力需求,腾讯内部是否有相关预估或准备?
针对高日活用户场景,目前腾讯内部尚未有明确的调用量预估数据。现阶段部署的集群在应对大规模调用时可能会出现推理延迟,还会报出500错误。为此,通过限制每位用户可用tokens数量来控制TPS(Token Per Second),但这也导致部分用户无法正常使用服务。目前性能指标尚未达到稳定状态,因为相关系统刚刚上线。
腾讯云近期测试了哪些国产GPU卡?测试结果如何?
腾讯云近期测试了包括华为、沐曦和寒武纪在内的多款国产GPU卡。其中,沐曦C500卡在混合训练和推理方面表现良好,通过了初步验证;而华为卡在混训或混合推理时存在问题,可能是兼容性问题,目前主要考虑沐曦C500卡。
沐曦C500 GPU卡采购计划及成本情况如何
?
沐曦C500 GPU卡预计将在2025年第一季度进行大规模采购,数量在十万级。这一采购得到了政府补贴支持,可覆盖20%-30%的成本。然而,该型号GPU耗电较高,相较于NVIDIA产品能耗表现不佳,这可能增加机房改造及运营成本。
国产GPU供应链是否存在产能波动风险?腾讯对此有何看法?