专栏名称: 计算机司令部
安信计算机:严谨研究 真诚服务。
目录
相关文章推荐
大河报  ·  自查!罗马仕召回近50万台充电宝 ·  昨天  
大河报  ·  自查!罗马仕召回近50万台充电宝 ·  昨天  
Hacking4fun  ·  MCP is all you need ·  2 天前  
四川药品监管  ·  千万别买!这种化妆品,汞含量竟超标3万倍! ·  2 天前  
四川药品监管  ·  千万别买!这种化妆品,汞含量竟超标3万倍! ·  2 天前  
51好读  ›  专栏  ›  计算机司令部

【民生AI体验官】360纳米AI搜索“DeepSeek-R1”满血版

计算机司令部  · 公众号  · 科技自媒体  · 2025-02-04 22:38

主要观点总结

本报告对360纳米AI搜索软件中的DeepSeek-R1大模型进行测评,包括数学、代码、自然语言推理方面的性能评价,以及关于DeepSeek全系列模型在华为910B GPU服务器上的运行情况。此外,还包括计算机团队的介绍和免责声明。

关键观点总结

关键观点1: DeepSeek-R1大模型的性能测评

报告对DeepSeek-R1大模型在数学、代码、自然语言推理方面的性能进行了测评,并总结了其回答思考推理过程的优点,如更加详尽、贴近人脑思考过程等。

关键观点2: DeepSeek全系列模型在华为910B GPU服务器上的运行

报告介绍了DeepSeek全系列模型于2025年2月2日正式运行在华为910B GPU服务器上,并说明了目前可选用的模型及条件限制。

关键观点3: 计算机团队的介绍和免责声明

报告介绍了计算机团队的成员和分析师,并包含了免责声明,明确报告的使用范围和限制,提醒用户根据自身情况独立判断。


正文

请到「今天看啥」查看全文



360智脑pro模型 给出了解答过程如下:


图1 | 智脑pro数学能力解答


而使用Deepseek-R1联网满血版671B作为回答模型时,其思考推理过程更加接近人类的思维过程,是一个 理解问题—选择方法—解决问题—验证答案—确定答案 的缜密思维过程,思考过程对用户更加友好,适合深度学习和充当教育助手。


图2 | DS满血版数学思考片段


图3 | DS满血版数学能力解答


虽解答给出的答案一样,但接入Deepseek-R1模型更为详尽和准确,其思维过程不仅仅完整展示了拟人化的思考过程,还考虑了——

多种方法验证答案是否正确?

组合数的计算是否正确?

有没有其他角度需要考虑?

有没有可能用户的问题有其他理解方式?

比如,是否是放回抽取?甚至检查分数是否约分正确?


当然其带来的思维时长相较更长,此次思考用时145.57秒。


2、代码能力

我们提出的问题是“开发一个命令行文本编辑器,支持基本的文本编辑功能,如插入、删除、查找、替换等,并且能够将编辑后的文本保存到文件中”







请到「今天看啥」查看全文