专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
程序员技术  ·  前美团员工求助:在美团背了个C绩效,慌得不行 ... ·  16 小时前  
蚂蚁技术AntTech  ·  清华蚂蚁开源首个全异步强化学习训练系统,SO ... ·  17 小时前  
极客之家  ·  22k star,微软硬核开源,让 ... ·  3 天前  
51好读  ›  专栏  ›  待字闺中

DeepSeek 爆火带来的大变化

待字闺中  · 公众号  · 程序员  · 2025-02-14 13:00

正文

请到「今天看啥」查看全文


我们设置一个简单的标准区分,思考的过程在模型输出的过程中,还是模型输出之前。

DeepSeek R1涌现出了思考的能力,提升模型的推理效果的同时,还降低了使用的门槛。这两个在通用模型里似乎是矛盾的。对通用模型,想要获得好的结果,一定要有好的输入,精心编写的 Prompt,大家一定记得网上流传的各种神级 Prompt 。但对于推理模型不再需要了,用户直接提问,通过模型自己的思考,可以获得比通用模型更好的结果。并且,DeepSeek 的思考过程全部开放——已经无数次被这个思考过程震惊了。

这个特点,使得很多小白用户觉得 DeepSeek 比其他的 AI 产品厉害。

但,无论是通用模型(例如 Claude)、还是推理模型(例如 DeepSeek),现阶段真正赋能的仍旧是“专业”用户,仍然需要某一个领域的专业知识。一方面是是提问,另一方面是评价,验证。对于 DeepSeek 这类的推理模型,提问的门槛在降低,但对于结果的评价、验证,仍然是需要的,而且更加重要一些。







请到「今天看啥」查看全文