DeepSeek 爆火带来的大变化

待字闺中 · 公众号 · 程序员 · 2025-02-14 13:00

正文

请到「今天看啥」查看全文

我们设置一个简单的标准区分，思考的过程在模型输出的过程中，还是模型输出之前。

DeepSeek R1涌现出了思考的能力，提升模型的推理效果的同时，还降低了使用的门槛。这两个在通用模型里似乎是矛盾的。对通用模型，想要获得好的结果，一定要有好的输入，精心编写的 Prompt，大家一定记得网上流传的各种神级 Prompt 。但对于推理模型不再需要了，用户直接提问，通过模型自己的思考，可以获得比通用模型更好的结果。并且，DeepSeek 的思考过程全部开放——已经无数次被这个思考过程震惊了。

这个特点，使得很多小白用户觉得 DeepSeek 比其他的 AI 产品厉害。

但，无论是通用模型（例如 Claude）、还是推理模型（例如 DeepSeek），现阶段真正赋能的仍旧是“专业”用户，仍然需要某一个领域的专业知识。一方面是是提问，另一方面是评价，验证。对于 DeepSeek 这类的推理模型，提问的门槛在降低，但对于结果的评价、验证，仍然是需要的，而且更加重要一些。