正文
截图来源:chat.qwen.ai(篇幅所限,未截图思维链过程)
搜索了一段提示词做「emoji 表情跳舞」小游戏,点击推理模式下的 Artifacts 功能输入这段提示词,它自动写完代码的展示页面如下。不会写代码的用户表示从 0 到 1 的小游戏初体验还挺上头。
在代码和数学能力上,X 平台有更专业对口的网友评测。
这分别是一位魔搭社区维护者和 TikTok 研究员的体验,在专业的数学竞赛题目和代码题目上,QwQ-Max 预览版的完成度均比较高。
截图来源:X
另外,也试了试平时使用频率较高的两个场景:创意写作和联网搜索功能。
其思考过程和结果,都可以清晰理解用户意图、完整地给出答案。整个输出过程花了几秒。|截图来源:chat.qwen.ai
当问到「如何评价近日中国科技公司包括阿里巴巴,正在被全面重估的观点?这背后有多少可以支撑的论据?」时,thinking+联网搜索下的 Qwen 可以帮助人类节省阅读文献的时间,总结是相对清晰完整的。
Qwen Chat 网页最下方也会提醒你,「深度思考 (QwQ) 是一个预览模型,仍在更新中」。当前的 QwQ 展现出了连贯清晰的思考过程、以及推理结果,整体像一个一本正经思考的小大人。
但在像 DeepSeek 一样「放飞自我」能带来一些「out of box」思考的能力上,QwQ 预览版仍有进步的空间。这是问 QwQ-Max-Preview 和 DeepSeek-R1 同一个问题时对比图——「通义千问团队今天更新了 QwQ 的模型?为什么起名叫 QwQ?这个名字怎么读?」
DeepSeek 可以精准检索到网页,给出「QwQ 的全称为 Qwen with Questions,体现了模型的设计理念:通过『提问、质疑与反思』的机制,模拟人类思考过程,深化对复杂问题的理解。QwQ 的官方发音为**/kwjuː/**,类似于英文单词「quill」(羽毛笔)的读音」,
还可以提出自己的思考与结论
「QwQ 的命名与设计均围绕「以问题驱动思考」的哲学理念展开,其发音与符号化名称增强了技术传播的趣味性。该名称结合了技术标识(Qwen 系列)与拟人化元素(QwQ 的表情符号化写法),
既体现了与通义千问大模型家族(Qwen)的关联,又通过符号化的「颜文字」风格增强了传播亲和力。
」
比起小老哥 DeepSeek 的放飞自我,QwQ 是自带严谨风的老干部形象。相比之下,回答就中规中矩了。