正文
查看完整对谈视频。
面对市场上众多模型,特别是对于传统型企业而言,您会提供哪些方面的建议?例如,在流程优化、实施步骤以及方法论选择等方面。
我曾经借鉴业界的俗话,提出过一个例子,叫“五个馒头”,比方一个人很饿了,去店里吃馒头,吃了第一个没饱,第二个、第三个、第四个都没饱,吃第五个才饱了,结果这个人没有感谢店家,反而是埋怨店家,说你为什么不把那第五个馒头放在第一个直接给我吃完不就饱了吗?在行业内,人们普遍认为,大部分企业从上到下都想吃那第五个馒头,为什么呢?因为第五个馒头更能拿到预算、让上级赏识。
然而,问题在于,如果我们认为第五个馒头能够带来饱腹感,那么前提是必须先吃完前四个馒头,我想进一步阐述这五个馒头分别代表什么。倒推的话其实大家都已经知道了,
有智能的话必须得有数据,“Model is as good as your data”。模型它再厉害,它不会超越你数据质量的边界,数据质量决定了你模型的最高线。
并非所有数据都具备学习价值,只有那些具有实际应用价值的数据才值得被模型学习。此外,由于缺乏流程再造,许多人误以为预训练模型能够解决所有问题,但实际上,预训练模型提供的只是通用知识,真正具有应用价值的是在线学习 online learning,即模型在实际应用过程中持续学习并不断进行纠偏的,那叫 online learning,然而,当前的流程通常缺乏提供这种在线学习能力的机制。
其他“馒头”还包括企业文化改造,重塑对数据驱动的信任,因为现在很多企业所谓的 “数据驱动”仅仅停留在口号层面,要实现真正的数据驱动,你需要数据驱动流程进行彻底的再造、更需要对数据驱动算法的可靠性给予充分的信任。
而且就算这样,五个馒头吃完之后还是会发现远远不够,因为还需要有问题驱动和真正的产品产出。因为产品不是模型,用户也不会直接用模型,用户用的是那个最终的产品。
所以 萨提亚・纳德拉有句名言叫“Model is not your product, model is part of your product”,即模型不是你的产品,模型是你产品的一部分。也就是说,都想为最后的产品买单,没人做模型,没人做数据,没人做流程再造,没人做人才培养,没有做企业文化再造——这么一堆事情做完之后才能有产品,这多难啊?
我们的下一个问题是我在接触到很多企业时意识到的,他们总会谈到一个很流行的词叫“幻觉”,但这里有一对矛盾:在消费级AI应用场景中好像幻觉就不是一个严重的问题,甚至说幻觉越多越好,越有创意,但企业端好像对幻觉这个事就很困扰、“痛恨”幻觉。
您怎么看待这个企业场景中的幻觉问题?
这也是一个特别好的问题,大家都在说幻觉要尽量减少,但是有没有发现,如果你真让一个概率型模型没有幻觉之后的话,它也就没能力了。为什么呢?
因为幻觉本身不是 bug,而是 feature、是功能,而不是它的问题。但是确实过多的幻觉那是不行的,这需要靠各种后期训练微调或者提示词来避免,
但是,如果完全清除了模型的幻觉,那么我们又该如何定义“生成”这一概念?生成式模型不正是通过引入一定程度的不确定性来实现内容创造的吗?”
所以阿尼尔·赛斯写过一本书叫 Being You,中文版翻译叫《意识机器》,他就挑战这个概念,说人的思维就是一种“可控的幻觉”,你想咱们人能够重复做一件事吗?重复性任务类似于背文章,我们能够记住某些内容,但对于那些需要抽象理解才能表达的内容,实际上是一种受控的幻觉。
其实我们要的不是一个没有幻觉的大模型,我们要的是一个像人一样受控的幻觉,那么要控到什么程度才是一个最麻烦的地方。比方说小孩经常说“为什么不能这样?”“Why not?”但大人被异化成了机器,所以我们不敢说why not 了,也不敢说why了,这是否意味着一切都被简化为直接执行指令?我们成了机器人。所以当我们在谈这个幻觉的时候,其实是误会了它的功能。
微软也有一个副总裁就说叫软件1.0,他称呼AI技术或者大模型是软件2.0,之前的软件是1.0,1.0和2.0各司其职。近期,一个引发热议的话题是让大模型比较9.9跟9.11谁大谁小?令人费解的是,不是说它不能做,为何仍要强求模型执行其不擅长的任务?大模型最擅长的什么?最擅长的是知道了a等于9.9,b等于9.11,然后它可以给你做规划,做战略,做调整。大型模型在进行具体数值a的比较方面,例如区分9.9与9.9999999,并不具备优势。
为何不将a的赋值运算交由软件1.0执行,以发挥其在数值计算方面的优势。那么大模型擅长做的事情是告诉你,如果a比b大了之后你该怎么做。所以这整个流程中,既有需要精准的工作、也有需要概率的工作,但你非用一个概率工具去做精准的事,并非不行,但那就叫舍本逐末了。