专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
目录
相关文章推荐
研之成理  ·  江南大学董玉明/新加坡国大吴杰Angew ... ·  3 天前  
研之成理  ·  国科大/KAUST/海南大学合作,Natur ... ·  2 天前  
51好读  ›  专栏  ›  PaperWeekly

大力出奇迹失灵了?ModelSwitch跳出采样黑洞,改写大模型推理范式

PaperWeekly  · 公众号  · 科研  · 2025-06-16 18:06

正文

请到「今天看啥」查看全文


给出的所有答案完全一致,那么算法会自信地采纳这个答案,并提前终止整个流程,从而后续模型的计算开销得以节省。


但如果 的答案并不一致,算法会转交给下一个模型 继续采样,直至寻找到某个模型能生成完全一致的答案,若没有模型能产生完全一致的答案,或者所有模型都已采样,则汇总所有模型的答案。


这种动态切换不仅旨在提升最终答案的准确性,更重要的是,它同时显著降低不必要的计算成本。在汇总答案时,ModelSwitch 采用了一种加权投票算法。

加权投票算法综合考量了两个维度的权重:一是各模型对当前查询给出答案时自身的一致性 ,通过答案分布的熵来计算,一致性越高,熵越低,权重则越高。二是模型自身的先验性能 。这样的设计确保了既能动态捕捉模型在特定问题上的信心,又能顾及模型历史的表现。


性能评估







请到「今天看啥」查看全文