专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
软件定义世界(SDX)  ·  DeepSeek使用技巧与提示词应用 ·  16 小时前  
数据派THU  ·  【ICML2025】通过多智能体反思强化大语 ... ·  2 天前  
数局  ·  大数跨境:2025烧烤设备出海研究报告 ·  2 天前  
51好读  ›  专栏  ›  数据派THU

【ICML2025】利用多样本推理优化语言模型的温度参数

数据派THU  · 公众号  · 大数据  · 2025-05-14 17:00

正文

请到「今天看啥」查看全文


5 分钟
本文旨在解决在无需任务特定验证数据的前提下,使用多样本聚合策略为不同LLMs自动寻找(近)最优温度的问题。


图片

多样本聚合策略(multi-sample aggregation strategies),如多数投票(majority voting)和 Best-of-N 采样,已被广泛应用于当代大型语言模型(Large Language Models,LLMs)中,以提升在各类任务中的预测准确性。在此过程中,一个关键挑战是 温度参数的选择 ,该参数对模型性能有显著影响。现有方法通常依赖固定的默认温度,或需使用带标签的验证数据进行调参,而这类数据在实际中往往稀缺且难以获取。







请到「今天看啥」查看全文