专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#任天堂JoyCon2未使用霍尔效应摇杆# ... ·  10 小时前  
36氪  ·  Met ... ·  昨天  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250214

腾讯研究院  · 公众号  · 科技媒体  · 2025-02-14 00:01

正文

请到「今天看啥」查看全文


三、  Karpathy新实验火了!「隐形字符」让一表情占53个token

1. Karpathy发现一个笑脸表情可占用53个token,背后涉及Unicode变体选择符能隐藏任意数据;

2. 利用变体选择符可实现信息隐藏和提示注入,DeepSeek-R1花费10分钟尝试解谜但失败;

3. 这种技术可用于数字水印,但也存在被滥用于绕过内容审核等风险。

https://mp.weixin.qq.com/s/kbONIs4QxpWOP7mBHqGPHg

四、  谷歌全网扒1000亿图像文本对,数据规模Scaling潜力依旧

1. 谷歌发布WebLI-100B数据集,包含1000亿图像文本对,规模较此前纪录扩大10倍;

2. 研究证明千亿级数据能提升模型在多语言和多元文化维度的表现,但CLIP等过滤会影响多元性;

3. ViT核心作者翟晓华参与研究,已于2024年12月宣布加入OpenAI苏黎世实验室。

https://mp.weixin.qq.com/s/67Vj-7_MGkJS-PBZZ4OZJw

五、  斯坦福等多机构联手发布,开源推理新秀OpenThinker-32B







请到「今天看啥」查看全文