专栏名称: 哎咆科技
原「果粉查询」公众号蜕变为专注科技生活媒体,提供最前沿科技动态及爆料,产品试用测评&众筹,苹果序列号查询,山寨机&翻新机验证等服务。
目录
相关文章推荐
EETOP  ·  全球首款 102.4T 以太网交换机芯片! ·  3 小时前  
EETOP  ·  下午14:00 ... ·  5 小时前  
EETOP  ·  日企拆解 iPhone ... ·  7 小时前  
EETOP  ·  黄仁勋:Switch 2 芯片是技术奇迹! ·  昨天  
ZOL中关村在线  ·  DIY这个圈子真的被时代抛弃了吗? ·  2 天前  
51好读  ›  专栏  ›  哎咆科技

隐私保护被AI厂商抛弃?为了数据大家都不装了

哎咆科技  · 公众号  · 硬件  · 2025-05-16 14:16

正文

请到「今天看啥」查看全文



无独有偶,AI搜索独角兽Perplexity的首席执行官Aravind Srinivas不久前曾公开宣称,Perplexity正在打造自己的浏览器。对于为何要做一款浏览器,他是这样说的,“我们希望能够在应用之外获取数据,从而更好地了解用户。”


相比于海外厂商的直白,国内互联网公司就低调许多了。5月10日,阿里方面悄然上线淘宝桌面版客户端,这款客户端采用了类似于淘宝网页版的设计,但整合了AI导购、阿里旺旺聊天等功能。有网友很快就发现,这款产品几乎就是2013年上线的淘宝浏览器“换皮版”。


隐私保护被AI厂商抛弃?为了数据大家都不装了


事实上,国内互联网厂商推出桌面版客户端是PC互联网时代的潮流,一众厂商早就将PC端的存量用户给抛诸脑后了。再结合阿里方面在宣传淘宝客户端时,着重强调AI导购助手功能,称其整合了Qwen 3和DeepSeek以帮助用户挑选商品,就不难发现他们突然推出淘宝客户端另有玄机。


相比网页版,桌面客户端以及App都有一个巨大的优势,那就是收集的用户数据更加完整,这也是为什么互联网厂商一直力推App,却“主动淘汰”网页版的原因。如果不是为了收集用户数据,如今互联网厂商根本就没有理由去推一个桌面客户端。


隐私保护被AI厂商抛弃?为了数据大家都不装了


现阶段,“数据荒”已经是高悬在所有AI厂商头顶的达摩克利斯之剑。《经济学人》此前在2024年发布的一篇题为《AI公司很快将耗尽大部分互联网数据》的文章中就曾指出,到2028年互联网上所有高质量的文本数据都将被使用完毕,机器学习数据集可能会在2026年前就耗尽所有“高质量语言数据”。 《Nature》更是直言不讳地表示,“互联网上的可用信息已经被吸干了”。


所以缺乏足够的数据来迭代AI模型,已经是所有AI厂商都倍感头疼的问题。为此“合成数据”被提了出来,可在实际应用过程中,“左脚踩右脚上天”的合成数据始终难以摆脱欠拟合 (Underfitting)、乃至模型崩溃的缺陷。







请到「今天看啥」查看全文