专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
腾讯科技  ·  图灵奖得主Richard S. ... ·  昨天  
新浪科技  ·  #日本任天堂专卖店顾客寥寥#【独家 | ... ·  2 天前  
51好读  ›  专栏  ›  腾讯科技

马斯克披露旗下业务进展:擎天柱机器人3年后年产50万台,已有3名患者植入脑机芯片

腾讯科技  · 公众号  · 科技媒体  · 2025-01-09 18:02

正文

请到「今天看啥」查看全文




人工智能训练数据已耗尽
马斯克赞同其他人工智能专家的观点,认为目前可用于训练人工智能模型的真实世界数据已所剩无几。他指出:“我们现在基本上已经耗尽了人类知识的总和,用于人工智能训练。这基本上发生在去年。”
作为人工智能初创公司xAI的创始人,马斯克的这番言论,呼应了前OpenAI首席科学家伊利亚·苏茨克弗在去年12月的NeurIPS机器学习大会上的观点。苏茨克弗当时表示,人工智能行业已经达到了他所说的“数据巅峰”,并预测训练数据的缺乏将迫使行业改变目前模型开发的方式。
马斯克认为,合成数据--由人工智能模型自身生成的数据--是未来的发展方向。
“补充真实世界数据的唯一方法是合成数据,人工智能会创造训练数据,”他说。“通过合成数据,人工智能将进行自我评估,并经历自我学习的过程。”包括微软、Meta、OpenAI和Anthropic在内的其他公司已经在使用合成数据来训练其旗舰人工智能模型。
据市场调研公司Gartner估计,到2024年,用于人工智能和分析项目的数据中有60%将是合成生成的。
使用合成数据进行训练还有其他优势,比如节省成本。人工智能初创公司Writer声称,其几乎完全使用合成数据源开发的Palmyra X 004模型,开发成本仅为70万美元,相比之下,一个类似规模的OpenAI模型的估计开发成本为460万美元。
然而,合成数据也有其缺点。一些研究表明,合成数据可能导致模型崩溃,即模型变得不那么“有创造力”--并且更加有偏见--在其输出中,最终严重损害其功能。因为模型创造合成数据,如果用于训练这些模型的数据存在偏见和局限性,其输出也将受到类似的影响。


“削减联邦预算2万亿”的目标或无法实现
埃隆·马斯克表示,他为当选总统唐纳德·特朗普进行的预算削减努力可能无法实现之前设定的节省2万亿美元的目标。
作为新成立的咨询机构--政府效率部(DOGE)的联合负责人,马斯克曾表示2万亿美元是“最佳情况的结果”,并认为实际能够削减的数额可能只有1万亿美元。
此前,在2024 年10月27日纽约麦迪逊广场花园举行的特朗普集会上,马斯克曾自信地表示能够削减联邦预算“至少“2万亿美元”。然而,这一目标很快被预算专家视为不切实际,他们指出整个自由裁量预算仅为1.7万亿美元。在 2025 年1月8日的采访中,马斯克首次对2万亿美元的目标进行了调整。






请到「今天看啥」查看全文