专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20250 ... ·  15 小时前  
架构师带你玩转AI  ·  好书推荐 -《深度学习:基础与概念》 ·  23 小时前  
爱可可-爱生活  ·  《爱可可微博热门分享(6.6)》 ... ·  昨天  
AI产品阿颖  ·  最喜欢的AI视频产品,终于有了国内版本。 ·  昨天  
51好读  ›  专栏  ›  机器之心

业界 | Facebook发布新版fastText:拓展至移动端,加入教程

机器之心  · 公众号  · AI  · 2017-05-03 13:56

正文

请到「今天看啥」查看全文



fastText 是 Facebook 开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。 Facebook 在此前的研究中 宣称人们可以使用一个标准多核 CPU 在十分钟内完成 fastText 上 10 亿多词的训练,并在一分钟内将 50 万个句子分成 31.2 万个类别。去年 8 月,Facebook 将这一技术开源。


昨天,Facebook 人工智能研究院(FAIR)进一步拓展了 fastText 的应用范围,他们发布了支持 294 种语言的预训练矢量文件包,并配有两个快速入门教程,为学生、软件开发者和机器学习研究人员提供了更多支持。同时,随着 fastText 模型内存使用量的减少,它现在已经可以装进手机和树莓派这样的小型计算设备中了。


在小内存设备上的 fastText


为了让更多人和应用在移动端享受到 fastText 带来的便利,Facebook 本次推出的新版本降低了 fastText 模型的内存需求。基于早期版本 fastText 构建的模型通常需要几 G 的内存,而新版本只需要数百 Kb。


FAIR 团队的研究者们通过最近发布的 FAISS(一种用于高维度向量相似性搜索和聚类的开源库)压缩了 fastText 模型和内存使用量。对此,研究团队发表了一篇论文《FastText.zip: Compressing Text Classification Models》描述了两个研究项目的整合研究。


论文链接:https://arxiv.org/pdf/1612.03651.pdf


简单且最棒的文本分类器


fastText 旨在让开发者、研究者和学生们能够快速上手。它的速度特性可以让你快速迭代产品,并在没有专门硬件的情况下优化你的模型。fastText 模型可以在任何多核 CPU 上用不到几分钟的时间训练超过十亿单词,或在不到一分钟时间里将五十万个句子分类成几百到数千个类。







请到「今天看啥」查看全文


推荐文章
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20250607073911
15 小时前
架构师带你玩转AI  ·  好书推荐 -《深度学习:基础与概念》
23 小时前
阿尔法猎手  ·  【招聘】期待你的加入
8 年前
射手座网  ·  射手座今日运势2017年5月3日
8 年前
喵魂CATSOUL  ·  你猜我露点了没有?
8 年前
同道大叔  ·  十二星座谁最让人爱恨交加?
7 年前