专栏名称: 数盟
数盟(数据科学家联盟)隶属于北京数盟科技有限公司,数盟致力于成为培养与发现“数据科学家”的黄埔军校。 数盟服务包括:线下活动、大数据培训。 官网:http://dataunion.org,合作:[email protected]
目录
相关文章推荐
CDA数据分析师  ·  从高考志愿到AI模型调参:数据思维下的“最优 ... ·  14 小时前  
阿里云大数据AI平台  ·  从MaxCompute到Milvus:通过D ... ·  2 天前  
阿里云大数据AI平台  ·  从MaxCompute到Milvus:通过D ... ·  2 天前  
51好读  ›  专栏  ›  数盟

除了自然语言处理,你还可以用词嵌入(Word2Vec)做这个

数盟  · 公众号  · 大数据  · 2017-08-07 22:00

正文

请到「今天看啥」查看全文


因此,如果你选择了 Skip-Gram 方法,Word2Vec 就会使用一个浅层的神经网络,也就是说,用一个只具有一个隐藏层的神经网络来学习词嵌入。网络首先会随机地初始化它的权重,然后使用单词来预测它的语境,在最小化它所犯错误的训练过程中去迭代调整这些权重。有望在一个比较成功的训练过程之后,能够通过网络权重矩阵和单词的 one-hot 向量的乘积来得到每一个单词的词向量。

注意:除了能够允许将文本数据进行数字表征之外,结果性嵌入还学习到了单词之间的而一些有趣的关系,可以被用来回答类似于下面的这种问题:国王之于王后,正如父亲之于……?

如果你想了解更多的关于 Word2Vec 的细节知识,你可以看一下斯坦福大学的课程(https://www.youtube.com/watch?v=ERibwqs9p38),

或者 TensorFlow 的相关教程

(https://www.tensorflow.org/tutorials/word2vec)。

应用







请到「今天看啥」查看全文