专栏名称: StuQ
实践驱动的IT教育平台
目录
相关文章推荐
51好读  ›  专栏  ›  StuQ

京东618|看人工智能如何助力京东破千亿

StuQ  · 公众号  ·  · 2017-06-20 21:03

正文

请到「今天看啥」查看全文


上图中最右下角的格纹衬衫的扩展属性为纯色。该属性明显与商品图片不一致,错误的数据降低了搜索的准确率,但是增加了商品的曝光率。 为此,我们通过自然语言理解和图片识别技术来检测图文不一致现象,对错误数据进行修正和通知商家修改。

高精度的图像识别技术,从商品图片中识别商品主体并抽取商品的特征,为文本属性修正提供高置信度的参照。以衣服的颜色为例,描述衣服颜色的名词数不胜数,以红色为例,就有绯红、桃红、品红、鲜红等等。利用分词抽取,我们获取了近万个颜色字段。

很多颜色的区分度极小,即便肉眼也很难区分,对训练数据的收集带来了很大的困扰。同时由于光照拍摄的问题,如此细分的分类对训练的结果也不一定有益。为此,我们首先对于颜色属性进行归一化,划分出不到 20 个色系,其余的属性也按照类似方法进行归一化。在准备好训练数据后, 我们采用了 52 层 resnet 残差网络的finetuning 实现了多种图片特征 95%+ 的准备率模型。后续,我们会加入我们自己的卷积网络特征去提供准确率。

电商短文本理解 - 商品标题理解

商品的标题由采销人员和第三方商家命名,其中自营商品的命名较为规范。商家命名时,有些标题除了有文本描述矛盾外,还出现了大量词汇堆砌的情况。







请到「今天看啥」查看全文


推荐文章
梧桐树下V  ·  “无实际控制人”的认定及案例评析
8 年前
解螺旋  ·  分享 | 如何构建单克隆细胞群?
8 年前
VIKAN薇  ·  会享受的女人最好命!
8 年前