专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  【[2.4k星]Forge:AI增强型终端开 ... ·  昨天  
爱可可-爱生活  ·  [CL]《The Surprising ... ·  昨天  
爱可可-爱生活  ·  #听见微博# #微博声浪计划# ... ·  2 天前  
爱可可-爱生活  ·  从去年至今,Google在AI领域的追赶可谓 ... ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

今日 Paper | 人体图像生成和衣服虚拟试穿;鲁棒深度学习;图像风格迁移等

AI科技评论  · 公众号  · AI  · 2020-01-13 19:25

正文

请到「今天看啥」查看全文


双向门控递归单元网络的表格结构提取

论文名称:Table Structure Extraction with Bi-directional Gated Recurrent Unit Networks

作者:Khan Saqib Ali /Khalid Syed Muhammad Daniyal /Shahzad Muhammad Ali /Shafait Faisal

发表时间:2020/1/8

论文链接:https://paper.yanxishe.com/review/8614

推荐理由:这篇论文要解决的是表格结构识别的问题。

表向读者呈现了汇总的结构化信息,这使表结构提取成为理解应用程序的重要组成部分。但是,表结构的识别是一个难题,这不仅是因为表布局和样式的变化很大,而且还因为页面布局和噪声污染水平的变化。已经进行了很多研究来识别桌子的结构,其中大部分是基于借助光学字符识别(OCR)将启发式方法应用于桌子的手抓布局特征的。由于表布局的变化以及OCR产生的错误,这些方法无法很好地概括。

在本文中,作者提出了一种基于鲁棒深度学习的方法,可以从文档图像中的检测表中高精度提取行和列。在提出的解决方案中,首先对表格图像进行预处理,然后将其馈送到具有门控循环单元(GRU)的双向循环神经网络,然后是具有最大软激活的完全连接层。网络从上到下以及从左到右扫描图像,并将每个输入分类为行分隔符或列分隔符。作者已经在公开的UNLV以及ICDAR 2013数据集上对作者的系统进行了基准测试,在该数据集上,其性能远远超过了最新的表格结构提取系统。这篇论文在公开的UNLV和ICDAR 2013数据集上进行了实验,验证了所提出的方法显著优于当前该领域的最佳方案。







请到「今天看啥」查看全文