专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
新智元  ·  谷歌Veo ... ·  昨天  
宝玉xp  ·  LLM 的 “思考”是靠输出 Token ... ·  昨天  
爱可可-爱生活  ·  晚安~ #晚安# -20250616225158 ·  昨天  
AI产品阿颖  ·  我感受到了程序员的新红利。 ·  2 天前  
51好读  ›  专栏  ›  黄建同学

olmOCR,将 PDF 和其他基于图像的文档格式转换为干净、可-20250610181159

黄建同学  · 微博  · AI  · 2025-06-10 18:11

正文

请到「今天看啥」查看全文


olmOCR,将 PDF 和其他基于图像的文档格式转换为干净、可读、纯文本格式的工具包。12K⭐

1. 将基于 PDF、PNG 和 JPEG 的文档转换为干净的 Markdown
2. 支持方程式、表格、手写和复杂格式
3. 自动删除页眉和页脚
4. 转换为具有自然阅读顺序的文本,即使存在图形、多列布局和插图
5. 高效,每转换一百万页的成本不到 200 美元

访问:github.com/allenai/olmocr

#人工智能#






请到「今天看啥」查看全文