链载Ai

标题: 【文档智能 [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 【文档智能

今天是2024年9月11日,星期三,北京,天气阴

我们来看两个工作,一个是PdfTable工具包:深度学习在表格提取中的统一应用,另一个是大模型偏好学习综述。

这两个方案都很有趣,对于理解一些技术细节,供大家一起参考并思考。

一、PdfTable工具包用于表格提取

《PdfTable: A Unified Toolkit for Deep Learning-Based Table Extraction》(https://arxiv.org/pdf/2409.05125,代码:https://github.com/CycloneBoy/pdf_table,注注意,代码仓库还是空的)介绍了一个名为PdfTable的统一工具包,用于从PDF文件和图像中提取表格信息。

该工具包集成了多个开源模型,能够适应不同的应用场景,如处理有线表格、无线表格、数字PDF和图像PDF等。

1、 PdfTable库的设计和实现

PdfTable 由四个主要模块组成,包括布局分析、表格结构识别、文本检测与识别以及应用模块。

处理流程包括输入预处理、布局分析、表格结构识别、文本提取和应用。

2、表格解析流水线(PdfTable Parse Pipeline)

  1. 输入预处理(Input Preprocessing)






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5