快速开始#

配置好PDF-Extract-Kit环境,并下载好模型后,我们可以开始使用PDF-Extract-Kit了。

布局检测示例#

布局检测提供了多种模型: LayoutLMv3YOLOv10DocLayout-YOLO, 相比与 LayoutLMv3YOLOv10 速度更快, DocLayout-YOLO 则是基于 YOLOv10 的基础上进行多样性文档预训练及模型优化,速度快,精度高。

1. 使用布局检测模型

$ python scripts/layout_detection.py --config configs/layout_detection.yaml

执行完之后,我们可以在 outpus/layout_detection 目录下查看检测结果。

备注

layout_detection.yaml 设置输入、输出及模型配置,布局检测更详细教程见布局检测算法

公式检测示例#

$ python scripts/formula_detection.py --config configs/formula_detection.yaml

执行完之后,我们可以在 outpus/formula_detection 目录下查看检测结果。

备注

formula_detection.yaml 设置输入、输出及模型配置,公式检测更详细教程见 公式检测算法