快速开始#
配置好PDF-Extract-Kit环境,并下载好模型后,我们可以开始使用PDF-Extract-Kit了。
布局检测示例#
布局检测提供了多种模型: LayoutLMv3
、 YOLOv10
、 DocLayout-YOLO
, 相比与 LayoutLMv3
, YOLOv10
速度更快, DocLayout-YOLO
则是基于 YOLOv10
的基础上进行多样性文档预训练及模型优化,速度快,精度高。
1. 使用布局检测模型
$ python scripts/layout_detection.py --config configs/layout_detection.yaml
执行完之后,我们可以在 outpus/layout_detection
目录下查看检测结果。
备注
layout_detection.yaml
设置输入、输出及模型配置,布局检测更详细教程见布局检测算法 。
公式检测示例#
$ python scripts/formula_detection.py --config configs/formula_detection.yaml
执行完之后,我们可以在 outpus/formula_detection
目录下查看检测结果。
备注
formula_detection.yaml
设置输入、输出及模型配置,公式检测更详细教程见 公式检测算法 。