Spaces:

SFEREWQW
/

114514

Runtime error

114514 / docs /zh_cn /get_started /installation.rst

Upload 395 files

18e4106 verified 21 days ago

1.15 kB

	==================================
	安装
	==================================

	本节中，我们将演示如何安装 PDF-Extract-Kit。

	最佳实践
	========

	我们推荐用户参照我们的最佳实践安装 PDF-Extract-Kit。
	推荐使用 Python-3.10 的 conda 虚拟环境安装 PDF-Extract-Kit。

	步骤 1. 使用 conda 先构建一个 Python-3.10 的虚拟环境

	.. code-block:: console

	$ conda create -n pdf-extract-kit-1.0 python=3.10 -y
	$ conda activate pdf-extract-kit-1.0

	步骤 2. 安装 PDF-Extract-Kit 的依赖项

	.. code-block:: console

	$ # 对于GPU设备
	$ pip install -r requirements.txt
	$ # 对于CPU设备
	$ pip install -r requirements-cpu.txt

	.. note::

	考虑到用户环境配置的便捷性，我们在requirements.txt只包含当前最好模型需要的环境，目前包含

	- 布局检测：YOLO系列（YOLOv10, DocLayout-YOLO）
	- 公式检测：YOLO系列 (YOLOv8)
	- 公式识别：UniMERNet
	- OCR： PaddleOCR

	对于其他模型请，如LayoutLMv3需要单独安装环境，具体见\ :ref:`布局检测算法 <algorithm_layout_detection>`