如何下载模型文件

模型文件可以从Hugging Face 或 Model Scope 下载，由于网络原因，国内用户访问HF 可能会失败，请使用 ModelScope。

方法一：从 Hugging Face 下载模型

使用Git LFS 从Hugging Face下载模型文件

git lfs install # 安装 Git 大文件存储插件 (Git LFS) 
git lfs clone https://huggingface.co/opendatalab/PDF-Extract-Kit # 从 Hugging Face 下载 PDF-Extract-Kit 模型

方法二：从 ModelScope 下载模型

ModelScope 支持SDK或模型下载，任选一个即可。

Git lsf下载

SDK下载

1）利用Git lsf下载

git lfs install
git lfs clone https://www.modelscope.cn/opendatalab/PDF-Extract-Kit.git

2）利用SDK下载

# 首先安装modelscope
pip install modelscope

# 使用modelscope sdk下载模型
from modelscope import snapshot_download
model_dir = snapshot_download('opendatalab/PDF-Extract-Kit')
print(f"模型文件下载路径为：{model_dir}/models")

【❗️必须要做❗️】的额外步骤（模型下载完成后请务必完成以下操作）

1.检查模型目录是否下载完整

模型文件夹的结构如下，包含了不同组件的配置文件和权重文件：

./
├── Layout  # 布局检测模型
│   ├── config.json
│   └── model_final.pth
├── MFD  # 公式检测
│   └── weights.pt
├── MFR  # 公式识别模型
│   └── UniMERNet
│       ├── config.json
│       ├── preprocessor_config.json
│       ├── pytorch_model.bin
│       ├── README.md
│       ├── tokenizer_config.json
│       └── tokenizer.json
│── TabRec # 表格识别模型
│   └─StructEqTable
│       ├── config.json
│       ├── generation_config.json
│       ├── model.safetensors
│       ├── preprocessor_config.json
│       ├── special_tokens_map.json
│       ├── spiece.model
│       ├── tokenizer.json
│       └── tokenizer_config.json 
│   └─ TableMaster 
│       └─ ch_PP-OCRv3_det_infer
│           ├── inference.pdiparams
│           ├── inference.pdiparams.info
│           └── inference.pdmodel
│       └─ ch_PP-OCRv3_rec_infer
│           ├── inference.pdiparams
│           ├── inference.pdiparams.info
│           └── inference.pdmodel
│       └─ table_structure_tablemaster_infer
│           ├── inference.pdiparams
│           ├── inference.pdiparams.info
│           └── inference.pdmodel
│       ├── ppocr_keys_v1.txt
│       └── table_master_structure_dict.txt
└── README.md

2.检查模型文件是否下载完整

请检查目录下的模型文件大小与网页上描述是否一致，如果可以的话，最好通过sha256校验模型是否下载完整

3.移动模型到固态硬盘

将 'models' 目录移动到具有较大磁盘空间的目录中，最好是在固态硬盘(SSD)上。此外在 ~/magic-pdf.json里修改模型的目录指向最终的模型存放位置，否则会报模型无法加载的错误。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

how_to_download_models_zh_cn.md

how_to_download_models_zh_cn.md

如何下载模型文件

方法一：从 Hugging Face 下载模型

方法二：从 ModelScope 下载模型

1）利用Git lsf下载

2）利用SDK下载

【❗️必须要做❗️】的额外步骤（模型下载完成后请务必完成以下操作）

1.检查模型目录是否下载完整

2.检查模型文件是否下载完整

3.移动模型到固态硬盘

Files

how_to_download_models_zh_cn.md

Latest commit

History

how_to_download_models_zh_cn.md

File metadata and controls

如何下载模型文件

方法一：从 Hugging Face 下载模型

方法二：从 ModelScope 下载模型

1）利用Git lsf下载

2）利用SDK下载

【❗️必须要做❗️】的额外步骤（模型下载完成后请务必完成以下操作）

1.检查模型目录是否下载完整

2.检查模型文件是否下载完整

3.移动模型到固态硬盘