DeepSeek OCR 2 运行记录

DeepSeek-OCR-2

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
root@Jiang:/home/jj/DeepSeek-OCR-2# su - jj
(base) jj@Jiang:~$ conda env liost
usage: conda env [-h] command ...
conda env: error: argument command: invalid choice: 'liost' (choose from config, create, export, list, remove, update)
(base) jj@Jiang:~$ conda env list

# conda environments:
#
# * -> active
# + -> frozen
base                 *   /home/jj/miniconda3
deepseek-ocr2            /home/jj/miniconda3/envs/deepseek-ocr2
deepseek-stable          /home/jj/miniconda3/envs/deepseek-stable
math-video               /home/jj/miniconda3/envs/math-video

(base) jj@Jiang:~$ conda activate deepseek-stable
(deepseek-stable) jj@Jiang:~$ ls
DeepSeek-OCR-2  RL  math_video_solver  miniconda3  openclaw
(deepseek-stable) jj@Jiang:~$ cd DeepSeek-OCR-2/
(deepseek-stable) jj@Jiang:~/DeepSeek-OCR-2$ ls
DeepSeek-OCR2-master     README.md                   data              testtransfer.py
DeepSeek_OCR2_paper.pdf  assets                      requirements.txt  vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
LICENSE.txt              cuda-keyring_1.1-1_all.deb  test.py           vllm-0.8.5+cu121-cp38-abi3-manylinux1_x86_64.whl
(deepseek-stable) jj@Jiang:~/DeepSeek-OCR-2$ python video_math_solver_final.py videos/4.mp
 *  History restored 

root@Jiang:/home/jj/DeepSeek-OCR-2# *
DeepSeek-OCR2-master: command not found
root@Jiang:/home/jj/DeepSeek-OCR-2# 

Our environment is cuda11.8+torch2.6.0.

Clone this repository and navigate to the DeepSeek-OCR-2 folder

git clone https://github.com/deepseek-ai/DeepSeek-OCR-2.git

Conda

conda create -n deepseek-ocr2 python=3.12.9 -y
conda activate deepseek-ocr2

Packages

download the vllm-0.8.5 whl

wget https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl

cu118

cu1215060

# The current PyTorch install supports CUDA capabilities sm_50 sm_60 sm_70 sm_75 sm_80 sm_86 sm_37 sm_90.

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://mirrors.tuna.tsinghua.edu.cn/simple
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://mirror.sjtu.edu.cn/pytorch-wheels/cu118
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://mirrors.aliyun.com/pypi/simple/

pip install vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
pip install -r requirements.txt --index-url https://mirrors.aliyun.com/pypi/simple/

#如果没有whl 要安装这个
#pip install psutil
#pip install cmake 
#sudo apt-get install -y build-essential cmake ninja-build
pip install flash-attn==2.7.3 --no-build-isolation

Note: if you want vLLM and transformers codes to run in the same environment, you don’t need to worry about this installation error like: vllm 0.8.5+cu118 requires transformers>=4.51.1

第二步：确认系统级 CUDA 开发工具（重要）

nvcc --version
gcc --version
nvidia-smi

添加 NVIDIA 仓库密钥和源 (如果之前没加过)：

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update

(注：如果你用的是 Ubuntu 20.04，将上面的 ubuntu2204 改为 ubuntu2004)

安装 CUDA 11.8 Toolkit：我们只需要安装 cuda-toolkit-11-8，不需要安装巨大的驱动包（WSL 通常共用 Windows 的驱动）。
```
sudo apt-get install -y cuda-toolkit-11-8
sudo apt-get install -y cuda-toolkit-12-4
```
这一步可能需要几分钟，它会安装 nvcc 编译器。
如果输出了版本号（例如 Cuda compilation tools, release 11.8...），说明成功了。

第二步：设置环境变量

即使安装了工具，Python 编译脚本有时也找不到路径，需要手动指定 CUDA_HOME。

临时设置（当前终端有效）：
```
export CUDA_HOME=/usr/local/cuda-11.8
export PATH=$CUDA_HOME/bin:$PATH

export CUDA_HOME=/usr/local/cuda-12.4
export PATH=$CUDA_HOME/bin:$PATH
```
(如果 /usr/local/cuda-11.8 不存在，尝试 ls /usr/local/ 看看 cuda 具体安装在哪个文件夹，通常是 cuda-11.8 或 cuda)

永久设置（推荐）：为了避免每次打开终端都要输入，将其写入 ~/.bashrc：

echo 'export CUDA_HOME=/usr/local/cuda-11.8' >> ~/.bashrc
echo 'export PATH=$CUDA_HOME/bin:$PATH' >> ~/.bashrc
source ~/.bashrc

echo 'export CUDA_HOME=/usr/local/cuda-12.4' >> ~/.bashrc
echo 'export PATH=$CUDA_HOME/bin:$PATH' >> ~/.bashrc
source ~/.bashrc

验证安装：安装完成后，检查 nvcc 是否可用：
```
nvcc --version
gcc --version
nvidia-smi
```

修改config.py

(deepseek-ocr2) gpu@9gpu-com:~/Downloads/DeepSeek-OCR-2$ python3 -c “import torch; print(f’PyTorch Version: {torch.version}’); print(f’CUDA Available: {torch.cuda.is_available()}’); print(f’GPU Name: {torch.cuda.get_device_name(0)}’)” PyTorch Version: 2.6.0+cu124 CUDA Available: True GPU Name: NVIDIA GeForce RTX 3090

vLLM-Inference

VLLM:

Note: change the INPUT_PATH/OUTPUT_PATH and other settings in the DeepSeek-OCR2-master/DeepSeek-OCR2-vllm/config.py

cd DeepSeek-OCR2-master/DeepSeek-OCR2-vllm

image: streaming output

python run_dpsk_ocr2_image.py

pdf: concurrency (on-par speed with DeepSeek-OCR)

python run_dpsk_ocr2_pdf.py

batch eval for benchmarks (i.e., OmniDocBench v1.5)

python run_dpsk_ocr2_eval_batch.py

XAIZAI DEB sudo apt install -y ./Clash.Verge_2.4.6_amd64.deb

XIAZAIGIT sudo apt install git

conda

下载最新版的 Miniconda 安装脚本我们使用清华大学的镜像源，速度快且稳定。 (注：以下命令会下载最新的 Python 3.x 版本 Miniconda) bash

cd ~

使用 wget 下载 (如果 wget 不可用，请先尝试 apt install wget，若 apt 仍报错则用 curl)

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh -O Miniconda3-latest-Linux-x86_64.sh

如果 wget 也报错，请改用 curl:

curl -O https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

验证文件完整性（可选但推荐）确保下载的文件没有损坏： bash

sha256sum Miniconda3-latest-Linux-x86_64.sh

(您可以去清华源网页核对一下输出的哈希值，通常只要下载过程没报错，大概率是好的) 3. 运行安装脚本 bash

bash Miniconda3-latest-Linux-x86_64.sh

安装过程中的交互提示：

许可协议：出现 Do you accept the license terms? [yes|no] 时，输入 yes 并回车。
安装路径：出现 Installation path [/home/gpu/miniconda3] 时：
    直接回车使用默认路径（推荐：/home/gpu/miniconda3）。
    或者输入自定义路径（确保该用户有写入权限）。
初始化 Conda：出现 Do you wish the installer to initialize Miniconda3 by running conda init? [yes|no] 时，务必输入 yes 并回车。
    这一步会自动修改您的 ~/.bashrc 文件，让您在任何终端都能使用 conda 命令。

激活环境安装完成后，让配置立即生效： bash

source ~/.bashrc

验证安装输入以下命令，如果出现版本号且没有报错，说明安装成功： bash

conda –version

输出示例：conda 24.x.x ⚙️ 后续优化：配置 Conda 使用清华源为了避免以后 conda install 包时速度慢或连接超时，建议将 conda 的默认源也改为清华镜像： bash

添加清华源

conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main

conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r

conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge

显示源地址（确认是否添加成功）

conda config –show channels

💡 常见问题排查

conda –version