延春的技术站 延春的技术站
首页
  • 前端文章

    • JavaScript
  • 页面

    • HTML
    • CSS
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • 《Git》
    • TypeScript
    • JS设计模式总结
  • java
  • python
  • android
  • ois
  • 数据库
  • 中间件安装
  • Docker
  • Linux
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
收藏
  • 分类
  • 标签
  • 归档

会痛的石头

IT界小学生
首页
  • 前端文章

    • JavaScript
  • 页面

    • HTML
    • CSS
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • 《Git》
    • TypeScript
    • JS设计模式总结
  • java
  • python
  • android
  • ois
  • 数据库
  • 中间件安装
  • Docker
  • Linux
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
收藏
  • 分类
  • 标签
  • 归档
  • 中间件

  • Docker

  • Linux

  • 大模型

    • ubuntu安装vllm
      • 准备工作
        • 1、下载模型
        • 2、安装python
        • 3、安装vllm
        • 4、启动模型
        • 安装过程中出现的问题
    • ubuntu安装vllm(docker)
  • 运维
  • 大模型
quyanchun
2022-12-24

ubuntu安装vllm

# 准备工作

# 1、下载模型

下载模型 魔塔社区 (opens new window)

安装git

sudo apt update
apt install git
apt install git-lfs
git clone https://www.modelscope.cn/Qwen/Qwen2.5-3B-Instruct-GPTQ-Int4.git
1
2
3
4

# 2、安装python

apt install python3.11
1

注:Python 3.11 可能不会直接包含在某些旧版本的 Ubuntu 或 Debian 仓库中。如果你的系统仓库没有 Python 3.11,你可以通过添加官方的 deadsnakes PPA 来获得较新版本的 Python。

sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt update
1
2

python虚拟环境

 apt install python3.11-venv python3.11-dev
 apt install python3-pip
 python3.11 --version
1
2
3

如果你需要将 python 命令指向 Python 3.11,可以通过更新 alternatives 来实现:

sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.11 1
python3 --version
1
2

# 3、安装vllm

创建虚拟环境 
python3 -m venv venv
激活虚拟环境
source venv/bin/activate
下载源码
git clone https://github.com/vllm-project/vllm.git /home/ubuntu/vllm  
1
2
3
4
5
6

参考官方文档cpu安装方式 (opens new window)

cpu运行
--------------
#首先,安装推荐的编译器。我们建议使用 gcc/g++ >= 12.3.0 作为默认编译器,以避免潜在问题。例如,在 Ubuntu 22.4 上,你可以运行:
sudo apt-get update  -y
sudo apt-get install -y gcc-12 g++-12 libnuma-dev
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 10 --slave /usr/bin/g++ g++ /usr/bin/g++-12
--------------
#其次,安装用于 vLLM CPU 后端构建的 Python 包
pip install --upgrade pip
pip install wheel packaging ninja "setuptools>=49.4.0" numpy
pip install -v -r requirements-cpu.txt --extra-index-url https://download.pytorch.org/whl/cpu

--------------
#从源代码构建并安装 oneDNN 库:
git clone -b rls-v3.5 https://github.com/oneapi-src/oneDNN.git
cmake -B ./oneDNN/build -S ./oneDNN -G Ninja -DONEDNN_LIBRARY_TYPE=STATIC \
cmake --build ./oneDNN/build --target install --config Release
--------------
#构建并安装 vLLM CPU 后端
VLLM_TARGET_DEVICE=cpu python setup.py install

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

# 4、启动模型

export VLLM_CPU_KVCACHE_SPACE=10
export VLLM_CPU_OMP_THREADS_BIND=0-13
vllm serve /data/Qwen2.5-3B-Instruct-GPTQ-Int4 \
--port 8284 \
--served-model-name qwen2.5:3b 
1
2
3
4
5

# 安装过程中出现的问题

# 1、CMake
CMake Error at CMakeLists.txt:1 (cmake_minimum_required):
  CMake 3.26 or higher is required.  You are running version 3.22.1
1
2

手动安装 CMake

  1. 访问 CMake 的官方下载页面:https://cmake.org/download/

  2. 下载适合你系统的预编译二进制文件(例如 .tar.gz)。

  3. 解压并安装:

    tar -zxvf cmake-<version>-linux-x86_64.tar.gz
    sudo mv cmake-<version>-linux-x86_64 /opt/cmake
    sudo ln -s /opt/cmake/bin/cmake /usr/local/bin/cmake
    
    1
    2
    3
  4. 验证 CMake 安装:cmake --version

  5. 如果再虚拟环境中:

    export PATH=/opt/cmake/bin:$PATH
    cmake --version
    
    1
    2
# 2、pytorch
ERROR 12-25 10:31:55 engine.py:366] Please install intel_extension_for_pytorch>=2.5.0 via `pip install intel_extension_for_pytorch>=2.5.0` to use IPEX-AWQ linear method.
1

解决方式

pip install intel_extension_for_pytorch>=2.5.0
python -c "import intel_extension_for_pytorch"
1
2

然后重新执行方法

Centos7安装caddy 、xui
ubuntu安装vllm(docker)

← Centos7安装caddy 、xui ubuntu安装vllm(docker)→

最近更新
01
Centos7安装caddy 、xui
02-21
02
docker安装samba
09-04
03
docker安装openvpn
07-17
更多文章>
Theme by Vdoing | Copyright © 2021-2025 京ICP备2021033341号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式