---
title: 如何让Ollama使用GPU运行LLM模型
date: 2024-05-09 11:40:36
tags: [Hexo, Keep]
categories: [Hexo]
---


说明：以 GPU 模式运行 Ollama 需要有 NVIDIA 显卡支持。

# 1. 安装英伟达容器安装包

我们以 Ubuntu22.04 为例（其他系统请参考：[英伟达官方文档](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/arch-overview.html)）

- 配置apt源
```
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
```
- 更新源
```
sudo apt-get update
```
- 安装工具包
```
sudo apt-get install -y nvidia-container-toolkit
```
# 2. 使用 GPU 运行 Ollama
```
docker run --gpus all -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
```
# 3. 使用 Ollama 下载模型
```
docker exec -it ollama ollama run qwen:7b
```
# 4. 在 MaxKB 的模型设置中添加模型进行对接
<img width="800px" alt="image" src="https://github.com/1Panel-dev/MaxKB/assets/52996290/f9e9d41c-cd8d-4bba-af92-ec9c9ed85144">