笔记本780M部署deepseek-r1指北

笔记本780M部署deepseek-r1指北

  1. 目录

    1. 安装 ROCm,ollama,Page Assist
      1. 下载安装AMD HIP SDK
      2. 替换编译文件
      3. 安装ollama-for-amd
      4. 安装deepseek-r1
      5. 安装Page Assist扩展
    2. 参考文献

1. 安装 ROCm,ollama,Page Assist

1. 下载安装AMD HIP SDK

进入AMD官网,下载AMD HIP SDK for Windows并安装(目前2025年2月8日,为6.2.4版本)

特殊说明
由于780M不在支持列表内,需自行编译或使用第三方编译的rocBLAS


2. 替换编译文件

使用编译文件包:rocm.gfx1103.AMD.780M.phoenix.V5.0.for.hip.sdk.6.2.4

操作步骤:

  1. 在文件管理器中输入 %HIP_PATH%
  2. 重命名原文件:
    • %HIP_PATH%/bin/rocblas.dllrocblas.dllbak
    • %HIP_PATH%/bin/rocblas/librarylibrarybak
  3. 将编译好的 rocblas.dllrocblas\library 复制到对应位置

3. 安装ollama-for-amd

  1. 下载ollama-for-amd并安装
  2. 验证安装:
1
ollama

安装验证截图


4. 安装deepseek-r1

  1. 访问模型页面:deepseek-r1
  2. 选择合适版本并执行下载命令:
1
ollama run deepseek-r1:8b

模型下载截图

注意

  • 下载卡顿时可按 Ctrl + C 中断后重试
  • 出现 >>> Send a message (/? for help) 表示安装成功
  • 输入 /bye 退出对话

5. 安装Page Assist扩展

  1. 通过Chrome应用商店安装:Page Assist
  2. 安装后通过扩展界面进行对话:
    扩展界面截图

可选配置

增强RAG能力

1
ollama run nomic-embed-text

在网页设置 → RAG设置 → 文本嵌入模型勾选并保存


常见问题

  1. 显存不足报错

    1
    Ollama call failed with status code 500: llama runner process has terminated: error loading model: unable to allocate ROCm0 buffer
  2. 内存不足报错

    1
    Error: modeI requires more system memory (10.7 GiB) than is available (10.3 GiB)

    解决方案:

    • BIOS调整显存分配
    • 更换更低显存需求的模型(使用 ollama rm 模型名 删除旧模型)

性能对比

配置方式 平均Tokens/s
直接安装Ollama 5.14
本方案 12.05

参考文献

  1. 在Ollama上启用amd780m(gfx1103)GPU加速
  2. B站部署教程视频