笔记本780M部署deepseek-r1指北

笔记本780M部署deepseek-r1指北
pcfx笔记本780M部署deepseek-r1指北
1. 安装 ROCm,ollama,Page Assist
1. 下载安装AMD HIP SDK
进入AMD官网,下载AMD HIP SDK for Windows并安装(目前2025年2月8日,为6.2.4版本)
特殊说明
由于780M不在支持列表内,需自行编译或使用第三方编译的rocBLAS:
- 自行编译:Windows下编译rocBLAS指南
- 第三方编译版本:ROCmLibs-for-gfx1103
2. 替换编译文件
使用编译文件包:rocm.gfx1103.AMD.780M.phoenix.V5.0.for.hip.sdk.6.2.4
操作步骤:
- 在文件管理器中输入
%HIP_PATH%
- 重命名原文件:
%HIP_PATH%/bin/rocblas.dll
→rocblas.dllbak
%HIP_PATH%/bin/rocblas/library
→librarybak
- 将编译好的
rocblas.dll
和rocblas\library
复制到对应位置
3. 安装ollama-for-amd
- 下载ollama-for-amd并安装
- 验证安装:
1 | ollama |
4. 安装deepseek-r1
- 访问模型页面:deepseek-r1
- 选择合适版本并执行下载命令:
1 | ollama run deepseek-r1:8b |
注意
- 下载卡顿时可按
Ctrl + C
中断后重试- 出现
>>> Send a message (/? for help)
表示安装成功- 输入
/bye
退出对话
5. 安装Page Assist扩展
- 通过Chrome应用商店安装:Page Assist
- 安装后通过扩展界面进行对话:
可选配置
增强RAG能力
1 | ollama run nomic-embed-text |
在网页设置 → RAG设置 → 文本嵌入模型勾选并保存
常见问题
显存不足报错:
1
Ollama call failed with status code 500: llama runner process has terminated: error loading model: unable to allocate ROCm0 buffer
内存不足报错:
1
Error: modeI requires more system memory (10.7 GiB) than is available (10.3 GiB)
解决方案:
- BIOS调整显存分配
- 更换更低显存需求的模型(使用
ollama rm 模型名
删除旧模型)
性能对比
配置方式 | 平均Tokens/s |
---|---|
直接安装Ollama | 5.14 |
本方案 | 12.05 |