國(guó)產(chǎn)AI之光！DeepSeek本地部署教程，效果媲美GPT-4

：2025年02月04日：5ycode

分享到：

DeepSeek是一款無(wú)需魔法、零代碼、消費(fèi)級(jí)顯卡暢玩的推理型人工智能工具。它具有媲美GPT-4o32B版本的推理能力，以及接近GPT-4 Turbo全鏈路的國(guó)產(chǎn)化部署。

無(wú)需魔法｜零代碼｜消費(fèi)級(jí)顯卡暢玩

為什么選擇DeepSeek？

優(yōu)勢(shì)	詳解
媲美GPT-4o	32B版本推理能力接近GPT-4 Turbo
全鏈路國(guó)產(chǎn)	完全規(guī)避國(guó)際禁令風(fēng)險(xiǎn)，中文理解能力行業(yè)頂尖
極簡(jiǎn)部署	支持Ollama一鍵部署，3分鐘實(shí)現(xiàn)本地化
全規(guī)格覆蓋	1.5B到671B多種模型，手機(jī)/PC/服務(wù)器全場(chǎng)景適配
經(jīng)濟(jì)高效	8B模型在GTX 1060上流暢運(yùn)行，推理成本僅為GPT-4的1%

硬件配置指南（消費(fèi)級(jí)設(shè)備推薦）

模型	顯存需求	內(nèi)存需求	推薦顯卡	性價(jià)比方案
7B	10-12GB	16GB	RTX 3060	二手2060S（1500元檔）
14B	20-24GB	32GB	RTX 3090	雙卡2080Ti（3000元檔）
32B	40-48GB	64GB	RTX 4090	租賃云服務(wù)器（時(shí)薪7元）

實(shí)測(cè)：RTX 3090可絲滑運(yùn)行30B模型

三步極速部署（Windows版）

相關(guān)的軟件，我已經(jīng)放入到網(wǎng)盤，網(wǎng)不好的同學(xué)，可以直接下載。下載鏈接：https://pan.quark.cn/s/b69829720b68

部署架構(gòu)

ollama 安裝

Ollama 是一個(gè)專注于本地化部署和運(yùn)行大型語(yǔ)言模型（LLM）的工具，旨在讓用戶能夠在自己的設(shè)備上高效地運(yùn)行和微調(diào)模型。

下載ollama

https://ollama.com/download/ 默認(rèn)為當(dāng)前電腦的對(duì)應(yīng)的版本，直接下載即可。下載以后，一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境變量設(shè)置安裝完以后先不要使用，先設(shè)置下環(huán)境變量。默認(rèn)模型下載到C盤。一個(gè)模型最小也得幾個(gè)GB 。

OLLAMA_HOST: 0.0.0.0

OLLAMA_MODELS：E:\ai\ollama\models

OLLAMA_HOST：設(shè)置為0.0.0.1 會(huì)將ollama服務(wù)暴露到所有的網(wǎng)絡(luò)，默認(rèn)ollama只綁定到了127.0.0.1和localhost上了。 OLLAMA_MODELS：設(shè)置了模型的存放的地址。

驗(yàn)證

PS C:\Users\yxkong> ollama -v

ollama version is 0.4.0

ollama常用操作命令

#下載模型

ollama pull 模型名稱

ollama pull deepseek-r1:32b

#運(yùn)行模型，如果模型不存在，則下載

ollama run 模型名稱

ollama run deepseek-r1:32b

#查看已下載的模型

ollama list

#刪除本地已下載的模型

ollama rm 模型名稱

#查看模型的詳細(xì)信息

ollama show 模型名稱

deepseek-r1安裝

https://ollama.com/search 打開ollama官網(wǎng)，點(diǎn)擊Models,可以搜索，目前deepseek最流行，排到了第一位。

除了671是真正的deepseek，其他的都是蒸餾的模型。

根據(jù)自己電腦的配置選擇對(duì)應(yīng)規(guī)格的模型，然后復(fù)制對(duì)應(yīng)的命令即可。

ollama run deepseek-r1:32b

慢慢等待即可。運(yùn)行效果8b的模型湊合能用、14b的模型基本能用，32b的模型使用很是順滑。至此，deepseek的本地部署已經(jīng)完成。

chatbox

Chatbox 是一個(gè)開源的聊天界面工具，專門為大型語(yǔ)言模型（如 GPT、LLaMA 等）設(shè)計(jì)，提供用戶友好的交互界面。

使用chatbox的優(yōu)勢(shì)

交互簡(jiǎn)單
預(yù)設(shè)prompt（我的搭檔）
自定義模型服務(wù)方
獨(dú)立代理

下載

下載以后一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境配置

點(diǎn)擊設(shè)置
選擇模型提供方
選擇模型（本機(jī)地址默認(rèn)即可）

測(cè)試

很是順滑

性能加速方案（Ollama專用）

技術(shù)方案	適用場(chǎng)景	實(shí)現(xiàn)方法	預(yù)期收益
量化加速	低顯存設(shè)備	使用`deepseek-r1:32b-q4_0`模型	顯存占用降60%
多GPU支持	多卡設(shè)備	設(shè)置環(huán)境變量`CUDA_VISIBLE_DEVICES`	吞吐量翻倍
內(nèi)存優(yōu)化	長(zhǎng)文本對(duì)話	調(diào)整`OLLAMA_MAX_MEMORY`參數(shù)	內(nèi)存占用降40%

實(shí)操命令示例

# 使用量化模型（需先下載）

ollama run 模型-q4_0

# 多GPU支持（指定使用GPU 0和1）

ollama run deepseek-r1:32b

交互優(yōu)化技巧

界面增強(qiáng)方案

功能	實(shí)現(xiàn)方法
Markdown渲染	在問(wèn)題末尾添加`\n請(qǐng)用markdown格式回答`
對(duì)話流控制	輸入`/retry`重新生成回答 `/forget`清除對(duì)話歷史
語(yǔ)音輸入	使用Voice2Text插件
快捷鍵體系	Ctrl+Enter發(fā)送 Alt+↑調(diào)出歷史提問(wèn)

高級(jí)交互配置

# 創(chuàng)建~/.ollama/config.yaml

system_prompt: "你是一個(gè)精通科技知識(shí)的助手，回答請(qǐng)簡(jiǎn)明扼要，使用中文口語(yǔ)化表達(dá)"

temperature: 0.7 # 控制創(chuàng)造性（0-1）

max_length: 4096 # 最大生成長(zhǎng)度

常見問(wèn)題解決方案

問(wèn)題現(xiàn)象	解決方案	緊急程度
顯存不足報(bào)錯(cuò)	使用量化模型或換用更小模型	高危
響應(yīng)速度慢	設(shè)置環(huán)境變量`OLLAMA_NUM_THREADS=8`	中
生成內(nèi)容中斷	輸入`/continue`繼續(xù)生成	低
中文輸出夾雜英文	在提問(wèn)末尾添加「請(qǐng)使用純中文回答」	中
歷史記憶混亂	輸入`/forget`清除上下文	低

后記

個(gè)人小助手已經(jīng)搭建完成，大家的工作、生活問(wèn)題盡情的問(wèn)吧，不聯(lián)網(wǎng)，隱私。大家可以關(guān)注下，后續(xù)基于deepseek我再搭建個(gè)知識(shí)庫(kù)分享給大家。

原文來(lái)源：https://mp.weixin.qq.com/s?__biz=MjM5NzQxMTAyNw==&mid=2247485191&idx=1&sn=6590bae7fb960a2577c2b77c11479080&scene=21#wechat_redirect

[我要糾錯(cuò)]

[編輯：宋聰喬 &發(fā)表于江蘇]

關(guān)鍵詞：無(wú)需魔法代碼消費(fèi) 顯卡

來(lái)源：本文內(nèi)容搜集或轉(zhuǎn)自各大網(wǎng)絡(luò)平臺(tái)，并已注明來(lái)源、出處，如果轉(zhuǎn)載侵犯您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)聯(lián)系小編，我們會(huì)及時(shí)審核處理。
聲明：江蘇教育黃頁(yè)對(duì)文中觀點(diǎn)保持中立，對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或者完整性不提供任何明示或暗示的保證，不對(duì)文章觀點(diǎn)負(fù)責(zé)，僅作分享之用，文章版權(quán)及插圖屬于原作者。

點(diǎn)個(gè)贊

踩一腳

上一篇教師悅讀成長(zhǎng)計(jì)劃｜王亞萍：真情關(guān)愛，做有溫度的鄉(xiāng)村...

下一篇該如何看待農(nóng)村出現(xiàn)新“讀書無(wú)用論”？