免费在线a视频-免费在线观看a视频-免费在线观看大片影视大全-免费在线观看的视频-色播丁香-色播基地

國(guó)產(chǎn)AI之光!DeepSeek本地部署教程,效果媲美GPT-4

:2025年02月04日 5ycode
分享到:

DeepSeek是一款無(wú)需魔法、零代碼、消費(fèi)級(jí)顯卡暢玩的推理型人工智能工具。它具有媲美GPT-4o32B版本的推理能力,以及接近GPT-4 Turbo全鏈路的國(guó)產(chǎn)化部署。

無(wú)需魔法|零代碼|消費(fèi)級(jí)顯卡暢玩

為什么選擇DeepSeek?

優(yōu)勢(shì)詳解
媲美GPT-4o
32B版本推理能力接近GPT-4 Turbo
全鏈路國(guó)產(chǎn)
完全規(guī)避國(guó)際禁令風(fēng)險(xiǎn),中文理解能力行業(yè)頂尖
極簡(jiǎn)部署
支持Ollama一鍵部署,3分鐘實(shí)現(xiàn)本地化
全規(guī)格覆蓋
1.5B到671B多種模型,手機(jī)/PC/服務(wù)器全場(chǎng)景適配
經(jīng)濟(jì)高效
8B模型在GTX 1060上流暢運(yùn)行,推理成本僅為GPT-4的1%

硬件配置指南(消費(fèi)級(jí)設(shè)備推薦)

模型
顯存需求
內(nèi)存需求
推薦顯卡
性價(jià)比方案
7B
10-12GB
16GB
RTX 3060
二手2060S(1500元檔)
14B
20-24GB
32GB
RTX 3090
雙卡2080Ti(3000元檔)
32B
40-48GB
64GB
RTX 4090
租賃云服務(wù)器(時(shí)薪7元)

實(shí)測(cè):RTX 3090可絲滑運(yùn)行30B模型

三步極速部署(Windows版)

相關(guān)的軟件,我已經(jīng)放入到網(wǎng)盤,網(wǎng)不好的同學(xué),可以直接下載。 下載鏈接:https://pan.quark.cn/s/b69829720b68

部署架構(gòu)

ollama 安裝

Ollama 是一個(gè)專注于本地化部署和運(yùn)行大型語(yǔ)言模型(LLM)的工具,旨在讓用戶能夠在自己的設(shè)備上高效地運(yùn)行和微調(diào)模型。

下載ollama

https://ollama.com/download/ 默認(rèn)為當(dāng)前電腦的對(duì)應(yīng)的版本,直接下載即可。下載以后,一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境變量設(shè)置安裝完以后先不要使用,先設(shè)置下環(huán)境變量。默認(rèn)模型下載到C盤。一個(gè)模型最小也得幾個(gè)GB 。

OLLAMA_HOST: 0.0.0.0

OLLAMA_MODELS:E:\ai\ollama\models

OLLAMA_HOST:設(shè)置為0.0.0.1 會(huì)將ollama服務(wù)暴露到所有的網(wǎng)絡(luò),默認(rèn)ollama只綁定到了127.0.0.1和localhost上了。 OLLAMA_MODELS:設(shè)置了模型的存放的地址。

驗(yàn)證

PS C:\Users\yxkong> ollama -v

ollama version is 0.4.0

ollama常用操作命令

#下載模型

ollama pull 模型名稱

ollama pull deepseek-r1:32b

#運(yùn)行模型,如果模型不存在,則下載

ollama run 模型名稱

ollama run deepseek-r1:32b

#查看已下載的模型

ollama list

#刪除本地已下載的模型

ollama rm 模型名稱

#查看模型的詳細(xì)信息

ollama show 模型名稱

deepseek-r1安裝

https://ollama.com/search 打開ollama官網(wǎng),點(diǎn)擊Models,可以搜索,目前deepseek最流行,排到了第一位。

除了671是真正的deepseek,其他的都是蒸餾的模型。

根據(jù)自己電腦的配置選擇對(duì)應(yīng)規(guī)格的模型,然后復(fù)制對(duì)應(yīng)的命令即可。

ollama run deepseek-r1:32b

慢慢等待即可。運(yùn)行效果8b的模型湊合能用、14b的模型基本能用,32b的模型使用很是順滑。 至此,deepseek的本地部署已經(jīng)完成。

chatbox

Chatbox 是一個(gè)開源的聊天界面工具,專門為大型語(yǔ)言模型(如 GPT、LLaMA 等)設(shè)計(jì),提供用戶友好的交互界面。

使用chatbox的優(yōu)勢(shì)

  • 交互簡(jiǎn)單

  • 預(yù)設(shè)prompt(我的搭檔)

  • 自定義模型服務(wù)方

  • 獨(dú)立代理

下載

下載以后一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境配置

  • 點(diǎn)擊設(shè)置

  • 選擇模型提供方

  • 選擇模型(本機(jī)地址默認(rèn)即可)

測(cè)試

很是順滑

性能加速方案(Ollama專用)

技術(shù)方案
適用場(chǎng)景
實(shí)現(xiàn)方法
預(yù)期收益
量化加速
低顯存設(shè)備
使用deepseek-r1:32b-q4_0模型
顯存占用降60%
多GPU支持
多卡設(shè)備
設(shè)置環(huán)境變量CUDA_VISIBLE_DEVICES
吞吐量翻倍
內(nèi)存優(yōu)化
長(zhǎng)文本對(duì)話
調(diào)整OLLAMA_MAX_MEMORY參數(shù)
內(nèi)存占用降40%

實(shí)操命令示例

# 使用量化模型(需先下載)

ollama run 模型-q4_0

# 多GPU支持(指定使用GPU 0和1)

ollama run deepseek-r1:32b

交互優(yōu)化技巧

界面增強(qiáng)方案

功能
實(shí)現(xiàn)方法
Markdown渲染
在問(wèn)題末尾添加\n請(qǐng)用markdown格式回答
對(duì)話流控制
輸入/retry重新生成回答  /forget清除對(duì)話歷史
語(yǔ)音輸入
使用Voice2Text插件
快捷鍵體系
Ctrl+Enter發(fā)送  Alt+↑調(diào)出歷史提問(wèn)

高級(jí)交互配置

# 創(chuàng)建~/.ollama/config.yaml

system_prompt: "你是一個(gè)精通科技知識(shí)的助手,回答請(qǐng)簡(jiǎn)明扼要,使用中文口語(yǔ)化表達(dá)"

temperature: 0.7  # 控制創(chuàng)造性(0-1)

max_length: 4096  # 最大生成長(zhǎng)度

常見問(wèn)題解決方案

問(wèn)題現(xiàn)象
解決方案
緊急程度
顯存不足報(bào)錯(cuò)
使用量化模型或換用更小模型
高危
響應(yīng)速度慢
設(shè)置環(huán)境變量OLLAMA_NUM_THREADS=8
生成內(nèi)容中斷
輸入/continue繼續(xù)生成
中文輸出夾雜英文
在提問(wèn)末尾添加「請(qǐng)使用純中文回答」
歷史記憶混亂
輸入/forget清除上下文

后記

個(gè)人小助手已經(jīng)搭建完成,大家的工作、生活問(wèn)題盡情的問(wèn)吧,不聯(lián)網(wǎng),隱私。大家可以關(guān)注下,后續(xù)基于deepseek我再搭建個(gè)知識(shí)庫(kù)分享給大家。

原文來(lái)源:https://mp.weixin.qq.com/s?__biz=MjM5NzQxMTAyNw==&mid=2247485191&idx=1&sn=6590bae7fb960a2577c2b77c11479080&scene=21#wechat_redirect

[我要糾錯(cuò)]
[編輯:宋聰喬 &發(fā)表于江蘇]
關(guān)鍵詞: 無(wú)需 魔法 代碼 消費(fèi) 顯卡

來(lái)源:本文內(nèi)容搜集或轉(zhuǎn)自各大網(wǎng)絡(luò)平臺(tái),并已注明來(lái)源、出處,如果轉(zhuǎn)載侵犯您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)聯(lián)系小編,我們會(huì)及時(shí)審核處理。
聲明:江蘇教育黃頁(yè)對(duì)文中觀點(diǎn)保持中立,對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或者完整性不提供任何明示或暗示的保證,不對(duì)文章觀點(diǎn)負(fù)責(zé),僅作分享之用,文章版權(quán)及插圖屬于原作者。

點(diǎn)個(gè)贊
0
踩一腳
0

您在閱讀:國(guó)產(chǎn)AI之光!DeepSeek本地部署教程,效果媲美GPT-4

Copyright©2013-2025 ?JSedu114 All Rights Reserved. 江蘇教育信息綜合發(fā)布查詢平臺(tái)保留所有權(quán)利

蘇公網(wǎng)安備32010402000125 蘇ICP備14051488號(hào)-3技術(shù)支持:南京博盛藍(lán)睿網(wǎng)絡(luò)科技有限公司

南京思必達(dá)教育科技有限公司版權(quán)所有   百度統(tǒng)計(jì)

主站蜘蛛池模板: 免费观看一级欧美在线视频 | 亚洲欧美日韩另类 | 日韩欧美视频在线 | 爆操网站 | 日韩精品无码一区二区三区 | 国产高清在线免费视频 | 国产精品亚洲一区二区在线观看 | 在线观看亚洲欧美 | 欧美任你躁免费精品一区 | 亚洲免费福利 | 亚洲欧美在线观看首页 | 老人与老人a级毛片视频 | 国产高清在线精品免费 | 久久99精品这里精品动漫6 | 免费播放国产一级 | 成人国产在线观看 | 成人观看免费观看视频 | 免费看羞羞视频网站 | 欧美精品xxxxbbbb | 欧美一级高清免费播放 | 日本国产美国日韩欧美mv | 午夜精品视频5000 | 国产成人精品久久亚洲高清不卡 | 中文字幕一区中文亚洲 | 亚洲人欧洲日韩 | 欧美整片第一页 | 日韩欧一级毛片在线播无遮挡 | 午夜欧美成人久久久久久 | 亚洲h在线观看 | 日批免费在线观看 | 九九99久久精品午夜剧场免费 | 九九精品在线播放 | 99re最新视频| 日本一区二区三区不卡在线看 | 青久在线 | jizz日 | 久草视频精品在线 | 日日视频 | 成人免费在线看片 | 欧美第一页草草影院 | 欧美一区二区在线观看视频 |
最熱文章
最新文章
  • 阿里云上云鉅惠,云產(chǎn)品享最低成本,有需要聯(lián)系,
  • 卡爾蔡司鏡片優(yōu)惠店,鏡片價(jià)格低
  • 蘋果原裝手機(jī)殼