免费在线a视频-免费在线观看a视频-免费在线观看大片影视大全-免费在线观看的视频-色播丁香-色播基地

國(guó)產(chǎn)AI之光!DeepSeek本地部署教程,效果媲美GPT-4

:2025年02月04日 5ycode
分享到:

DeepSeek是一款無(wú)需魔法、零代碼、消費(fèi)級(jí)顯卡暢玩的推理型人工智能工具。它具有媲美GPT-4o32B版本的推理能力,以及接近GPT-4 Turbo全鏈路的國(guó)產(chǎn)化部署。

無(wú)需魔法|零代碼|消費(fèi)級(jí)顯卡暢玩

為什么選擇DeepSeek?

優(yōu)勢(shì)詳解
媲美GPT-4o
32B版本推理能力接近GPT-4 Turbo
全鏈路國(guó)產(chǎn)
完全規(guī)避?chē)?guó)際禁令風(fēng)險(xiǎn),中文理解能力行業(yè)頂尖
極簡(jiǎn)部署
支持Ollama一鍵部署,3分鐘實(shí)現(xiàn)本地化
全規(guī)格覆蓋
1.5B到671B多種模型,手機(jī)/PC/服務(wù)器全場(chǎng)景適配
經(jīng)濟(jì)高效
8B模型在GTX 1060上流暢運(yùn)行,推理成本僅為GPT-4的1%

硬件配置指南(消費(fèi)級(jí)設(shè)備推薦)

模型
顯存需求
內(nèi)存需求
推薦顯卡
性?xún)r(jià)比方案
7B
10-12GB
16GB
RTX 3060
二手2060S(1500元檔)
14B
20-24GB
32GB
RTX 3090
雙卡2080Ti(3000元檔)
32B
40-48GB
64GB
RTX 4090
租賃云服務(wù)器(時(shí)薪7元)

實(shí)測(cè):RTX 3090可絲滑運(yùn)行30B模型

三步極速部署(Windows版)

相關(guān)的軟件,我已經(jīng)放入到網(wǎng)盤(pán),網(wǎng)不好的同學(xué),可以直接下載。 下載鏈接:https://pan.quark.cn/s/b69829720b68

部署架構(gòu)

ollama 安裝

Ollama 是一個(gè)專(zhuān)注于本地化部署和運(yùn)行大型語(yǔ)言模型(LLM)的工具,旨在讓用戶(hù)能夠在自己的設(shè)備上高效地運(yùn)行和微調(diào)模型。

下載ollama

https://ollama.com/download/ 默認(rèn)為當(dāng)前電腦的對(duì)應(yīng)的版本,直接下載即可。下載以后,一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境變量設(shè)置安裝完以后先不要使用,先設(shè)置下環(huán)境變量。默認(rèn)模型下載到C盤(pán)。一個(gè)模型最小也得幾個(gè)GB 。

OLLAMA_HOST: 0.0.0.0

OLLAMA_MODELS:E:\ai\ollama\models

OLLAMA_HOST:設(shè)置為0.0.0.1 會(huì)將ollama服務(wù)暴露到所有的網(wǎng)絡(luò),默認(rèn)ollama只綁定到了127.0.0.1和localhost上了。 OLLAMA_MODELS:設(shè)置了模型的存放的地址。

驗(yàn)證

PS C:\Users\yxkong> ollama -v

ollama version is 0.4.0

ollama常用操作命令

#下載模型

ollama pull 模型名稱(chēng)

ollama pull deepseek-r1:32b

#運(yùn)行模型,如果模型不存在,則下載

ollama run 模型名稱(chēng)

ollama run deepseek-r1:32b

#查看已下載的模型

ollama list

#刪除本地已下載的模型

ollama rm 模型名稱(chēng)

#查看模型的詳細(xì)信息

ollama show 模型名稱(chēng)

deepseek-r1安裝

https://ollama.com/search 打開(kāi)ollama官網(wǎng),點(diǎn)擊Models,可以搜索,目前deepseek最流行,排到了第一位。

除了671是真正的deepseek,其他的都是蒸餾的模型。

根據(jù)自己電腦的配置選擇對(duì)應(yīng)規(guī)格的模型,然后復(fù)制對(duì)應(yīng)的命令即可。

ollama run deepseek-r1:32b

慢慢等待即可。運(yùn)行效果8b的模型湊合能用、14b的模型基本能用,32b的模型使用很是順滑。 至此,deepseek的本地部署已經(jīng)完成。

chatbox

Chatbox 是一個(gè)開(kāi)源的聊天界面工具,專(zhuān)門(mén)為大型語(yǔ)言模型(如 GPT、LLaMA 等)設(shè)計(jì),提供用戶(hù)友好的交互界面。

使用chatbox的優(yōu)勢(shì)

  • 交互簡(jiǎn)單

  • 預(yù)設(shè)prompt(我的搭檔)

  • 自定義模型服務(wù)方

  • 獨(dú)立代理

下載

下載以后一路點(diǎn)點(diǎn)點(diǎn)即可。

環(huán)境配置

  • 點(diǎn)擊設(shè)置

  • 選擇模型提供方

  • 選擇模型(本機(jī)地址默認(rèn)即可)

測(cè)試

很是順滑

性能加速方案(Ollama專(zhuān)用)

技術(shù)方案
適用場(chǎng)景
實(shí)現(xiàn)方法
預(yù)期收益
量化加速
低顯存設(shè)備
使用deepseek-r1:32b-q4_0模型
顯存占用降60%
多GPU支持
多卡設(shè)備
設(shè)置環(huán)境變量CUDA_VISIBLE_DEVICES
吞吐量翻倍
內(nèi)存優(yōu)化
長(zhǎng)文本對(duì)話(huà)
調(diào)整OLLAMA_MAX_MEMORY參數(shù)
內(nèi)存占用降40%

實(shí)操命令示例

# 使用量化模型(需先下載)

ollama run 模型-q4_0

# 多GPU支持(指定使用GPU 0和1)

ollama run deepseek-r1:32b

交互優(yōu)化技巧

界面增強(qiáng)方案

功能
實(shí)現(xiàn)方法
Markdown渲染
在問(wèn)題末尾添加\n請(qǐng)用markdown格式回答
對(duì)話(huà)流控制
輸入/retry重新生成回答  /forget清除對(duì)話(huà)歷史
語(yǔ)音輸入
使用Voice2Text插件
快捷鍵體系
Ctrl+Enter發(fā)送  Alt+↑調(diào)出歷史提問(wèn)

高級(jí)交互配置

# 創(chuàng)建~/.ollama/config.yaml

system_prompt: "你是一個(gè)精通科技知識(shí)的助手,回答請(qǐng)簡(jiǎn)明扼要,使用中文口語(yǔ)化表達(dá)"

temperature: 0.7  # 控制創(chuàng)造性(0-1)

max_length: 4096  # 最大生成長(zhǎng)度

常見(jiàn)問(wèn)題解決方案

問(wèn)題現(xiàn)象
解決方案
緊急程度
顯存不足報(bào)錯(cuò)
使用量化模型或換用更小模型
高危
響應(yīng)速度慢
設(shè)置環(huán)境變量OLLAMA_NUM_THREADS=8
生成內(nèi)容中斷
輸入/continue繼續(xù)生成
中文輸出夾雜英文
在提問(wèn)末尾添加「請(qǐng)使用純中文回答」
歷史記憶混亂
輸入/forget清除上下文

后記

個(gè)人小助手已經(jīng)搭建完成,大家的工作、生活問(wèn)題盡情的問(wèn)吧,不聯(lián)網(wǎng),隱私。大家可以關(guān)注下,后續(xù)基于deepseek我再搭建個(gè)知識(shí)庫(kù)分享給大家。

原文來(lái)源:https://mp.weixin.qq.com/s?__biz=MjM5NzQxMTAyNw==&mid=2247485191&idx=1&sn=6590bae7fb960a2577c2b77c11479080&scene=21#wechat_redirect

[我要糾錯(cuò)]
文:宋聰喬&發(fā)表于江蘇
關(guān)鍵詞: 無(wú)需 魔法 代碼 消費(fèi) 顯卡

來(lái)源:本文內(nèi)容搜集或轉(zhuǎn)自各大網(wǎng)絡(luò)平臺(tái),并已注明來(lái)源、出處,如果轉(zhuǎn)載侵犯您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)聯(lián)系小編,我們會(huì)及時(shí)審核處理。
聲明:江蘇教育黃頁(yè)對(duì)文中觀(guān)點(diǎn)保持中立,對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或者完整性不提供任何明示或暗示的保證,不對(duì)文章觀(guān)點(diǎn)負(fù)責(zé),僅作分享之用,文章版權(quán)及插圖屬于原作者。

點(diǎn)個(gè)贊
0
踩一腳
0

您在閱讀:國(guó)產(chǎn)AI之光!DeepSeek本地部署教程,效果媲美GPT-4

Copyright?2013-2024 JSedu114 All Rights Reserved. 江蘇教育信息綜合發(fā)布查詢(xún)平臺(tái)保留所有權(quán)利

蘇公網(wǎng)安備32010402000125 蘇ICP備14051488號(hào)-3技術(shù)支持:南京博盛藍(lán)睿網(wǎng)絡(luò)科技有限公司

南京思必達(dá)教育科技有限公司版權(quán)所有   百度統(tǒng)計(jì)

主站蜘蛛池模板: 第一国内永久免费福利视频 | caonila国产在线观看 | 香蕉视视频| 91成年人免费视频 | 欧美成人午夜视频免看 | 亚洲va视频 | 久久国产精品久久 | 网站在线观看你懂的 | 污黄网站| m3u8久久国产精品影院 | 视频三区精品中文字幕 | 亚洲免费二区 | 麻豆精品不卡国产免费看 | 黄色录像在线免费观看 | 成人在线网站 | 性生交大片免费一级 | 国产亚洲精品日韩香蕉网 | 成人国产第一区在线观看 | 国产精品亚欧美一区二区三区 | 在线色站 | 免费国产不卡午夜福在线观看 | 国产午夜毛片一区二区三区 | 色妇视频 | 天天射天| 香蕉福利 | 亚洲激情文学 | 亚洲精品永久www嫩草 | 亚洲乱亚洲乱妇13p 亚洲乱码尤物193yw在线播放 | 午夜在线看片 | 日本黄色小说网 | 一区二区福利 | free 中国性xxxxhd | 日韩在线第一区 | 国产精品小黄鸭一区二区三区 | 9191亚洲高清国产 | 一个人在线看的免费视频 | 日韩操比 | 综合玖玖 | 999精品在线 | 一级做a爱免费观看视频 | 国产一级毛片午夜福 |
最熱文章
最新文章
  • 阿里云上云鉅惠,云產(chǎn)品享最低成本,有需要聯(lián)系,
  • 卡爾蔡司鏡片優(yōu)惠店,鏡片價(jià)格低
  • 蘋(píng)果原裝手機(jī)殼