在剛剛過去的春節(jié)假期,一款名為DeepSeek的科技產(chǎn)品成為了眾多家庭熱議的焦點(diǎn),甚至吸引了那些平時(shí)對(duì)科技新聞不太關(guān)注的長輩們的注意。自O(shè)penAI的ChatGPT之后,DeepSeek再次展現(xiàn)了AI大模型深入人心的魅力。
然而,大紅大紫的背后,DeepSeek也遭遇了連續(xù)且高強(qiáng)度的網(wǎng)絡(luò)攻擊,導(dǎo)致其官網(wǎng)大部分時(shí)間無法正常生成內(nèi)容。即便關(guān)閉了聯(lián)網(wǎng)搜索功能,具備深度推理能力的DeepSeek-R1在線模型也依然難以正常使用。幸運(yùn)的是,在華為等眾多科技公司的支持下,第三方平臺(tái)紛紛接入了DeepSeek的API,使得穩(wěn)定在線使用成為可能。
盡管如此,仍有不少科技愛好者追求更高層次的體驗(yàn),他們希望將DeepSeek大模型部署到本地。小雷便是其中之一,他在春節(jié)期間動(dòng)手實(shí)踐了這一想法。
想要在個(gè)人電腦上部署一個(gè)本地大模型,步驟并不多,但難點(diǎn)在于尋找對(duì)應(yīng)的資源和命令。本地大模型雖然已經(jīng)是訓(xùn)練好的成品,但仍需要一定的硬件基礎(chǔ)才能提供良好的體驗(yàn)。小雷選擇了DeepSeek-R1模型中的7b版本,即帶有70億參數(shù)的DeepSeek-R1模型,占用空間為4.7GB。
他首先到Ollama官網(wǎng)下載了一個(gè)桌面端應(yīng)用,這個(gè)應(yīng)用相當(dāng)于一個(gè)承載本地大模型的“盒子”。在Ollama官網(wǎng)的模型庫中,他找到了DeepSeek-R1模型的代碼,并復(fù)制到PowerShell中執(zhí)行,從而拉取和安裝了模型數(shù)據(jù)。安裝完成后,他就可以在PowerShell窗口中直接調(diào)取剛下載的DeepSeek-R1模型,輸入問題后,本地大模型便會(huì)進(jìn)行推理并生成答案。
然而,每次開啟電腦都需要打開PowerShell界面才能激活大模型,這對(duì)于普通用戶來說并不方便。于是,小雷為DeepSeek-R1安裝了一套更直觀的交互界面。他選擇在Docker應(yīng)用上添加一個(gè)Open-WebUI組件,使得DeepSeek-R1可以通過瀏覽器界面進(jìn)行交互,并賦予了它聯(lián)系上下文的能力。
經(jīng)過一番操作,小雷成功地將DeepSeek-R1部署到了本地,并獲得了一臺(tái)帶有AI本地大模型的“AI電腦”。他體驗(yàn)了整個(gè)部署過程,發(fā)現(xiàn)步驟并不復(fù)雜,主要是搜索命令行、安裝資源和拉取安裝組件花費(fèi)了較多時(shí)間。
那么,本地部署大模型的意義何在呢?小雷認(rèn)為,關(guān)鍵在于兩點(diǎn):一是本地大模型的所有模型數(shù)據(jù)和對(duì)話記錄都是完全離線的,存儲(chǔ)在本地,本地推理響應(yīng)時(shí)間更快,也避免了敏感內(nèi)容泄露。同時(shí),在無網(wǎng)絡(luò)環(huán)境下,也可以正常使用大模型;二是本地部署支持各種開源模型,個(gè)人用戶可以靈活擴(kuò)展和切換,也可以根據(jù)自身需求進(jìn)行優(yōu)化和工具集成。
不過,小雷也指出,本地大模型的生成能力并不如云端版。他使用的電腦配置并不在本地部署大模型的推薦范圍內(nèi),因此DeepSeek-R1 7b模型在這款電腦上需要更多的推理時(shí)間和資源占用才能正常生成內(nèi)容。對(duì)于一些復(fù)雜的問題,本地大模型可能需要思考幾十秒甚至一分鐘才能進(jìn)入答案生成階段。
盡管如此,小雷仍然對(duì)DeepSeek擬人化的思考過程感興趣。他認(rèn)為,這種擬人化的推理過程能夠激起許多普通用戶的興趣。相比之下,網(wǎng)頁端的DeepSeek大模型在密集訪問下可能會(huì)出現(xiàn)“服務(wù)器繁忙”的情況,而本地部署則至少能夠保證訪問。
然而,小雷也承認(rèn),本地大模型并不適合所有人。就現(xiàn)階段的生成能力來說,本地大模型很難與線上大模型媲美。它更適合動(dòng)手能力強(qiáng)的電腦用戶折騰,深度發(fā)掘可能會(huì)帶來一些功能上的便利。但作為普通用戶,部署本身并不容易,大模型的周邊配套也并不成熟。
在小雷看來,DeepSeek選擇開源道路,主要是為了打響市場影響力,先行占據(jù)市場地位。隨著DeepSeek在各行業(yè)的應(yīng)用和滲透,個(gè)人本地部署的需求可能會(huì)變得更加簡單。到那個(gè)時(shí)候,調(diào)起PowerShell界面、敲代碼等事情甚至都不需要用戶來做。