證券時(shí)報(bào)記者 阮潤(rùn)生
國產(chǎn)開源大模型DeepSeek憑借出色性價(jià)比,成為全球增速最快的AI應(yīng)用,引發(fā)全球科技圈熱切討論和算力信仰震蕩,也進(jìn)一步增強(qiáng)對(duì)構(gòu)建開放型人工智能生態(tài)的信心。目前,不僅英偉達(dá)、AMD、英特爾等國際芯片巨頭宣布集成DeepSeek模型、提供算力支持等,國產(chǎn)GPU廠商、云計(jì)算廠商和應(yīng)用廠商等AI產(chǎn)業(yè)鏈伙伴也火速支持調(diào)用DeepSeek,升級(jí)各自產(chǎn)品和技術(shù)。
引發(fā)算力巨震
作為幻方量化旗下的AI公司深度求索研發(fā)的國產(chǎn)開源大模型,DeepSeek近期連續(xù)發(fā)布的DeepSeek V3、DeepSeek-R1等AI模型展示了驚艷效果和低廉的訓(xùn)練成本。移動(dòng)應(yīng)用分析機(jī)構(gòu)SensorTower的數(shù)據(jù)顯示,其應(yīng)用軟件在18天內(nèi)的下載量達(dá)到1600萬次,截至2025年2月4日,DeepSeek日活用戶數(shù)超越了2000萬,成為全球增速最快的AI應(yīng)用。
人工智能業(yè)內(nèi)人士向證券時(shí)報(bào)記者表示,DeepSeek證明了不用堆疊算力也可以搞好大模型。
綜合來看,DeepSeek提供了一種高效的模型蒸餾技術(shù),能夠?qū)⒋笠?guī)模模型的能力遷移至更小、更高效的版本,并且通過Multi-Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù),顯著降低顯存占用,優(yōu)化模型性能。
TrendForce集邦咨詢研究指出,DeepSeek采用蒸餾模型(Model Distillation)技術(shù),壓縮大型模型以提升推理速度并降低硬件需求,同時(shí)充分發(fā)揮英偉達(dá)Hopper降規(guī)版芯片的效益,最大化運(yùn)算資源利用。其成本優(yōu)勢(shì)來自高效能硬件選擇、新型蒸餾技術(shù)及API開源策略,不僅優(yōu)化技術(shù)與商業(yè)應(yīng)用的平衡,也展現(xiàn)AI產(chǎn)業(yè)向高效發(fā)展的趨勢(shì)。
DeepSeek成為現(xiàn)象級(jí)AI應(yīng)用,也引發(fā)了對(duì)算力信仰的質(zhì)疑。全球算力巨頭英偉達(dá)股價(jià)1月27日一度下跌近17%,之后逐步企穩(wěn);A股光通信模塊龍頭中際旭創(chuàng)1月27日下跌約10%,2月5日進(jìn)一步放量下跌,工業(yè)富聯(lián)下跌6.76%,寒武紀(jì)-U下跌12.46%。
對(duì)此,英偉達(dá)此前發(fā)表聲明,表示DeepSeek所取得的進(jìn)展顯示出其芯片在中國市場(chǎng)的實(shí)用價(jià)值,且未來為滿足DeepSeek的服務(wù),還將需要更多英偉達(dá)芯片。
TrendForce集邦咨詢最新指出,DeepSeek模型雖降低AI訓(xùn)練成本,但AI模型的低成本化可望擴(kuò)大應(yīng)用場(chǎng)景,進(jìn)而增加全球數(shù)據(jù)中心建設(shè)量。光收發(fā)模塊作為數(shù)據(jù)中心互連的關(guān)鍵組件,將受惠于高速數(shù)據(jù)傳輸?shù)男枨?,預(yù)測(cè)2023年400Gbps以上的光收發(fā)模塊全球出貨量為640萬個(gè),2024年約2040萬個(gè),預(yù)估至2025年將超過3190萬個(gè),年增長(zhǎng)率達(dá)56.5%。
AI芯片積極適配
對(duì)DeepSeek的認(rèn)可不僅體現(xiàn)在排行榜和用戶下載量上,也反映在國際AI芯片巨頭的兼容和本土廠商的積極適配。
1月31日,英偉達(dá)發(fā)布搭載DeepSeek-R1 671b的“英偉達(dá)NIM微服務(wù)”預(yù)覽版,顯著提升AI模型的運(yùn)行效率,簡(jiǎn)化企業(yè)部署流程,降低AI落地的技術(shù)門檻。
另外,AMD已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上;英特爾也表示其開發(fā)的AI芯片/GPU芯片可以支持DeepSeek,有意與中國芯片合作打破英偉達(dá)打造的生態(tài)壟斷。
據(jù)業(yè)內(nèi)分析,DeepSeek使用了英偉達(dá)的PTX(Parallel Thread Execution)語言,實(shí)現(xiàn)在接近匯編語言的層級(jí)運(yùn)行,通過允許進(jìn)行細(xì)粒度的優(yōu)化,能夠?qū)PU硬件進(jìn)行更底層、更精準(zhǔn)的控制。
前述業(yè)內(nèi)人士向記者表示,能夠使用PTX證明DeepSeek有能力做到更底層的技術(shù),本質(zhì)上對(duì)國產(chǎn)GPU也是好事。有分析指出,通過精通運(yùn)用PTX語言,有望幫助國產(chǎn)GPU進(jìn)行針對(duì)性算子優(yōu)化,提升模型在國產(chǎn)GPU上的運(yùn)行效率。
除了國際巨頭,海光信息作為國產(chǎn)AI芯片企業(yè),2月4日晚宣布成功完成DeepSeekV3和R1模型與海光AI加速卡DCU的適配并正式上線,有望推動(dòng)AI技術(shù)在更多行業(yè)的落地與普及。2月5日,該公司股價(jià)上漲11.19%。
另外,潞晨科技攜手華為昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek-R1系列推理API及云鏡像服務(wù),實(shí)現(xiàn)了昇騰算力與DeepSeek-R1系列模型的推理適配優(yōu)化,性能表現(xiàn)與使用高端GPU持平。另外,DeepSeek系列模型正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開箱即用,推理快速部署。
國產(chǎn)GPU廠商沐曦宣布與DeepSeek的合作,摩爾線程宣布部署DeepSeek蒸餾模型推理服務(wù),提升了DeepSeek模型的計(jì)算效率和資源利用率;天數(shù)智芯宣布適配DeepSeek-R1千問蒸餾模型,提供更高效、更穩(wěn)定的推理服務(wù),滿足了不同規(guī)模和需求的應(yīng)用場(chǎng)景。
2月5日,壁仞科技宣布自主研發(fā)的壁礪TM系列產(chǎn)品完成對(duì)DeepSeek-R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級(jí)參數(shù)版本,包括LLaMA蒸餾模型和千問蒸餾模型,為開發(fā)者提供高性能、低成本的大模型部署與開發(fā)解決方案。
云廠商及應(yīng)用端接入
除了AI硬件端廠商,不少云計(jì)算巨頭也紛紛入圍DeepSeek“朋友圈”,華為云、騰訊云、阿里云、百度云等已經(jīng)宣布支持部署DeepSeek模型。另外,聯(lián)通云宣布已基于星羅平臺(tái)實(shí)現(xiàn)國產(chǎn)及主流算力適配多規(guī)格DeepSeek-R1模型,兼顧私有化和公有化場(chǎng)景,提供全方位運(yùn)行服務(wù)保障,為客戶帶來開箱即用的使用體驗(yàn);實(shí)現(xiàn)多產(chǎn)品場(chǎng)景調(diào)用,可在全國270多個(gè)骨干云池預(yù)部署,全面接入聯(lián)通云桌面、編程助手等多產(chǎn)品場(chǎng)景;提供全方位安全服務(wù)保障,實(shí)時(shí)提供抗DDoS等三大安全服務(wù)并具備元景安全大模型加持。
除了云廠商,應(yīng)用端廠商也在積極探索和部署DeepSeek模型。
2月4日,萬興科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入適配,旗下視頻創(chuàng)意、繪圖創(chuàng)意及文檔創(chuàng)意軟件業(yè)務(wù)產(chǎn)品,諸如萬興喵影、億圖圖示、億圖腦圖MindMaster、萬興PDF等均已融合DeepSeek-R1大模型相關(guān)能力,用戶可搶鮮體驗(yàn)。接入DeepSeek-R1后,用戶使用產(chǎn)品的門檻降低,大模型應(yīng)用的成本也進(jìn)一步降低。
另外,北信源公眾號(hào)顯示,其自主研發(fā)的“密信AI能力平臺(tái)”第一時(shí)間完成了與DeepSeek的技術(shù)對(duì)接,這一舉措將為信源密信和第三方應(yīng)用提供DeepSeek大模型AI能力;奇安信宣布已完成與DeepSeek全面深度接入,自研的QAX—GPT安全大模型通過DeepSeek-R1優(yōu)化和蒸餾后,運(yùn)營成本大幅降低,在威脅研判等多場(chǎng)景下的性能顯著提升,安全專業(yè)問答整體性能分?jǐn)?shù)提升約16%。
當(dāng)虹科技官微顯示,公司BlackEye多模態(tài)視聽大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成視聽傳媒、工業(yè)與衛(wèi)星、車載智能座艙等多行業(yè)垂類場(chǎng)景的數(shù)據(jù)調(diào)優(yōu)訓(xùn)練,可為視聽傳媒、工業(yè)與衛(wèi)星、車載智能座艙等行業(yè)客戶提供更低成本的大模型部署及全新的大模型體驗(yàn)。
易點(diǎn)天下宣布,旗下KreadoAI、數(shù)眼智能、zMaticooADX等多款核心產(chǎn)品將融合DeepSeek-R1大模型相關(guān)能力,提升用戶智能營銷體驗(yàn)。
就“公司AI產(chǎn)品有沒有與DeepSeek模型合作或使用”等問題,盛天網(wǎng)絡(luò)2月5日在互動(dòng)平臺(tái)回復(fù),公司目前已有相關(guān)合作,正在進(jìn)行對(duì)接使用DeepSeek模型。公司通過在線API接口以及對(duì)開源模型進(jìn)行私有化部署的方式開展工作,目前已部署完成進(jìn)入測(cè)試階段。公司預(yù)計(jì)DeepSeek模型后續(xù)可應(yīng)用于公司社交產(chǎn)品帶帶和給麥,以探索更優(yōu)質(zhì)的產(chǎn)品與服務(wù),并進(jìn)一步提高公司各項(xiàng)業(yè)務(wù)生產(chǎn)力,結(jié)合公司彈性算力池有效降低算力成本。目前公司一款底層對(duì)接DeepSeek的社交小游戲已完成了一輪內(nèi)部測(cè)試。
據(jù)中文在線消息,基于DeepSeek V3與R1提出的技術(shù)路線,中文在線正著力研發(fā)并訓(xùn)練升級(jí)版“中文逍遙”,以進(jìn)一步提升該大模型的創(chuàng)作能力。
2月5日,閱文集團(tuán)宣布旗下作家輔助創(chuàng)作產(chǎn)品——作家助手已集成獨(dú)立部署的DeepSeek-R1大模型。閱文邀請(qǐng)全行業(yè)網(wǎng)文作家參與,用戶下載作家助手至最新版本即可試用并參與內(nèi)測(cè)。
此外,2月5日,華為終端BG首席執(zhí)行官何剛在微博發(fā)文透露,華為小藝助手已接入DeepSeek,小藝App的智能體廣場(chǎng)已上線DeepSeek-R1的Beta版,升級(jí)至原生鴻蒙系統(tǒng)可以體驗(yàn)。