DeepSeek之后，金融大模型將迎哪些變化？

來源：界面新聞作者：何柳穎2025-02-11 13:33

DeepSeek熱潮正快速蔓延。

金融機(jī)構(gòu)中，券商動(dòng)作最為迅速。目前國(guó)泰君安、國(guó)金證券、廣發(fā)證券、華安證券等多家券商均表示已完成本地化部署。

銀行方面，江蘇銀行率先宣布已部署Deepseek，該行稱，依托“智慧小蘇”大語言模型服務(wù)平臺(tái)，成功本地化部署微調(diào)DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型，分別運(yùn)用于智能合同質(zhì)檢和自動(dòng)化估值對(duì)賬場(chǎng)景中。

蘇商銀行方面表示，2024年，在國(guó)產(chǎn)大模型興起之初，蘇商銀行積極關(guān)注并先后引入DeepSeek系列技術(shù)，結(jié)合原有大模型技術(shù)能力，在模型輕量化與高效推理方面取得顯著突破，并大幅降低了算力消耗。

整體而言，目前正式官宣接入、應(yīng)用Deepseek的銀行不算多，不過有銀行人士告訴界面新聞?dòng)浾?，“已在行?nèi)部署DeepSeek大模型”。

無論快慢，Deepseek帶來的“低成本、高性能”路線顯然已為金融機(jī)構(gòu)的大模型布局帶來了新的思考。另一方面，這一路線是否有望縮小金融機(jī)構(gòu)之間的大模型技術(shù)鴻溝？

大大降低深度思考模型的應(yīng)用門檻

桂林銀行方面告訴界面新聞?dòng)浾?，該行已在行?nèi)部署Deepseek大模型，計(jì)劃結(jié)合各業(yè)務(wù)條線將其用于業(yè)務(wù)知識(shí)問答助手、客服助手、培訓(xùn)助手、培訓(xùn)對(duì)練、智能出題等場(chǎng)景，拓展大模型技術(shù)在金融服務(wù)場(chǎng)景的應(yīng)用，賦能金融服務(wù)高質(zhì)量發(fā)展。

另有股份行人士告訴界面新聞?dòng)浾?，“目前還在研究中，沒那么快落地”。

“DeepSeek-R1的優(yōu)勢(shì)可以用‘更聰明、更便宜、更開放’來概括。更聰明在于自主學(xué)習(xí)能力更強(qiáng)，能夠通過自動(dòng)推理得出正確的結(jié)果；更便宜在于借助算法優(yōu)勢(shì)，可以占用更少的算力資源，以更低的成本完成同樣的任務(wù)；更開放在于其選擇了開源，允許任何人免費(fèi)試用和改進(jìn)算法?！敝袊?guó)科學(xué)院科技戰(zhàn)略咨詢研究院研究中心副主任周城雄向界面新聞?dòng)浾弑硎尽?/p>

“2023年OpenAI推出O1系列模型時(shí)，強(qiáng)大的推理思考能力為很多復(fù)雜場(chǎng)景的深入應(yīng)用帶來了可能；而此次DeepSeek-R1系列模型開源，不僅帶來了完整好用的COT（思維鏈推理）能力，同時(shí)其通過大模型蒸餾小模型的實(shí)踐方式也大大降低了深度思考模型的應(yīng)用門檻?！闭新?lián)消費(fèi)首席信息官王耀南告訴界面新聞?dòng)浾摺?/p>

王耀南表示，DeepSeek-R1模型的開源帶來了更多應(yīng)用機(jī)會(huì)，對(duì)于招聯(lián)消費(fèi)的大模型應(yīng)用策略來說，強(qiáng)化的深度思考能力可以大大拓寬智能體的應(yīng)用范圍。

比如，“在風(fēng)險(xiǎn)管理領(lǐng)域，深度思考能力可以讓智能體應(yīng)用完全結(jié)合宏觀、微觀經(jīng)濟(jì)運(yùn)行情況，詳細(xì)、完整地評(píng)估客戶的風(fēng)險(xiǎn)水平；在服務(wù)與營(yíng)銷領(lǐng)域，通過對(duì)客戶信息及過往服務(wù)交互記錄的深入分析，我們可以通過AI技術(shù)為每個(gè)客戶打造專屬客戶經(jīng)理?！蓖跻辖榻B。

幫助搭建金融大模型

根據(jù)周城雄的觀察，目前金融機(jī)構(gòu)大模型研發(fā)路徑主要有以下三類：一是利用已經(jīng)開源的模型進(jìn)行處理，二是聚焦金融場(chǎng)景針對(duì)性地開發(fā)小模型，三是直接采購(gòu)服務(wù)商的AI服務(wù)。

從受訪金融機(jī)構(gòu)的情況看，第一種方式更為普遍。王耀南介紹，招聯(lián)主要基于一系列開源的基座大模型（包括llama、qwen等），結(jié)合招聯(lián)對(duì)于業(yè)務(wù)的深入洞察和數(shù)據(jù)積累，通過強(qiáng)化學(xué)習(xí)、SFT微調(diào)等方式打造并開源了兩代智鹿大模型，在此基礎(chǔ)上構(gòu)建了包括消保智能體、審批智能體、運(yùn)營(yíng)智能體等一系列智能體應(yīng)用。

桂林銀行方面亦告訴界面新聞?dòng)浾撸撔写竽Ｐ脱邪l(fā)與應(yīng)用主要通過引入開源的通義千問大模型結(jié)合采購(gòu)行業(yè)垂直領(lǐng)域大模型，構(gòu)建大模型中臺(tái)，集中統(tǒng)一管理大模型資源，目前已上線30余個(gè)大模型應(yīng)用。

目前DeepSeek-R1已開源，這不僅意味著各大金融機(jī)構(gòu)多了一個(gè)成本更低的開源模型選擇，更重要的是，DeepSeek正攪動(dòng)起一輪閉源開源之爭(zhēng)，這實(shí)際上有助于推動(dòng)人工智能的整體開發(fā)和應(yīng)用進(jìn)程。

從應(yīng)用層面劃分，大模型大致可以分為兩類，一類是通用大模型，另一類是垂類大模型。在知識(shí)門檻技術(shù)較高的金融領(lǐng)域，業(yè)內(nèi)普遍認(rèn)為垂類大模型的性能匹配度會(huì)更高。

BloombergGPT是垂類大模型的典型之一。2023年3月30日，Bloomberg（彭博）正式發(fā)布金融行業(yè)大模型BloombergGPT，該機(jī)構(gòu)彼時(shí)表示，基于LLM（Large language Model，大型語言模型）的人工智能最新進(jìn)展已經(jīng)為許多領(lǐng)域展示了令人興奮的新應(yīng)用，然而，金融領(lǐng)域的復(fù)雜性和獨(dú)特術(shù)語需要特定領(lǐng)域的模型。

據(jù)官方介紹，彭博的數(shù)據(jù)分析師在四十年時(shí)間里收集并維護(hù)了金融語言文件，該團(tuán)隊(duì)從龐大的金融數(shù)據(jù)檔案中提取數(shù)據(jù)，創(chuàng)建了一個(gè)由英文金融文檔組成的全面的3630億個(gè)token數(shù)據(jù)集。然后使用3450億個(gè)token的公共數(shù)據(jù)進(jìn)行擴(kuò)充，從而創(chuàng)建了一個(gè)包含超過7000億個(gè)token的大型訓(xùn)練語料庫。

該模型將幫助彭博改進(jìn)現(xiàn)有的金融NLP（Natural Language Processing,自然語言處理）任務(wù)，例如情緒分析、實(shí)體識(shí)別、新聞分類和問答等。

招商銀行信息技術(shù)部副總經(jīng)理俞吳杰亦曾表示，招行重點(diǎn)不在搭建通用模型，而是搭建金融行業(yè)的領(lǐng)域模型。

俞吳杰表示，招商銀行不會(huì)在通用大語言模型上花費(fèi)更多精力，因?yàn)橥ㄓ么笳Z言模型在銀行業(yè)的運(yùn)用有其弱點(diǎn)——對(duì)專業(yè)知識(shí)理解有限，在專業(yè)領(lǐng)域數(shù)據(jù)處理能力較弱。囿于此，招行會(huì)在比較好的通用模型基礎(chǔ)之上，將足夠的專業(yè)領(lǐng)域知識(shí)給到大模型，“最起碼是銀行業(yè)，未來還可能擴(kuò)展到證券、保險(xiǎn)等與銀行關(guān)聯(lián)性大的行業(yè)”。

如何“喂料”是其中的關(guān)鍵問題之一，而Deepseek-R1有望在這方面幫助銀行“提質(zhì)增效”。

“Deepseek-R1是通用大模型，知識(shí)量很廣，包括信貸業(yè)務(wù)等金融領(lǐng)域的知識(shí)，這可以作為語料支持。將金融內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)結(jié)合優(yōu)化，亦可以降低訓(xùn)練成本?！敝艹切郾硎?。

“大模型對(duì)于業(yè)務(wù)模式的重構(gòu)是一個(gè)循序漸進(jìn)的過程，R1深度思考模式的引入，不僅有利于復(fù)雜推理場(chǎng)景下的AI技術(shù)應(yīng)用；同時(shí)也可以作為招聯(lián)自研模型‘自構(gòu)建數(shù)據(jù)’的引擎，結(jié)合足夠多且高質(zhì)量的數(shù)據(jù)，帶來更優(yōu)異的推理效果?！蓖跻弦鄰?qiáng)調(diào)。

縮小大模型技術(shù)鴻溝？

金融領(lǐng)域是AI應(yīng)用最具潛力的領(lǐng)域之一。

“因?yàn)榻鹑陬I(lǐng)域的數(shù)據(jù)結(jié)構(gòu)化程度比較高，并且金融機(jī)構(gòu)對(duì)數(shù)據(jù)的管理相對(duì)合規(guī)完善，這對(duì)于生成式AI訓(xùn)練而言是比較好的數(shù)據(jù)基礎(chǔ)。但是因?yàn)榻鹑跀?shù)據(jù)涉及到用戶隱私以及跨地域、跨部門的監(jiān)管問題，如果要對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練，其實(shí)也存在一定的壁壘?！敝艹切郾硎尽?/p>

而在金融機(jī)構(gòu)之間，實(shí)際上存在著明顯的技術(shù)鴻溝。

此前有業(yè)內(nèi)人士表示，從行業(yè)角度看，大語言模型是一項(xiàng)持續(xù)的、規(guī)模大的投資，包括建集群、招聘人才等，且資源都比較稀缺，并非所有銀行都適合大規(guī)模投入其中。銀行業(yè)之間的交流非常多，中小銀行機(jī)構(gòu)可以復(fù)用一些業(yè)內(nèi)經(jīng)驗(yàn)。對(duì)于中小銀行，并不建議盲目跟風(fēng)，尤其是一次性的大投入，目前大模型的發(fā)展還有很多變數(shù)，包括通用大模型哪個(gè)更優(yōu)，怎么部署等，都還在變化過程當(dāng)中。建議中小銀行機(jī)構(gòu)更多地做好行業(yè)交流學(xué)習(xí)，針對(duì)自身實(shí)際情況量力而為才是更合適的。

Deepseek-R1有望帶來新的競(jìng)爭(zhēng)路徑。

桂林銀行方面告訴記者，Deepseek-R1是一款優(yōu)秀的國(guó)產(chǎn)大模型，對(duì)該行大模型策略產(chǎn)生了比較重要的影響。尤其是Deepseek-R1顯著降低了研發(fā)成本，使得中小型城商行能夠以更低的成本投入大模型的研發(fā)與應(yīng)用。

“以往研發(fā)金融大模型需要購(gòu)買大量的GPU卡來搭建高算力的基礎(chǔ)設(shè)施，成本高昂。而Deepseek-R1低操作成本特點(diǎn)，讓我行在金融大模型應(yīng)用研發(fā)方面的投入產(chǎn)出比有望進(jìn)一步上升。Deepseek-R1在基礎(chǔ)設(shè)施方面帶來的降本增效，有助于我們投入更多資源到大模型應(yīng)用方面，能夠更好地專注于自身業(yè)務(wù)特點(diǎn)，開發(fā)有針對(duì)性的垂直應(yīng)用?！痹撠?fù)責(zé)人稱。

桂林銀行方面認(rèn)為，Deepseek-R1的出現(xiàn)有望縮小中小型城商行與大型銀行在大模型應(yīng)用研發(fā)方面的差距。中小型城商行由于資源有限，在大模型研發(fā)上的投入相對(duì)較少，而Deepseek-R1的低數(shù)據(jù)訓(xùn)練成本和高性能，為中小型城商行提供了一個(gè)新的突破口。

“原來各機(jī)構(gòu)的技術(shù)差異可能比較大，有的土壤肥沃，有的貧瘠，投入產(chǎn)出比差異明顯；如今Deepseek-R1實(shí)現(xiàn)了通過較低的成本來獲得比較好的產(chǎn)出，相當(dāng)于大家在同一片肥沃的土壤上種植，整體拉高了投入產(chǎn)出比，技術(shù)差異有望縮小?！敝艹切垡啾硎?。

但對(duì)于中小型機(jī)構(gòu)而言，困難依然重重。“包括數(shù)據(jù)量相對(duì)有限，能承擔(dān)多少算力，人才問題，等等?！敝艹切垩a(bǔ)充稱。

另一方面，技術(shù)門檻的降低也并不意味著消弭差距，甚至可能拉大差距?！叭绻麢C(jī)構(gòu)懂得如何借力低成本的技術(shù)平臺(tái)，相信能產(chǎn)生更好的效益，而對(duì)于不會(huì)利用的機(jī)構(gòu)而言，則會(huì)帶來負(fù)面影響?！敝艹切壅劶啊?/p>

在周城雄看來，中小金融機(jī)構(gòu)需要在自主開發(fā)和外部力量之間尋找一個(gè)平衡：如果完全用外部的大模型，可能不是那么好用，并不適合自身業(yè)務(wù)；如果完全自主開發(fā)，成本也會(huì)太高。

展望未來，周城雄認(rèn)為競(jìng)爭(zhēng)格局將取決于AI與業(yè)務(wù)的深度融合能力，而非僅僅成本的高低問題?！熬拖裥畔⒒顺钡臅r(shí)候，信息化與業(yè)務(wù)的融合水平也拉開了機(jī)構(gòu)之間的競(jìng)爭(zhēng)差距?！?/p>

但無論如何，在各個(gè)領(lǐng)域，大模型成本降低都是喜聞樂見的事情。

王耀南談及，以消費(fèi)金融為例，作為與人們?nèi)粘ＯM(fèi)聯(lián)系緊密的金融業(yè)態(tài)，消費(fèi)金融具有量大、小額、分散等鮮明特點(diǎn)，業(yè)務(wù)風(fēng)險(xiǎn)和運(yùn)營(yíng)成本較高，實(shí)現(xiàn)“普”與“惠”的平衡存在公認(rèn)難度。大模型技術(shù)的發(fā)展將進(jìn)一步推動(dòng)金融服務(wù)的顛覆式創(chuàng)新，在高效解決風(fēng)控、運(yùn)營(yíng)、服務(wù)等領(lǐng)域存在巨大應(yīng)用空間和顯著優(yōu)勢(shì)。

著眼生態(tài)發(fā)展，“DeepSeek在Nvidia CUDA技術(shù)體系之外，以其良好的原生生態(tài)支撐了包括華為昇騰在內(nèi)的一系列國(guó)產(chǎn)GPU技術(shù)棧，DeepSeek的‘破圈’及優(yōu)異的性能讓更多人認(rèn)識(shí)到國(guó)內(nèi)人工智能信創(chuàng)生態(tài)將會(huì)快速完善。未來，充分的市場(chǎng)競(jìng)爭(zhēng)一定會(huì)帶來投入產(chǎn)出比的上升。”王耀南表示。

責(zé)任編輯：陳勇洲

機(jī)構(gòu)

銀行

金融機(jī)構(gòu)

聲明：證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確，文章提及內(nèi)容僅供參考，不構(gòu)成實(shí)質(zhì)性投資建議，據(jù)此操作風(fēng)險(xiǎn)自擔(dān)

下載“證券時(shí)報(bào)”官方APP，或關(guān)注官方微信公眾號(hào)，即可隨時(shí)了解股市動(dòng)態(tài)，洞察政策信息，把握財(cái)富機(jī)會(huì)。

網(wǎng)友評(píng)論

登錄后可以發(fā)言

發(fā)送

網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法，并不表明證券時(shí)報(bào)立場(chǎng)