开心激情亚洲四日韩一区电影在线|亚洲五码视频观看精品亚洲日韩中文|久久久久国产区亚洲爆乳一区二区|亚洲人成777先锋影音一区二区|免费一级无吗毛片丁香五月婷婷色播|校园春色亚洲67194AV|蝌蚪窝综合国产国产AV无乱码|天天综合性网亚洲华人一区

DeepSeek之后,金融大模型將迎哪些變化?
來源:界面新聞作者:何柳穎2025-02-11 13:33

DeepSeek熱潮正快速蔓延。

金融機(jī)構(gòu)中,券商動(dòng)作最為迅速。目前國(guó)泰君安、 國(guó)金證券、 廣發(fā)證券、華安證券等多家券商均表示已完成本地化部署。

銀行方面,江蘇銀行率先宣布已部署Deepseek,該行稱,依托“智慧小蘇”大語言模型服務(wù)平臺(tái),成功本地化部署微調(diào)DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型,分別運(yùn)用于智能合同質(zhì)檢和自動(dòng)化估值對(duì)賬場(chǎng)景中。

蘇商銀行方面表示,2024年,在國(guó)產(chǎn)大模型興起之初,蘇商銀行積極關(guān)注并先后引入DeepSeek系列技術(shù),結(jié)合原有大模型技術(shù)能力,在模型輕量化與高效推理方面取得顯著突破,并大幅降低了算力消耗。

整體而言,目前正式官宣接入、應(yīng)用Deepseek的銀行不算多,不過有銀行人士告訴界面新聞?dòng)浾?,“已在行?nèi)部署DeepSeek大模型”。

無論快慢,Deepseek帶來的“低成本、高性能”路線顯然已為金融機(jī)構(gòu)的大模型布局帶來了新的思考。另一方面,這一路線是否有望縮小金融機(jī)構(gòu)之間的大模型技術(shù)鴻溝?

大大降低深度思考模型的應(yīng)用門檻

桂林銀行方面告訴界面新聞?dòng)浾?,該行已在行?nèi)部署Deepseek大模型,計(jì)劃結(jié)合各業(yè)務(wù)條線將其用于業(yè)務(wù)知識(shí)問答助手、客服助手、培訓(xùn)助手、培訓(xùn)對(duì)練、智能出題等場(chǎng)景,拓展大模型技術(shù)在金融服務(wù)場(chǎng)景的應(yīng)用,賦能金融服務(wù)高質(zhì)量發(fā)展。

另有股份行人士告訴界面新聞?dòng)浾?,“目前還在研究中,沒那么快落地”。

“DeepSeek-R1的優(yōu)勢(shì)可以用‘更聰明、更便宜、更開放’來概括。更聰明在于自主學(xué)習(xí)能力更強(qiáng),能夠通過自動(dòng)推理得出正確的結(jié)果;更便宜在于借助算法優(yōu)勢(shì),可以占用更少的算力資源,以更低的成本完成同樣的任務(wù);更開放在于其選擇了開源,允許任何人免費(fèi)試用和改進(jìn)算法?!敝袊?guó)科學(xué)院科技戰(zhàn)略咨詢研究院研究中心副主任周城雄向界面新聞?dòng)浾弑硎尽?/p>

“2023年OpenAI推出O1系列模型時(shí),強(qiáng)大的推理思考能力為很多復(fù)雜場(chǎng)景的深入應(yīng)用帶來了可能;而此次DeepSeek-R1系列模型開源,不僅帶來了完整好用的COT(思維鏈推理)能力,同時(shí)其通過大模型蒸餾小模型的實(shí)踐方式也大大降低了深度思考模型的應(yīng)用門檻?!闭新?lián)消費(fèi)首席信息官王耀南告訴界面新聞?dòng)浾摺?/p>

王耀南表示,DeepSeek-R1模型的開源帶來了更多應(yīng)用機(jī)會(huì),對(duì)于招聯(lián)消費(fèi)的大模型應(yīng)用策略來說,強(qiáng)化的深度思考能力可以大大拓寬智能體的應(yīng)用范圍。

比如,“在風(fēng)險(xiǎn)管理領(lǐng)域,深度思考能力可以讓智能體應(yīng)用完全結(jié)合宏觀、微觀經(jīng)濟(jì)運(yùn)行情況,詳細(xì)、完整地評(píng)估客戶的風(fēng)險(xiǎn)水平;在服務(wù)與營(yíng)銷領(lǐng)域,通過對(duì)客戶信息及過往服務(wù)交互記錄的深入分析,我們可以通過AI技術(shù)為每個(gè)客戶打造專屬客戶經(jīng)理?!蓖跻辖榻B。

幫助搭建金融大模型

根據(jù)周城雄的觀察,目前金融機(jī)構(gòu)大模型研發(fā)路徑主要有以下三類:一是利用已經(jīng)開源的模型進(jìn)行處理,二是聚焦金融場(chǎng)景針對(duì)性地開發(fā)小模型,三是直接采購(gòu)服務(wù)商的AI服務(wù)。

從受訪金融機(jī)構(gòu)的情況看,第一種方式更為普遍。王耀南介紹,招聯(lián)主要基于一系列開源的基座大模型(包括llama、qwen等),結(jié)合招聯(lián)對(duì)于業(yè)務(wù)的深入洞察和數(shù)據(jù)積累,通過強(qiáng)化學(xué)習(xí)、SFT微調(diào)等方式打造并開源了兩代智鹿大模型,在此基礎(chǔ)上構(gòu)建了包括消保智能體、審批智能體、運(yùn)營(yíng)智能體等一系列智能體應(yīng)用。

桂林銀行方面亦告訴界面新聞?dòng)浾撸撔写竽P脱邪l(fā)與應(yīng)用主要通過引入開源的通義千問大模型結(jié)合采購(gòu)行業(yè)垂直領(lǐng)域大模型,構(gòu)建大模型中臺(tái),集中統(tǒng)一管理大模型資源,目前已上線30余個(gè)大模型應(yīng)用。

目前DeepSeek-R1已開源,這不僅意味著各大金融機(jī)構(gòu)多了一個(gè)成本更低的開源模型選擇,更重要的是,DeepSeek正攪動(dòng)起一輪閉源開源之爭(zhēng),這實(shí)際上有助于推動(dòng)人工智能的整體開發(fā)和應(yīng)用進(jìn)程。

從應(yīng)用層面劃分,大模型大致可以分為兩類,一類是通用大模型,另一類是垂類大模型。在知識(shí)門檻技術(shù)較高的金融領(lǐng)域,業(yè)內(nèi)普遍認(rèn)為垂類大模型的性能匹配度會(huì)更高。

BloombergGPT是垂類大模型的典型之一。2023年3月30日,Bloomberg(彭博)正式發(fā)布金融行業(yè)大模型BloombergGPT,該機(jī)構(gòu)彼時(shí)表示,基于LLM(Large language Model,大型語言模型)的人工智能最新進(jìn)展已經(jīng)為許多領(lǐng)域展示了令人興奮的新應(yīng)用,然而,金融領(lǐng)域的復(fù)雜性和獨(dú)特術(shù)語需要特定領(lǐng)域的模型。

據(jù)官方介紹,彭博的數(shù)據(jù)分析師在四十年時(shí)間里收集并維護(hù)了金融語言文件,該團(tuán)隊(duì)從龐大的金融數(shù)據(jù)檔案中提取數(shù)據(jù),創(chuàng)建了一個(gè)由英文金融文檔組成的全面的3630億個(gè)token數(shù)據(jù)集。然后使用3450億個(gè)token的公共數(shù)據(jù)進(jìn)行擴(kuò)充,從而創(chuàng)建了一個(gè)包含超過7000億個(gè)token的大型訓(xùn)練語料庫。

該模型將幫助彭博改進(jìn)現(xiàn)有的金融NLP(Natural Language Processing,自然語言處理)任務(wù),例如情緒分析、實(shí)體識(shí)別、新聞分類和問答等。

招商銀行信息技術(shù)部副總經(jīng)理俞吳杰亦曾表示,招行重點(diǎn)不在搭建通用模型,而是搭建金融行業(yè)的領(lǐng)域模型。

俞吳杰表示,招商銀行不會(huì)在通用大語言模型上花費(fèi)更多精力,因?yàn)橥ㄓ么笳Z言模型在銀行業(yè)的運(yùn)用有其弱點(diǎn)——對(duì)專業(yè)知識(shí)理解有限,在專業(yè)領(lǐng)域數(shù)據(jù)處理能力較弱。囿于此,招行會(huì)在比較好的通用模型基礎(chǔ)之上,將足夠的專業(yè)領(lǐng)域知識(shí)給到大模型,“最起碼是銀行業(yè),未來還可能擴(kuò)展到證券、保險(xiǎn)等與銀行關(guān)聯(lián)性大的行業(yè)”。

如何“喂料”是其中的關(guān)鍵問題之一,而Deepseek-R1有望在這方面幫助銀行“提質(zhì)增效”。

“Deepseek-R1是通用大模型,知識(shí)量很廣,包括信貸業(yè)務(wù)等金融領(lǐng)域的知識(shí),這可以作為語料支持。將金融內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)結(jié)合優(yōu)化,亦可以降低訓(xùn)練成本?!敝艹切郾硎?。

“大模型對(duì)于業(yè)務(wù)模式的重構(gòu)是一個(gè)循序漸進(jìn)的過程,R1深度思考模式的引入,不僅有利于復(fù)雜推理場(chǎng)景下的AI技術(shù)應(yīng)用;同時(shí)也可以作為招聯(lián)自研模型‘自構(gòu)建數(shù)據(jù)’的引擎,結(jié)合足夠多且高質(zhì)量的數(shù)據(jù),帶來更優(yōu)異的推理效果?!蓖跻弦鄰?qiáng)調(diào)。

縮小大模型技術(shù)鴻溝?

金融領(lǐng)域是AI應(yīng)用最具潛力的領(lǐng)域之一。

“因?yàn)榻鹑陬I(lǐng)域的數(shù)據(jù)結(jié)構(gòu)化程度比較高,并且金融機(jī)構(gòu)對(duì)數(shù)據(jù)的管理相對(duì)合規(guī)完善,這對(duì)于生成式AI訓(xùn)練而言是比較好的數(shù)據(jù)基礎(chǔ)。但是因?yàn)榻鹑跀?shù)據(jù)涉及到用戶隱私以及跨地域、跨部門的監(jiān)管問題,如果要對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練,其實(shí)也存在一定的壁壘?!敝艹切郾硎尽?/p>

而在金融機(jī)構(gòu)之間,實(shí)際上存在著明顯的技術(shù)鴻溝。

此前有業(yè)內(nèi)人士表示,從行業(yè)角度看,大語言模型是一項(xiàng)持續(xù)的、規(guī)模大的投資,包括建集群、招聘人才等,且資源都比較稀缺,并非所有銀行都適合大規(guī)模投入其中。銀行業(yè)之間的交流非常多,中小銀行機(jī)構(gòu)可以復(fù)用一些業(yè)內(nèi)經(jīng)驗(yàn)。對(duì)于中小銀行,并不建議盲目跟風(fēng),尤其是一次性的大投入,目前大模型的發(fā)展還有很多變數(shù),包括通用大模型哪個(gè)更優(yōu),怎么部署等,都還在變化過程當(dāng)中。建議中小銀行機(jī)構(gòu)更多地做好行業(yè)交流學(xué)習(xí),針對(duì)自身實(shí)際情況量力而為才是更合適的。

Deepseek-R1有望帶來新的競(jìng)爭(zhēng)路徑。

桂林銀行方面告訴記者,Deepseek-R1是一款優(yōu)秀的國(guó)產(chǎn)大模型,對(duì)該行大模型策略產(chǎn)生了比較重要的影響。尤其是Deepseek-R1顯著降低了研發(fā)成本,使得中小型城商行能夠以更低的成本投入大模型的研發(fā)與應(yīng)用。

“以往研發(fā)金融大模型需要購(gòu)買大量的GPU卡來搭建高算力的基礎(chǔ)設(shè)施,成本高昂。而Deepseek-R1低操作成本特點(diǎn),讓我行在金融大模型應(yīng)用研發(fā)方面的投入產(chǎn)出比有望進(jìn)一步上升。Deepseek-R1在基礎(chǔ)設(shè)施方面帶來的降本增效,有助于我們投入更多資源到大模型應(yīng)用方面,能夠更好地專注于自身業(yè)務(wù)特點(diǎn),開發(fā)有針對(duì)性的垂直應(yīng)用?!痹撠?fù)責(zé)人稱。

桂林銀行方面認(rèn)為,Deepseek-R1的出現(xiàn)有望縮小中小型城商行與大型銀行在大模型應(yīng)用研發(fā)方面的差距。中小型城商行由于資源有限,在大模型研發(fā)上的投入相對(duì)較少,而Deepseek-R1的低數(shù)據(jù)訓(xùn)練成本和高性能,為中小型城商行提供了一個(gè)新的突破口。

“原來各機(jī)構(gòu)的技術(shù)差異可能比較大,有的土壤肥沃,有的貧瘠,投入產(chǎn)出比差異明顯;如今Deepseek-R1實(shí)現(xiàn)了通過較低的成本來獲得比較好的產(chǎn)出,相當(dāng)于大家在同一片肥沃的土壤上種植,整體拉高了投入產(chǎn)出比,技術(shù)差異有望縮小?!敝艹切垡啾硎?。

但對(duì)于中小型機(jī)構(gòu)而言,困難依然重重。“包括數(shù)據(jù)量相對(duì)有限,能承擔(dān)多少算力,人才問題,等等?!敝艹切垩a(bǔ)充稱。

另一方面,技術(shù)門檻的降低也并不意味著消弭差距,甚至可能拉大差距?!叭绻麢C(jī)構(gòu)懂得如何借力低成本的技術(shù)平臺(tái),相信能產(chǎn)生更好的效益,而對(duì)于不會(huì)利用的機(jī)構(gòu)而言,則會(huì)帶來負(fù)面影響?!敝艹切壅劶啊?/p>

在周城雄看來,中小金融機(jī)構(gòu)需要在自主開發(fā)和外部力量之間尋找一個(gè)平衡:如果完全用外部的大模型,可能不是那么好用,并不適合自身業(yè)務(wù);如果完全自主開發(fā),成本也會(huì)太高。

展望未來,周城雄認(rèn)為競(jìng)爭(zhēng)格局將取決于AI與業(yè)務(wù)的深度融合能力,而非僅僅成本的高低問題?!熬拖裥畔⒒顺钡臅r(shí)候,信息化與業(yè)務(wù)的融合水平也拉開了機(jī)構(gòu)之間的競(jìng)爭(zhēng)差距?!?/p>

但無論如何,在各個(gè)領(lǐng)域,大模型成本降低都是喜聞樂見的事情。

王耀南談及,以消費(fèi)金融為例,作為與人們?nèi)粘OM(fèi)聯(lián)系緊密的金融業(yè)態(tài),消費(fèi)金融具有量大、小額、分散等鮮明特點(diǎn),業(yè)務(wù)風(fēng)險(xiǎn)和運(yùn)營(yíng)成本較高,實(shí)現(xiàn)“普”與“惠”的平衡存在公認(rèn)難度。大模型技術(shù)的發(fā)展將進(jìn)一步推動(dòng)金融服務(wù)的顛覆式創(chuàng)新,在高效解決風(fēng)控、運(yùn)營(yíng)、服務(wù)等領(lǐng)域存在巨大應(yīng)用空間和顯著優(yōu)勢(shì)。

著眼生態(tài)發(fā)展,“DeepSeek在Nvidia CUDA技術(shù)體系之外,以其良好的原生生態(tài)支撐了包括華為昇騰在內(nèi)的一系列國(guó)產(chǎn)GPU技術(shù)棧,DeepSeek的‘破圈’及優(yōu)異的性能讓更多人認(rèn)識(shí)到國(guó)內(nèi)人工智能信創(chuàng)生態(tài)將會(huì)快速完善。未來,充分的市場(chǎng)競(jìng)爭(zhēng)一定會(huì)帶來投入產(chǎn)出比的上升。”王耀南表示。

責(zé)任編輯: 陳勇洲
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換