“最近我們都在討論DeepSeek,雖然還沒到應(yīng)用層面,但都在想怎樣跟上這波浪潮。”一位銀行人士對《國際金融報》記者感慨道。
近日,DeepSeek在全球迅速走紅?!秶H金融報》記者注意到,目前,江蘇銀行已引入了新模型,也有銀行將之用于宣傳,而該新工具在銀行大模型應(yīng)用方面的技術(shù)突破價值更是引發(fā)業(yè)內(nèi)人士深思。
受訪專家指出,隨著DeepSeek及今后人工智能(AI)模型不斷迭代,單次推理計算成本逐步降低,算力基礎(chǔ)設(shè)施產(chǎn)能將逐步提升,這標志著大模型應(yīng)用從“技術(shù)可行性驗證”轉(zhuǎn)向“經(jīng)濟可行性落地”的關(guān)鍵拐點。
銀行下場“吃螃蟹”
2025年初,總部位于杭州的幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的DeepSeek-R1模型橫空出世,迅速成為春節(jié)期間的大爆款。只需點開深度思考和聯(lián)網(wǎng)功能,再簡單輸入指令,一位博文廣識的“賽博好友”便出現(xiàn)網(wǎng)絡(luò)另一端。本土化的數(shù)據(jù)庫賦予其極高的遣詞造句能力,較ChatGPT更低的價格門檻使其飛速傳播,仿佛只是一夜之間,DeepSeek就成為了網(wǎng)絡(luò)時尚單品。
也有銀行借DeepSeek的火爆,趁熱打鐵地做了場別樣的宣傳?!秶H金融報》記者注意到,在近日的一則推送中,海安農(nóng)商銀行通過與DeepSeek對話的形式,從資本實力、市場份額等多維度做了深度、全面的自我介紹,十分吸引眼球。
而在娛樂大眾的功能之外,DeepSeek還引發(fā)了行業(yè)人士更深層次的思考。記者在采訪中發(fā)現(xiàn),DeepSeek模型的技術(shù)突破價值成為多位專家的關(guān)注點。
近年來,做好數(shù)字金融大文章、推進數(shù)字化轉(zhuǎn)型已成為銀行業(yè)的共識。在近兩年的財報中,有多家上市銀行針對人工智能大模型的發(fā)展表達了積極態(tài)度,并披露了發(fā)展人工智能大模型的規(guī)劃或進展。
此次,江蘇銀行成為上市銀行中第一家“吃螃蟹”的機構(gòu)。據(jù)公眾號“蘇銀數(shù)字金融”披露的消息,江蘇銀行依托“智慧小蘇”大語言模型服務(wù)平臺,成功本地化部署微調(diào)DeepSeek-VL2多模態(tài)模型、輕量DeepSeek-R1推理模型,分別運用于智能合同質(zhì)檢和自動化估值對賬場景中。
“DeepSeek模型所具備的應(yīng)用能力多元,擁有強大的邏輯推理和自然語言處理水平,能夠?qū)崿F(xiàn)高性價比的部署?!彼叵仓茄懈呒壯芯繂T蘇筱芮對記者指出。
浙商證券研報顯示,DeepSeek-V3整個訓(xùn)練過程僅用了不到280萬GPU(圖形處理器)小時,相比之下,美國互聯(lián)網(wǎng)巨頭元宇宙平臺公司(Meta)發(fā)布的Llama3-405B的訓(xùn)練時長是3080萬GPU小時。DeepSeek-V3的訓(xùn)練成本約為557.6萬美元,而OpenAI(美國開放人工智能研究中心)為聊天機器人ChatGPT發(fā)布的語言模型GPT-4的訓(xùn)練成本則高達數(shù)億美元。
為何此次新模型的發(fā)布引發(fā)金融界的廣泛關(guān)注?蘇筱芮認為,除物美價廉的因素外,DeepSeek與其他一些AI大模型有所不同的是,其母公司專長于私募基金,擁有更強的金融基因。
國金證券計算機首席分析師孟燦在接受采訪時分析,DeepSeek具備客戶視角思維和上下文理解的核心優(yōu)勢,從經(jīng)營角度來看,AI思考的路徑呈現(xiàn)與人工審核結(jié)合,可以提高銀行決策的嚴謹性和專業(yè)性。
須重視安全性與準確性
中國銀行業(yè)協(xié)會在此前發(fā)布的《2024年度中國銀行業(yè)發(fā)展報告》指出,金融與人工智能有天然的契合點,AI大模型技術(shù)能夠充分挖掘銀行業(yè)的海量數(shù)據(jù),而銀行業(yè)具有適用AI大模型技術(shù)的豐富場景。當(dāng)前AI大模型正推進我國銀行業(yè)服務(wù)、營銷、產(chǎn)品等領(lǐng)域的全面革新,催化“未來銀行”加速到來。
隨著生成式AI技術(shù)加速滲透金融業(yè),銀行業(yè)對大模型的探索已從早期技術(shù)驗證邁向規(guī)?;瘧?yīng)用階段。當(dāng)前AI大模型在銀行業(yè)的落地路徑為何?有何風(fēng)險與挑戰(zhàn)?
“自ChatGPT問世以來,銀行就已經(jīng)投入了大量資源進行算力儲備和自有金融大模型的開發(fā)。在DeepSeek以及今后新的人工智能模型不斷迭代的過程中,單次推理計算成本逐步降低,意味著算力基礎(chǔ)設(shè)施產(chǎn)能將逐步提升,這也標志著大模型應(yīng)用從‘技術(shù)可行性驗證’轉(zhuǎn)向‘經(jīng)濟可行性落地’的關(guān)鍵拐點?!币晃汇y行業(yè)資深人士告訴記者,“前期Kimi、豆包的營銷熱潮和此次DeepSeek傳播熱度,也在全社會實現(xiàn)了AI的普及教育,公眾對金融行業(yè)AI應(yīng)用的接受度會進一步提升,而國家對人工智能產(chǎn)業(yè)的戰(zhàn)略扶持與規(guī)劃,也將對后繼產(chǎn)業(yè)人才培養(yǎng)帶來很大幫助?!?/p>
銀行是經(jīng)營管理風(fēng)險的機構(gòu),如何妥善處理人工智能大模型引入的安全風(fēng)險問題非常關(guān)鍵。
“在AI當(dāng)前應(yīng)用中,我們面臨的較大困擾是AI幻覺,即AI對輸入數(shù)據(jù)的誤解、過度泛化或在推理過程中的錯誤??梢哉fAI‘想象’出了某些不存在的事物或信息,就像人類在夢中或幻覺中看到的事物一樣?!鄙鲜鲢y行業(yè)人士向記者進一步介紹道,“這就要求我們對錯誤信息進行識別,一方面,借助DeepSeek開源的可解釋性工具鏈,使模型決策路徑透明度提升;另一方面,對企業(yè)的知識庫進行隔離,避免產(chǎn)生信息污染,并導(dǎo)致惡性循環(huán)?!?/p>
孟燦也指出,在大模型的使用過程中,銀行需要重點注意數(shù)據(jù)安全問題,把握好關(guān)鍵數(shù)據(jù)的邊界?!癆I大模型與客戶的每次對話都涉及客戶隱私。此外,數(shù)據(jù)被動收集可能涉及知識產(chǎn)權(quán)等問題”。
“從長遠來看,銀行或?qū)⒅鸩酵瓿苫贏I應(yīng)用的金融服務(wù)生態(tài)變革?!泵蠣N指出,“從生產(chǎn)力角度來看,過往基于問答的模式將轉(zhuǎn)變?yōu)樾畔⒌娜娣?wù),服務(wù)效率、服務(wù)準確性和客戶滿意度會提升,銀行決策的風(fēng)險性會降低。從生產(chǎn)關(guān)系來看,銀行自身的組織結(jié)構(gòu)或?qū)⒆兓?,與客戶的關(guān)系會更融洽。生產(chǎn)資料方面,銀行服務(wù)的軟硬件適配也會發(fā)生改變?!?/p>
蘇筱芮在采訪中表示,人工智能大模型的應(yīng)用在智能營銷、智能風(fēng)控等多個細分場景具備長遠的應(yīng)用潛力。后續(xù)或?qū)⒂懈喑峙茩C構(gòu)加入到AI升級的浪潮中來,在提升傳統(tǒng)金融業(yè)務(wù)質(zhì)效的同時,為金融安全、用戶資金賬戶安全保駕護航。
為何目前使用DeepSeek工具的銀行尚少?上述業(yè)內(nèi)人士指出,許多銀行開發(fā)金融大模型較早,雖然采用了分層的松耦合架構(gòu),但接口適配調(diào)整、知識庫的再訓(xùn)練都會影響模型遷移。但開源技術(shù)框架真正觸發(fā)了全行業(yè)的AI軍備競賽,隨著更多云計算平臺支持DeepSeek,會加速模型遷移。
“銀行發(fā)展大模型,根本競爭力來自于三個方面?!痹撊耸孔詈蠓治鲋赋?,“其一是企業(yè)能否真正形成完善的知識基座,打通知識孤島、碎片場景和反饋斷層,將業(yè)務(wù)及客戶反饋等形成企業(yè)的向量知識庫;其二是能否做好防火墻,即數(shù)據(jù)的隱私保護和風(fēng)險隔離,通過數(shù)據(jù)、模型和應(yīng)用層聯(lián)動,構(gòu)建模型全生命周期管理;其三是生態(tài)協(xié)同能力,要在擁有足夠業(yè)務(wù)場景反饋的基礎(chǔ)上,為客戶做減法,以盡可能簡潔、核心的信息呈現(xiàn),解決客戶的問題?!?/p>