“打起來”!
OpenAI可能發(fā)布GPT-4.5,狙擊馬斯克Grok3。今天,OpenAI首席執(zhí)行官兼聯(lián)合創(chuàng)始人Altman突然表示,“對(duì)于高要求的測(cè)試者來說,試用GPT-4.5帶來的感受AGI的體驗(yàn),遠(yuǎn)比我預(yù)期的要深刻得多!”這說明GPT-4.5已經(jīng)進(jìn)入測(cè)試階段,離正式發(fā)布非常近了。
Altman的動(dòng)作似乎是為了阻擊馬斯克。北京時(shí)間2月18日中午,馬斯克xAI的第三代大語言模型Grok3發(fā)布。馬斯克表示,Grok3在測(cè)試中“表現(xiàn)優(yōu)于任何已經(jīng)發(fā)布的產(chǎn)品”。此外,馬斯克在社交媒體上的一則發(fā)文點(diǎn)燃了科技與游戲行業(yè)的關(guān)注:xAI將成立一家AI游戲工作室。這也點(diǎn)燃了A股市場(chǎng)游戲股的做多熱情。
OpenAI突然宣布
今天凌晨1點(diǎn),OpenAI首席執(zhí)行官兼聯(lián)合創(chuàng)始人Altman表示,“對(duì)于高要求的測(cè)試者來說,試用GPT-4.5帶來的感受AGI的體驗(yàn),遠(yuǎn)比我預(yù)期的要深刻得多!”這說明GPT-4.5已經(jīng)進(jìn)入測(cè)試階段,離正式發(fā)布非常近了。
近日,Altman還公布了公司備受期待的GPT-5模型的發(fā)展路線圖。GPT-5是2023年轟動(dòng)全球科技和政策圈的GPT-4AI語言模型的后續(xù)版本。Altman在X平臺(tái)上回應(yīng)提問時(shí)表示,GPT-5將在數(shù)月內(nèi)發(fā)布,暗示可能在2025年后期推出。
Altman在X平臺(tái)上詳細(xì)解釋,公司計(jì)劃在“數(shù)周內(nèi)”發(fā)布GPT-4.5(內(nèi)部代號(hào)Orion),這將是OpenAI最后一個(gè)非模擬推理模型。模擬推理模型(如o3)使用特殊技術(shù)來迭代處理用戶提出的問題,但比傳統(tǒng)的大語言模型(如GPT-4o)速度更慢,且并非適用于所有任務(wù)。
之后,GPT-5將成為一個(gè)整合了OpenAI當(dāng)前所有AI模型特性的系統(tǒng),包括傳統(tǒng)AI模型、SR模型,以及專門用于網(wǎng)頁搜索和研究的專業(yè)模型?!拔覀儗⒃贑hatGPT和API中發(fā)布GPT-5,作為整合了包括o3在內(nèi)的多項(xiàng)技術(shù)的系統(tǒng),”他寫道,“我們將不再單獨(dú)發(fā)布o(jì)3模型?!?/p>
Altman表示,ChatGPT免費(fèi)用戶將獲得“標(biāo)準(zhǔn)智能設(shè)置下的無限GPT-5對(duì)話訪問權(quán)限”,ChatGPT Plus用戶可以以更高智能級(jí)別運(yùn)行GPT-5,而Pro用戶則可以以最高智能級(jí)別運(yùn)行GPT-5。他還提到,這些集成的AI模型將能夠使用OpenAI的多項(xiàng)ChatGPT擴(kuò)展功能,包括高級(jí)語音模式、Canvas、搜索和深度研究。簡化復(fù)雜的產(chǎn)品線此前,Altman曾評(píng)論過未來GPT-5標(biāo)簽的隨意性,暗示公司去年發(fā)布的幾個(gè)AI模型本可以被命名為GPT-5。
馬斯克的大招
比較有意思的是,馬斯克也在今天發(fā)布他口中的“地表最強(qiáng)大的模型”Grok3。
據(jù)介紹,在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼寫作等能力表現(xiàn)方面,Grok-3在多項(xiàng)benchmark測(cè)試中均取得了比DeepSeek-v3、GPT-4o、Gemini-2pro更優(yōu)的效果。據(jù)悉,目前Grok3已經(jīng)在xAI內(nèi)部運(yùn)行了2周。
馬斯克早于2023年創(chuàng)辦人工智能企業(yè)xAI。但是,Grok的開發(fā)可以追溯到2015年。當(dāng)時(shí),Altman等11人共同創(chuàng)立OpenAI。然而,馬斯克與OpenAI團(tuán)隊(duì)理念不合,漸行漸遠(yuǎn),最終離開。后來,OpenAI于2022年底推出AI聊天機(jī)械人程序ChatGPT,在全球掀起一陣熱潮。
Grok一詞出自美國作家Robert Heinlein于1961年的小說《異鄉(xiāng)異客》,是他創(chuàng)造的火星語言中的一個(gè)詞語,意為透過共情或直觀地理解。該詞語后來被《牛津英語詞典》收錄,并逐漸引入電腦編程文化中。
那么,這個(gè)Grok模型究竟如何?據(jù)業(yè)內(nèi)專業(yè)人士總結(jié),首先,從模型性能對(duì)比看,在新的高中競(jìng)賽基準(zhǔn)測(cè)試中,大模型表現(xiàn)優(yōu)于小模型,顯示其泛化能力更強(qiáng);但在去年的測(cè)試中情況相反,體現(xiàn)模型真實(shí)的泛化情況。17個(gè)月間,Grok從幾乎無法解決高中問題,發(fā)展到具備較強(qiáng)能力。
二是,從能力遷移看,Grok不僅在數(shù)學(xué)和代碼比較問題上訓(xùn)練推理能力,也能用于解決游戲等多種不同任務(wù),它學(xué)會(huì)了檢測(cè)并糾正自身錯(cuò)誤,從數(shù)學(xué)和編碼中獲得泛化能力以解決其他問題。
三是,從硬件相關(guān),團(tuán)隊(duì)搭建GPU集群,通過諸如拔插電纜測(cè)試訓(xùn)練設(shè)置穩(wěn)定性,提升可靠性。預(yù)測(cè)未來兩三年內(nèi)機(jī)器將在一些領(lǐng)域獲獎(jiǎng),如菲爾茲獎(jiǎng)、諾貝爾獎(jiǎng)等。
四是,在實(shí)際應(yīng)用展示方向,Grok針對(duì)地球與火星間航天器轉(zhuǎn)移的物理問題給出Python代碼解答,雖未確定正確性,但模擬效果接近實(shí)際情況。另外,Grok生成類似俄羅斯方塊游戲的Python代碼。
算力、電力都要火?
今天盤面上,三變科技再度漲停。此前,該公司部分變壓器通過外貿(mào)代理公司對(duì)外出口。市場(chǎng)將其歸屬于xAI概念股。從目前來看,AI競(jìng)爭加劇,算力和電力可能都是關(guān)鍵。
財(cái)信證券表示,盡管DeepSeek-R1大幅降低了訓(xùn)練算力開支和模型推理成本,但算力對(duì)于模型性能的支撐仍是必選項(xiàng),AI應(yīng)用場(chǎng)景的爆發(fā)將推動(dòng)整體算力需求再上臺(tái)階。
信達(dá)證券也認(rèn)為,微信接入DeepSeek-R1,灰度測(cè)試AI搜索功能,采用公眾號(hào)推文+網(wǎng)頁搜索策略。此舉有望推進(jìn)AI應(yīng)用端升級(jí),提高各行業(yè)效率,推動(dòng)復(fù)雜AI場(chǎng)景落地,如人形機(jī)器人、自動(dòng)駕駛等。當(dāng)前DeepSeek用戶高速增長,算力需求激增,建議關(guān)注算力相關(guān)產(chǎn)業(yè)鏈。
可能市場(chǎng)還在一定程度上忽略了電力。昨天,國電電力放量大漲,放量金額超300%,中國核電等個(gè)股亦是明顯走強(qiáng),但從整體來看,這個(gè)板塊目前并未明顯啟動(dòng)。據(jù)一月份的一份數(shù)據(jù)報(bào)告,管理著從華盛頓特區(qū)到伊利諾伊州等13個(gè)州電力系統(tǒng)的PJM Interconnection LLC最新預(yù)計(jì),到2035年,夏季電力高峰需求將從去年創(chuàng)下的歷史高點(diǎn)增加近58吉瓦(大約增長38%),達(dá)到約210吉瓦。據(jù)統(tǒng)計(jì),這一預(yù)期電力增量將是新英格蘭電網(wǎng)歷史最高需求量的足足兩倍多。主要的原因就是人工智能的蓬勃發(fā)展。
另外,電力設(shè)備的需求也將增加。
校對(duì):彭其華