大模型表現出的強大理解、生成和推理能力,讓各行各業(yè)開(kāi)始探索其落地應用。
中關(guān)村金融科技產(chǎn)業(yè)發(fā)展聯(lián)盟專(zhuān)家委員會(huì )主任委員周延禮在公開(kāi)場(chǎng)合表示,隨著(zhù)深度學(xué)習和人工智能算法的發(fā)展,算力的不斷提升以及數據的積累,人工智能與各行各業(yè)逐步結合、融合發(fā)展,成為新興經(jīng)濟發(fā)展的重要力量。
結合企業(yè)的具體實(shí)踐,科技界人士普遍認為,在當前探索可研和試點(diǎn)應用階段,企業(yè)一般從大模型訓練和微調入手,而基于大數據量、大規模參數進(jìn)行的大模型訓練,需要消耗大量算力資源??梢哉f(shuō),算力日益成為數字經(jīng)濟的新型生產(chǎn)力,作為算力的重要組成部分,存力的價(jià)值也日益凸顯。
金融機構落地大模型的關(guān)鍵點(diǎn)是什么?存力價(jià)值如何提升?根據《金融行業(yè)先進(jìn)AI存力報告》(以下簡(jiǎn)稱(chēng)《報告》),構建可用、可信、可控的先進(jìn)存力,是金融行業(yè)落地大模型的“必答題”。
算力集群存在“木桶效應”
算力、數據和算法是大模型落地應用的三大支撐要素,其中,算力需求最先迎來(lái)爆發(fā)。
目前,銀行、保險、證券等金融機構尤其是頭部金融機構已經(jīng)開(kāi)始落地大模型場(chǎng)景應用,并自建大模型能力。據了解,大模型的落地應用必須依托由高性能計算芯片、存儲和網(wǎng)絡(luò )共同構成的大規模算力集群,對此,金融機構也在進(jìn)行重點(diǎn)布局。
據中國工商銀行軟件開(kāi)發(fā)中心高級專(zhuān)家劉承巖介紹,工商銀行在算力方面已經(jīng)建成了可以支持千億模型訓練和推理的算力集群,引入了千億模型的算法。
需要注意的是,算力集群也存在“木桶效應”,其中,存力的重要性往往被忽視?!秷蟾妗诽岬?,大模型訓練等場(chǎng)景對于存力提出了一系列新挑戰,而存力也往往容易成為短板,制約算力效能發(fā)揮,成為大模型落地過(guò)程中潛藏的風(fēng)險。
簡(jiǎn)單來(lái)說(shuō),如果存儲和網(wǎng)絡(luò )性能無(wú)法支撐大規模的數據存儲、讀寫(xiě)和傳輸,高性能計算芯片無(wú)用武之地,價(jià)值也將大打折扣。
對于存力的發(fā)展,相關(guān)政策已有著(zhù)墨。2023年10月,工業(yè)和信息化部等六部門(mén)聯(lián)合印發(fā)《算力基礎設施高質(zhì)量發(fā)展行動(dòng)計劃》提出“加速存力技術(shù)研發(fā)應用”,圍繞全閃存、藍光存儲、硬件高密、數據縮減、編碼算法、芯片卸載、多協(xié)議數據互通等技術(shù),推動(dòng)先進(jìn)存儲創(chuàng )新發(fā)展。
滿(mǎn)足存力提升需要
補齊短板,重視存力的提升,與大模型落地應用場(chǎng)景密切相關(guān)。
根據相關(guān)調研結論,金融行業(yè)典型的大模型應用場(chǎng)景包括數據分析、智能問(wèn)答、智能客服、數字營(yíng)業(yè)廳、智能投顧、智能投研、營(yíng)銷(xiāo)內容生成、產(chǎn)品推薦、智能風(fēng)控等,部分場(chǎng)景已進(jìn)入試點(diǎn)應用階段。
面對復雜的應用場(chǎng)景,大模型作為變革性技術(shù),需要實(shí)現能力內化,金融機構在應用場(chǎng)景中優(yōu)先調用了自有大模型,并對其進(jìn)行訓練和部署,模型參數量往往在千億級。因此,對于大模型落地應用走在前列的金融行業(yè)而言,AI算力建設頗具挑戰。
“中國人保在大模型研究和應用場(chǎng)景落地過(guò)程中,感受到最大的限制并非是技術(shù)問(wèn)題,而是算力資源嚴重不足。” 中國人民保險集團科技運營(yíng)部總經(jīng)理劉蒼牧坦言,“在國產(chǎn)化算力尚未強大的當下,這對我們持續開(kāi)展大模型研究和推廣應用是一個(gè)巨大的挑戰。”
《報告》認為,在重視大模型能力建設的背景下,金融機構必須構建起堅實(shí)的智能算力基礎設施,以支撐大模型的高效訓練和部署。作為AI算力基礎設施的關(guān)鍵組成部分之一,構建先進(jìn)存力的著(zhù)力點(diǎn)在哪里?
《報告》稱(chēng),金融機構對于A(yíng)I先進(jìn)存力的需求可以總結為三方面:可用、可信、可控。具體來(lái)看,在可用方面,金融機構要滿(mǎn)足大模型場(chǎng)景對于存力的高吞吐、高IOPS、高帶寬、低延時(shí)的極致性能要求,提升算力資源利用率;在可信方面,在滿(mǎn)足以上極致性能要求的前提下,金融機構在先進(jìn)存力建設中還需要考慮信創(chuàng )適配問(wèn)題,同時(shí),破解國產(chǎn)硬件性能瓶頸;在可控方面,金融機構需要盡可能降低成本,在采購存儲系統時(shí),保證自身大模型能力建設的自主性和靈活性。
加強跨界合作
業(yè)內人士認為,大模型時(shí)代的到來(lái)將推動(dòng)新一輪算力基礎設施建設,先進(jìn)存力是其中至關(guān)重要的組成部分。
《報告》提出,相比算力、網(wǎng)絡(luò )可以通過(guò)直接采購成熟產(chǎn)品服務(wù)快速形成能力,軟硬件高度融合且更具開(kāi)放性的存力建設具有更大的挑戰性。金融機構應當提升對存力建設的重視度,同時(shí)在算力基礎設施建設中進(jìn)行前瞻性的統籌規劃,做好存力與算力、網(wǎng)絡(luò )的匹配,避免出現存力短板,阻礙大模型落地進(jìn)程。
“大模型算法技術(shù)門(mén)檻高,底層算力資源需求大,必須借助相關(guān)產(chǎn)業(yè)公司的技術(shù)和算力共同開(kāi)展大模型的底座研究和訓練。”劉蒼牧表示,智能前沿技術(shù)如通用大模型,在底層算力算法技術(shù)儲備方面的門(mén)檻極高,金融機構必將積極開(kāi)展跨界合作,充分發(fā)揮第三方機構的技術(shù)先發(fā)優(yōu)勢,與自身的業(yè)務(wù)場(chǎng)景和專(zhuān)業(yè)知識相結合,共同打造智能金融生態(tài)圈,實(shí)現優(yōu)勢互補和互利共贏(yíng)。
據了解,目前業(yè)內已有商業(yè)銀行、證券公司與科技企業(yè)在大模型算力基礎設施建設方面有所合作。
【關(guān)閉】