每日經(jīng)濟(jì)新聞 2024-08-15 08:18:11
每經(jīng)AI快訊,天風(fēng)證券研報(bào)表示,從IntelligencePerToken到InlligencePerTask的模型變化是重要方向。1)訓(xùn)練階段,大模型訓(xùn)練預(yù)計(jì)繼續(xù)遵循“ScalingLaw”。云、創(chuàng)業(yè)公司、主權(quán)AI將繼續(xù)大量采購(gòu)算力并建設(shè)數(shù)據(jù)中心,追求繼續(xù)提升IntelligencePerToken,預(yù)計(jì)全球訓(xùn)練集群將持續(xù)擴(kuò)容,在訓(xùn)練集群超過(guò)10萬(wàn)片GPU后,對(duì)數(shù)據(jù)中心的建造、部署、供電、互聯(lián)構(gòu)成新挑戰(zhàn)。計(jì)算密度、互聯(lián)密度、功率散熱密度與存儲(chǔ)密度將有望快速提升。2)推理階段,我們認(rèn)為樹狀搜索/自博弈等方式有望快速提升IntelligencePerToken,我們看好在計(jì)算階段GPU與CPU的高速互聯(lián)。以及在應(yīng)用階段,我們認(rèn)為模型新架構(gòu)帶來(lái)的規(guī)劃能力逐步提高;數(shù)學(xué)、代碼與通用能力也將逐步提升。此外,與市場(chǎng)普遍觀點(diǎn)不同,我們認(rèn)為2024年模型架構(gòu)的變化將成為最重要的變化,模型架構(gòu)變化有望帶來(lái)的能力進(jìn)步將直接打開大模型應(yīng)用的更廣闊空間。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
當(dāng)AI深度重塑經(jīng)濟(jì)增長(zhǎng)模式,我們?nèi)绾胃谩榜{馭”它?
蓉光閃耀,聚愛同行!150余場(chǎng)全國(guó)助殘日活動(dòng)開啟成都美好初夏
對(duì)話柏林駐華商務(wù)聯(lián)絡(luò)處首席代表李怡燃:中德經(jīng)貿(mào)合作向好,雙方企業(yè)攜手開發(fā)第三市場(chǎng)將是新趨勢(shì)
對(duì)話謝菲爾德外事負(fù)責(zé)人尼克·漢密爾頓:百聞不如一見,成都和謝菲爾德有許多相似的地方
對(duì)話英國(guó)南約克郡聯(lián)合政府市長(zhǎng)奧利弗·科帕德:從公園城市到先進(jìn)制造,全球城市必須共享經(jīng)驗(yàn)
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP