2025-11-04 21:51:48
在2025金融街論壇年會上,清華大學(xué)統(tǒng)計與數(shù)據(jù)科學(xué)系主任劉軍教授接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,AI要實(shí)現(xiàn)更高層次發(fā)展,或需突破大模型靠統(tǒng)計概率“預(yù)測下一個詞元”模式的瓶頸。他指出統(tǒng)計學(xué)是開放學(xué)科,問題源自實(shí)踐,生物醫(yī)學(xué)等發(fā)展驅(qū)動其前行。對于統(tǒng)計背景投資者能否在股票投資上表現(xiàn)更優(yōu),他認(rèn)為投資機(jī)構(gòu)表現(xiàn)更佳,個人投資有諸多限制。
每經(jīng)記者|張壽林 每經(jīng)編輯|黃博文
日前,在2025金融街論壇年會上,《每日經(jīng)濟(jì)新聞》記者(以下簡稱“NBD”)現(xiàn)場采訪到美國國家科學(xué)院院士、清華大學(xué)興華卓越講席教授、清華大學(xué)統(tǒng)計與數(shù)據(jù)科學(xué)系主任劉軍教授。
他認(rèn)為,AI(人工智能)要實(shí)現(xiàn)更高層次的發(fā)展,可能需要突破當(dāng)前大模型靠統(tǒng)計概率“預(yù)測下一個詞元(Token)”模式內(nèi)在形成的潛在瓶頸。雖然現(xiàn)行方法對這一模式有各種細(xì)節(jié)上的改進(jìn),但還沒有找到另一個更高級的主導(dǎo)模式。
劉軍教授一直從事貝葉斯統(tǒng)計理論、蒙特卡洛方法、統(tǒng)計機(jī)器學(xué)習(xí)、狀態(tài)空間模型和時間序列、生物信息學(xué)等方向的研究,并做出杰出貢獻(xiàn),對大數(shù)據(jù)處理和機(jī)器學(xué)習(xí)領(lǐng)域有深遠(yuǎn)影響。
劉軍在采訪中也談到統(tǒng)計學(xué)自身發(fā)展。他指出,數(shù)十年來,生物醫(yī)學(xué)和其他大規(guī)模數(shù)據(jù)生成技術(shù)的發(fā)展驅(qū)動了統(tǒng)計學(xué)基礎(chǔ)學(xué)科持續(xù)前行。
記者了解到,劉軍教授提出的“Gibbs保守串抽樣和指針”曾是生物學(xué)者尋找DNA和蛋白序列中精巧模式的最流行的兩種算法之一,在了解基因調(diào)控和蛋白同源性方面有非常成功的應(yīng)用。

劉軍教授演講現(xiàn)場 來源:每經(jīng)記者 張壽林 攝
NBD:大型語言模型依托大數(shù)據(jù)與統(tǒng)計概率,通過持續(xù)預(yù)測下一個字生成語言回復(fù),這與外界以為的AI按照語義來推理判斷有很大不同。你如何看待這一問題?
劉軍:如果認(rèn)為大型語言模型理解語義,那就是浪漫敘事。大語言模型的基石就是“Next Token Prediction”,即一個字一個字地預(yù)測,并未真正“理解”語言本身,盡管DeepSeek、ChatGPT等工具經(jīng)常會給出驚艷的結(jié)果?!癗ext Token Prediction”在統(tǒng)計專業(yè)上又叫“Auto Regressive Model”,即自回歸模型,通過詞語(時間)序列間的關(guān)聯(lián),一步步向前預(yù)測。從這個角度看,它有可能成為AI模型向更高層次發(fā)展的一個潛在瓶頸,因此,語言模型或許需要考慮下一步如何突破這種思路。
事實(shí)上,目前已有人在嘗試新的思路,不再是一個字一個字地預(yù)測,而是可以一段一段地生成,類似于先搭建一個句子框架,再填充具體字詞。
在這一思路下,訓(xùn)練時每一個字是隱碼,即字碼所在位置為空,相當(dāng)于通過去噪的方式生成結(jié)果。據(jù)反映,這一方法的結(jié)果還不錯,但目前看很難說比“Next Token Prediction”效果更好。
這種整體規(guī)劃式生成語言的模式,更像人類思考和表達(dá)過程,這一模式的繼續(xù)發(fā)展可能會帶來新的驚喜,但其前景尚存在不確定性。
NBD:統(tǒng)計學(xué)基礎(chǔ)領(lǐng)域發(fā)展至今,已相當(dāng)成熟。當(dāng)前,該學(xué)科基礎(chǔ)領(lǐng)域還面臨哪些待解問題?
劉軍:統(tǒng)計學(xué)是一門開放學(xué)科,換言之,它并非有一套固定的問題等著去解決,也不會因某類問題的解決而宣告“完成發(fā)展”。
統(tǒng)計學(xué)科的很多問題源自實(shí)踐。比如,由于大家關(guān)注大模型的相關(guān)問題,統(tǒng)計學(xué)中高維數(shù)據(jù)方面的問題也獲得更多討論,這就是應(yīng)用驅(qū)導(dǎo)下的問題和方法探索。
回顧統(tǒng)計學(xué)最初發(fā)展,該學(xué)科主要受天文星象學(xué)研究和社會人口研究驅(qū)動。進(jìn)入20世紀(jì),由于遺傳學(xué)發(fā)展、農(nóng)業(yè)育種、工業(yè)實(shí)驗(yàn)設(shè)計發(fā)展等,統(tǒng)計學(xué)進(jìn)一步發(fā)展。
以英國統(tǒng)計學(xué)家費(fèi)希爾為例,他同時也是知名遺傳學(xué)家。針對群體遺傳研究的需求,他提出了著名的概率論進(jìn)化模型;針對農(nóng)業(yè)實(shí)驗(yàn)的需求,他又提出了隨機(jī)拉丁方設(shè)計方法,以及方差分析等統(tǒng)計推斷理論與方法。
數(shù)十年來,醫(yī)學(xué)、生物學(xué)的快速發(fā)展驅(qū)動統(tǒng)計學(xué)不斷前行。我自身也在從事生物信息學(xué)方面的研究。以分子生物學(xué)為例,基因芯片信息中隱含著細(xì)胞內(nèi)基因的表達(dá)與否。通過分析這些基因的遺傳與變異規(guī)律,可判斷特定變異與疾病的關(guān)聯(lián),進(jìn)而為針對性藥物開發(fā)提供支持。這些過程均需要統(tǒng)計學(xué)不斷更新自身方法以適配需求。
NBD:外界也比較關(guān)注統(tǒng)計學(xué)的另一個應(yīng)用場景,即股票投資。這也是一個概率決策的過程。從這一角度,統(tǒng)計學(xué)專業(yè)背景的投資者能否在股票投資上表現(xiàn)更優(yōu)?
劉軍:據(jù)我所知,投資機(jī)構(gòu)確實(shí)愿意雇用具有統(tǒng)計專業(yè)背景的人。但對于個人投資,統(tǒng)計學(xué)學(xué)得扎實(shí)并不意味著個人投資業(yè)績一定就好,因?yàn)橥顿Y還需要研究宏觀經(jīng)濟(jì)等多個方面,并且需要大量訓(xùn)練、大量資金和精力。因此,對于個人而言,精力上可能不足以應(yīng)對,資金量也無法支持頻繁買賣。整體看,還是大型頭部投資機(jī)構(gòu)和對沖基金在投資上表現(xiàn)更佳
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP