每日經(jīng)濟(jì)新聞 2025-04-18 14:07:47
北京大學(xué)北京國(guó)際數(shù)學(xué)研究中心教授董彬接受專訪,探討AI輔助數(shù)學(xué)研究的進(jìn)展。董彬表示,正尋找解開數(shù)學(xué)研究隱藏密碼的“萬能鑰匙”,預(yù)計(jì)今明兩年部分?jǐn)?shù)學(xué)猜想或?qū)⒃贏I輔助下完成。董彬認(rèn)為,數(shù)學(xué)不會(huì)因AI發(fā)展走到盡頭,學(xué)生學(xué)數(shù)學(xué)重在培養(yǎng)邏輯思維與推理能力,這些能力在未來仍至關(guān)重要。
每經(jīng)記者 丁舟洋 畢媛媛 每經(jīng)編輯 楊夏
在北京大學(xué)數(shù)學(xué)學(xué)院籃球場(chǎng),曾有司職小前鋒的球員,上籃愛用“數(shù)學(xué)思維”規(guī)劃最佳路徑。他是昔日學(xué)生隊(duì)隊(duì)長(zhǎng)董彬,也是如今回歸北京大學(xué)的“80后”數(shù)學(xué)家。
董彬現(xiàn)任北京大學(xué)北京國(guó)際數(shù)學(xué)研究中心教授,兼任北京大學(xué)機(jī)器學(xué)習(xí)研究中心副主任,國(guó)家生物醫(yī)學(xué)影像中心、大數(shù)據(jù)分析與應(yīng)用國(guó)家工程實(shí)驗(yàn)室研究員,北京中關(guān)村學(xué)院常務(wù)副院長(zhǎng),用數(shù)學(xué)縱橫應(yīng)用領(lǐng)域是他的興趣與擅長(zhǎng)。他和團(tuán)隊(duì)針對(duì)腫瘤診療問題研發(fā)系列新的定量和定性分析算法和工具,在三甲醫(yī)院推廣,部分成果已轉(zhuǎn)化。
近日,《每日經(jīng)濟(jì)新聞》記者專訪董彬,探討他在AI輔助數(shù)學(xué)研究的最新進(jìn)展。董彬表示,正在尋找一把“萬能鑰匙”,解開數(shù)學(xué)研究中的隱藏密碼。
數(shù)學(xué)的每一步跨越都在重塑人類文明演進(jìn)的底層代碼。正如黎曼幾何奠定廣義相對(duì)論基礎(chǔ),進(jìn)而催生全球?qū)Ш较到y(tǒng)、天體觀測(cè)技術(shù)、航天軌道設(shè)計(jì)??大量未驗(yàn)證的數(shù)學(xué)猜想吸引著全球數(shù)學(xué)家攀登,而如果它們能被AI(人工智能)自主破解,這場(chǎng)認(rèn)知革命的意義遠(yuǎn)超技術(shù)突破本身。
“我預(yù)測(cè),在全球范圍內(nèi),今年或明年就會(huì)有一些數(shù)學(xué)猜想,在AI的輔助下完成,甚至由AI獨(dú)立完成。”董彬說,這也正是他主導(dǎo)的AI for Mathematics(簡(jiǎn)稱AI4M)致力于突破的方向。在這場(chǎng)中美激烈角逐的全球數(shù)學(xué)智能競(jìng)賽中,董彬團(tuán)隊(duì)正以中國(guó)方案沖擊AI數(shù)學(xué)推理的“無人區(qū)”。
董彬所設(shè)想的未來充滿挑戰(zhàn),來自事情本身,也來自人。
“2023年我剛開始做時(shí),很多人都覺得我在talking crazy(說瘋話)。”在他看來,若是“學(xué)界大佬們”看后斷言此事為天方夜譚,他反倒覺得值得全力以赴。“哪怕會(huì)撞到南墻,也要自己撞上去,看看到底是一面石頭做的墻,還是紙糊的墻?而我內(nèi)心堅(jiān)信此事可行。”
“新基石研究員項(xiàng)目”是一項(xiàng)聚焦原始創(chuàng)新、鼓勵(lì)自由探索、公益屬性的新型基礎(chǔ)研究資助項(xiàng)目。2022年,騰訊公司宣布10年內(nèi)出資100億元人民幣,支持富有創(chuàng)造力的科學(xué)家開展探索性與風(fēng)險(xiǎn)性強(qiáng)的基礎(chǔ)研究,實(shí)現(xiàn)“從0到1”的原始創(chuàng)新。董彬入選了第二期“新基石研究員”。
NBD:您本碩博都學(xué)數(shù)學(xué)專業(yè),后來轉(zhuǎn)向機(jī)器學(xué)習(xí)和人工智能(AI),投身AI4M,為何有這樣的轉(zhuǎn)變?
董彬:從讀博起,我就參與生物醫(yī)學(xué)影像和多個(gè)醫(yī)學(xué)成像與圖像分析項(xiàng)目。2014年回到北大后,繼續(xù)從事圖像重建、處理,以及基于圖像的診斷與輔助治療等工作。期間深度學(xué)習(xí)快速發(fā)展,從起步到爆發(fā),再到基礎(chǔ)模型出現(xiàn),讓我思考:借助強(qiáng)大的AI工具,是否突破計(jì)算成像領(lǐng)域瓶頸,實(shí)現(xiàn)范式革新。
基礎(chǔ)模型能統(tǒng)一處理不同任務(wù)、挖掘潛在關(guān)聯(lián),受此啟發(fā),我想探索構(gòu)建統(tǒng)一的計(jì)算成像模型或算法。經(jīng)研究發(fā)現(xiàn),各種成像方法在基本原理上,都可歸結(jié)為波與物質(zhì)的相互作用。而想打通不同成像模態(tài),關(guān)鍵在于構(gòu)建基于微分方程求解的基礎(chǔ)模型,這也是我在新基石項(xiàng)目中聚焦解決的核心問題之一。
NBD:一把解所有微積分的“萬能鑰匙”會(huì)帶來什么?
董彬:若能構(gòu)建為各類微分方程提供初始解的模型,其影響將遠(yuǎn)超出計(jì)算成像領(lǐng)域。于是我們著手研究偏微分方程(PDE)基礎(chǔ)模型。有了一維模型雛形后,我發(fā)現(xiàn)工業(yè)仿真、制造業(yè)等諸多領(lǐng)域在實(shí)際中都面臨相似難題——亟需通用的微分方程求解工具。這些領(lǐng)域研究者對(duì)微積分方程求解的精度要求不高,卻十分看重求解速度,畢竟他們更關(guān)心如何利用求解結(jié)果解決實(shí)際問題,推動(dòng)領(lǐng)域發(fā)展。因此,他們更需要精度適中、求解極快的微分方程求解器。
就像現(xiàn)在AI能寫很多代碼,但替代不了頂級(jí)的架構(gòu)師。數(shù)學(xué)家也是一樣,能提出有意義數(shù)學(xué)問題、建立一套理論體系的數(shù)學(xué)家,AI會(huì)如虎添翼。
NBD:如果有了這把“萬能鑰匙”,AI可以做哪些數(shù)學(xué)工作?
董彬:AI能助力數(shù)學(xué)家,承擔(dān)枯燥繁瑣的驗(yàn)證工作,未來甚至有望助力證明重要猜想。但這要求數(shù)學(xué)家精準(zhǔn)把握AI能力,熟練運(yùn)用AI工具。雖難確切預(yù)知這一天何時(shí)來臨,但預(yù)計(jì)未來一兩年會(huì)有初步成果。例如,今明兩年,部分?jǐn)?shù)學(xué)猜想或許能借助人工智能完成,形式可能是AI獨(dú)立完成,也可能是在數(shù)學(xué)家協(xié)作下實(shí)現(xiàn)。?
NBD:現(xiàn)在大語言模型也能回答出很多數(shù)學(xué)題,這和您研究的AI4M有何不同?
董彬:北京大學(xué)的AI評(píng)測(cè)組會(huì)定期測(cè)試市面上優(yōu)秀的AI大模型。雖然部分測(cè)試題目可能被AI接觸過,經(jīng)過我們?cè)u(píng)估,當(dāng)前頂尖語言模型在數(shù)學(xué)專業(yè)領(lǐng)域已達(dá)到研究生水平。這令人驚訝,但發(fā)揮極不穩(wěn)定,比如我認(rèn)為它不應(yīng)該做對(duì)的題它能做對(duì),我認(rèn)為不應(yīng)該犯錯(cuò)的題目,它會(huì)“陰溝里翻船”。
我希望AI具備比肩頂級(jí)數(shù)學(xué)家的推理能力,以有效輔助數(shù)學(xué)家進(jìn)行前沿探索,推理能力是AI發(fā)展的“皇冠上的明珠”AI4M不僅是AI賦能數(shù)學(xué),更是雙向賦能。我們希望通過解析數(shù)學(xué)家的推理過程,將其應(yīng)用于AI研究,提升AI的推理能力,同時(shí)讓數(shù)學(xué)推理能力遷移到其他需要推理的非數(shù)學(xué)領(lǐng)域。
NBD:您如何訓(xùn)練AI的數(shù)學(xué)推理能力?
董彬:數(shù)學(xué)證明類似“搜索”,每一步都要尋找、嘗試數(shù)學(xué)技巧,簡(jiǎn)化問題或靠近結(jié)論。定理證明可抽象成一個(gè)馬爾可夫決策過程,AI需在各狀態(tài)下選最“靠譜”操作,快速構(gòu)建嚴(yán)密證明。數(shù)學(xué)家證明時(shí)也在探索,但受自身能力和知識(shí)局限,單位時(shí)間考慮的路徑、運(yùn)用的技巧遠(yuǎn)不如計(jì)算機(jī)高效全面。這正是AI用于數(shù)學(xué)推理的巨大優(yōu)勢(shì):解構(gòu)數(shù)學(xué)家思維,發(fā)揮計(jì)算機(jī)大規(guī)模搜索和快速計(jì)算的長(zhǎng)處,能讓AI短時(shí)間內(nèi)擁有類似頂級(jí)數(shù)學(xué)家的推理、證明能力。
數(shù)學(xué)對(duì)推動(dòng)人工智能發(fā)展極為關(guān)鍵,但目前AI領(lǐng)域工程推進(jìn)快于理論研究,原因之一是數(shù)學(xué)理論研究效率較低,沒有數(shù)學(xué)家能精通所有數(shù)學(xué)工具。但如果類似鋼鐵俠的人工智能管家——賈維斯,AI全面掌握數(shù)學(xué)理論知識(shí),數(shù)學(xué)家提供想法與直覺,就能大幅提升效率,縮小理論與實(shí)踐間的鴻溝。
董彬期望人工智能不只是智能導(dǎo)航工具,更要成為智能領(lǐng)航員和真正的伙伴。他認(rèn)為:“一些數(shù)學(xué)家在思想、直覺和前瞻性方面具有獨(dú)到之處,但在證明技巧和部分工具運(yùn)用上存在短板,而AI正好可以彌補(bǔ)這一不足。這樣的配合無疑是理想的。”
NBD:怎樣才能確認(rèn)是AI自身的能力,而非基于數(shù)據(jù)檢索得到的結(jié)果呢??
董彬:分清AI是自主思考還是檢索現(xiàn)成答案并非易事。畢竟人類證明時(shí)調(diào)取記憶經(jīng)驗(yàn),也類似“搜索”。關(guān)鍵要看AI能否構(gòu)建自身數(shù)學(xué)知識(shí)體系,依據(jù)當(dāng)下情境自行推導(dǎo)下一步,而非簡(jiǎn)單輸出存儲(chǔ)答案。若AI遇到面對(duì)新問題能提出全新證明思路,或推導(dǎo)步驟邏輯連貫合理,并非拼湊已知結(jié)果,那就說明它在真正“思考”,借此可更好判斷它是否具備自主推理能力。
NBD:若未來舉辦人類和AI的數(shù)學(xué)“刷題大賽”,人類還有機(jī)會(huì)勝出嗎?
董彬:人類和AI培養(yǎng)邏輯推理都需要大量“刷題”,但AI刷題速度遠(yuǎn)超過人類。人類解一道題的時(shí)間,AI能解千上萬道。數(shù)學(xué)對(duì)錯(cuò)標(biāo)準(zhǔn)明確,這種效率差距更突出。這類似圍棋比賽,起初人們認(rèn)為計(jì)算機(jī)難敵頂級(jí)高手,可AI憑計(jì)算和訓(xùn)練速度優(yōu)勢(shì)最終獲勝。數(shù)學(xué)領(lǐng)域也如此,AI訓(xùn)練效率提升幾個(gè)量級(jí)后,極短時(shí)間就能達(dá)到極高推理水平,在“刷題大賽”中碾壓人類。因此,從效率和題量看,人類幾乎沒機(jī)會(huì)在這類比賽中勝出。這并非人類邏輯思維不行,而是AI在解題速度和規(guī)模上優(yōu)勢(shì)巨大。?
NBD:您希望培養(yǎng)頂級(jí)AI數(shù)學(xué)家,還是為數(shù)學(xué)家打造個(gè)頂級(jí)AI工具??
董彬:AI與頂級(jí)數(shù)學(xué)家應(yīng)相輔相成,能力需接近他們,就像數(shù)學(xué)家傾向挑選資質(zhì)出眾的學(xué)生。服務(wù)頂級(jí)數(shù)學(xué)家的AI,自身能力必須與數(shù)學(xué)家相當(dāng)。從人類視角,創(chuàng)新源于知識(shí)和推理能力結(jié)合。如今模型已積累海量知識(shí),若再有頂尖人類的推理能力,就能開啟真正創(chuàng)新,畢竟人類創(chuàng)新依賴這兩種能力融合。?
學(xué)生要加入AI4M這個(gè)持久戰(zhàn),難免會(huì)因短期難發(fā)論文有所顧慮。董彬理解他們的壓力,同時(shí)也積極引導(dǎo):不是不發(fā)論文,而是要提升論文質(zhì)量。“學(xué)生能發(fā)四五篇那種看摘要就知道研究套路、只是表述出彩的論文。我允許我的博士在畢業(yè)時(shí)只發(fā)一兩篇論文,但這些論文一定要讓人看了眼前一亮,會(huì)驚嘆:這件事居然還能這么做!”
NBD:您擔(dān)心數(shù)學(xué)會(huì)發(fā)展到盡頭嗎?或“吞并”所有學(xué)科?數(shù)學(xué)會(huì)走到盡頭嗎
董彬:數(shù)學(xué)永遠(yuǎn)不會(huì)因?yàn)槟承┲卮蟛孪氡籄I解決而走到盡頭。數(shù)學(xué)是一種語言,即使現(xiàn)有表述內(nèi)容被攻克,還能創(chuàng)造新詞匯、概念,來描述自然界機(jī)制。把數(shù)學(xué)領(lǐng)域看作球體,其存在代表未完善部分的孔洞。過往數(shù)學(xué)家致力于填補(bǔ)孔洞、架起橋梁、完善內(nèi)部結(jié)構(gòu)。通用人工智能出現(xiàn)后,孔洞可能自動(dòng)被修補(bǔ),促使數(shù)學(xué)家將精力轉(zhuǎn)向拓展球體邊界,即擴(kuò)充數(shù)學(xué)知識(shí)邊界。
NBD:與全球開展同類研究的團(tuán)隊(duì)相比,你們研究進(jìn)展速度如何?
董彬:谷歌DeepMind團(tuán)隊(duì)是我們最大的競(jìng)爭(zhēng)對(duì)手。2024年,我又喜又憂:喜的是發(fā)現(xiàn)DeepMind技術(shù)路徑與我們不謀而合,證明方向前景廣闊;憂的是,因?yàn)楣雀杷懔h(yuǎn)超我們,這促使我們調(diào)整目標(biāo)和技術(shù)路徑,避免正面算力競(jìng)爭(zhēng)。
評(píng)估DeepMind的內(nèi)部研究進(jìn)展非常困難。盡管在解決當(dāng)前研究難題(尤其是獲取高質(zhì)量數(shù)據(jù))方面,DeepMind并沒有明顯的優(yōu)勢(shì),但在算力等資源方面卻具備一定優(yōu)勢(shì),因此整體競(jìng)爭(zhēng)態(tài)勢(shì)難以判斷。
另一方面,中國(guó)也擁有獨(dú)特的優(yōu)勢(shì)。廣泛且深厚的數(shù)學(xué)教育為我們的研究打下了堅(jiān)實(shí)的基礎(chǔ),團(tuán)隊(duì)中聚集了頂級(jí)的基礎(chǔ)數(shù)學(xué)家,在領(lǐng)域知識(shí)和理論深度上表現(xiàn)突出,我們?cè)陉P(guān)鍵環(huán)節(jié)上有獨(dú)到的視角和方法,這使得我們有望在競(jìng)爭(zhēng)中取得突破。
NBD:若不久后AI能解所有數(shù)學(xué)題,現(xiàn)在學(xué)生學(xué)數(shù)學(xué)是學(xué)什么?
董彬:即使未來AI可解決所有數(shù)學(xué)題,學(xué)生學(xué)數(shù)學(xué)仍意義重大。數(shù)學(xué)核心是培養(yǎng)邏輯思維與推理能力,這些能力在各領(lǐng)域都至關(guān)重要?,F(xiàn)在大模型訓(xùn)練推理能力,也不只為解數(shù)學(xué)題,而是希望應(yīng)用于其他學(xué)科。這和各專業(yè)學(xué)生都要學(xué)數(shù)學(xué)同理:無論技術(shù)多先進(jìn),嚴(yán)謹(jǐn)思考、系統(tǒng)分析問題的能力始終不可或缺。
(文中圖片除標(biāo)注外,均為受訪者供圖)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP