近期國務(wù)院發(fā)布的《關(guān)于深入實施人工智能+行動的意見》(以下簡稱《意見》),提出加快實施六大重點行動,“人工智能+科學技術(shù)”排在首位。
這釋放了什么信號?AI到底怎樣顛覆傳統(tǒng)的科研模式?“科學大模型”和我們熟悉的ChatGPT、DeepSeek有啥不一樣?AI怎么打破數(shù)學、物理、化學等“學科壁壘”?未來5到10年,科研形式會發(fā)生翻天覆地的變化嗎?
本期嘉賓來自AI for Science(人工智能賦能科學技術(shù))領(lǐng)域的先行者——北京科學智能研究院,我們邀請到了研究院院長李鑫宇,他將以生動的語言,帶我們踏上一次“科研未來之旅”,深入了解這場正在發(fā)生的“科研范式革命”。
本期嘉賓:北京科學智能研究院院長 李鑫宇
對話AI摘編:
主持人:國務(wù)院《關(guān)于深入實施“人工智能+”行動的意見》將“人工智能+科學技術(shù)”放在六大行動首位,在您看來這傳遞了什么信號?
李鑫宇:首先國家敏銳把握到了它對社會發(fā)展的重要意義。從歷史角度看,“科學技術(shù)是第一生產(chǎn)力”一直是核心,把它放在首位和整體發(fā)展邏輯一致,它是“AI+各行業(yè)、各領(lǐng)域”的底層支撐。這是重新梳理二者關(guān)系的重要政策——這次是把科學技術(shù)重新拉回視野,找回“以科技突破為底層帶動各領(lǐng)域發(fā)展”的核心結(jié)構(gòu),這點特別重要。
主持人:很多人知道AlphaFold的案例,您能講講AI引領(lǐng)的科研范式革命嗎?什么是科研范式?又“革”了傳統(tǒng)科研方法什么“命”?
李鑫宇:“科研范式”是托馬斯·庫恩在《科學革命的結(jié)構(gòu)》里提的,簡單說就是科研共同體的共同信念——大家相信用什么方法能解決科學問題,形成共識就是范式。歷史上就這么幾類:最早是“實驗”,靠觀測總結(jié)經(jīng)驗;后來牛頓等人用“理論推理”演繹世界;計算機來了,“計算”成了重要方式;互聯(lián)網(wǎng)時代,“數(shù)據(jù)驅(qū)動”成為主流?,F(xiàn)在聊任何科學問題,科研人員都會問“AI能不能幫我”,所以AI for Science成了新范式。
至于“革命”,其實不是革誰的命,而是像計算機一樣,給了我們更強的工具——過去想做卻做不到的事,現(xiàn)在能做了。比如蛋白質(zhì)折疊,之前有生物信息學方法、蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,始終沒找到高效預測蛋白質(zhì)結(jié)構(gòu)的工具,直到加入人工智能、深度神經(jīng)網(wǎng)絡(luò),這個問題得以解決?,F(xiàn)在各個行業(yè)、領(lǐng)域都有可能通過這種方式實現(xiàn)科學突破,這就是科研范式革命帶來的機會。
主持人:目前是不是所有領(lǐng)域都能用AI賦能,基本沒有不能的?
李鑫宇:得看科學研究的流程。如果從查文獻、梳理前人成果開始,AI已經(jīng)普遍賦能了——過去一個人一輩子能讀的論文、了解的工作有限,但現(xiàn)在大語言模型能全量吸收知識,甚至未來可以在深度解析所有文獻后,輸入新想法就能知道前人有沒有研究過,能精準定義“人類知識邊界”,這效率提升太大了,從這點看AI影響是全方位的。
但聚焦具體科研問題,得看三個維度。一是問題定義清不清?比如蛋白質(zhì)結(jié)構(gòu)預測,和真實結(jié)構(gòu)“像不像”有明確標準。二是數(shù)據(jù)夠不夠?數(shù)據(jù)、工具積累不到位,AI也沒法發(fā)力。三是AI能帶來顛覆性突破還是只是漸進式演進?得結(jié)合領(lǐng)域重要性看。不是所有問題都能靠AI解決,有些領(lǐng)域的傳統(tǒng)瓶頸根本不在AI能發(fā)力的地方。
主持人:《意見》提出要“加速科學發(fā)現(xiàn)進程”,特別是“從0到1”的突破。能否分享一個最讓您興奮的、AI助力重大科學發(fā)現(xiàn)的具體案例?
李鑫宇:“0到1”的突破大多公眾不熟悉,最典型的就是大家認可的蛋白質(zhì)結(jié)構(gòu)預測——有諾貝爾獎背書,確實是重大突破。但其實很多領(lǐng)域都在發(fā)生:比如AlphaGO的核心是在巨大的決策空間找最優(yōu)解,科研里這類事不少。像電動汽車動力電池的電解液配方——電解液是正負極間的導電介質(zhì),配方特別復雜,鋰鹽和輔助導電物質(zhì)的比例難拿捏,過去只能靠大量實驗,成本高、周期長?,F(xiàn)在用計算模擬加AI,能在海量配方里快速篩選出“還不錯”的方案,再用少量實驗驗證,效率提升太多。國家強調(diào)“0到1”,就是看到了我們有大量這樣的機會。
主持人:《意見》提到,“加快科學大模型建設(shè)應(yīng)用”。能不能用普通人能理解的方式解釋,什么是科學大模型?科學大模型能否像“超級顯微鏡”和“超級望遠鏡”一樣,成為一種全新的科研利器?
李鑫宇:ChatGPT像個“厲害的普通人”,能寫報告、處理日常事務(wù);科學大模型得像“厲害的科學家”,有三個核心能力:第一,“看得懂科學家能看懂的東西”——科學大模型必須能識別比如電鏡圖、核磁譜圖、天文圖像這些專業(yè)數(shù)據(jù);第二,“像科學家一樣推理”——科學家觀察現(xiàn)象后,能順著科學體系和邏輯框架推導結(jié)論,這種“科學長鏈條推理”能力它得有;第三,“會用科學家用的工具”——例如科學大模型得能操縱顯微鏡拍照、用計算模擬軟件做仿真。同時具備這三點才叫科學大模型,這對科研生產(chǎn)力提升是革命性的。
和通用大模型的區(qū)別?未來追求通用人工智能(AGI)的話,兩者可能殊途同歸,都是“全知全能”的智能體。但現(xiàn)在受訓練方法限制,科學大模型能走“垂直突破”路線——寫詩作畫雖不如通用模型,但科研能力卻遠超它。
主持人:目前國內(nèi)外科學大模型發(fā)展處于哪個階段?
李鑫宇:核心瓶頸還是在“數(shù)據(jù)”上?,F(xiàn)在我們會把簡單科學文本數(shù)據(jù)喂給基礎(chǔ)大模型,微調(diào)后讓它有一定科研能力,但沒觸到科學大模型的本質(zhì)——科學數(shù)據(jù)不是“有沒有”的問題,是“能不能用”。過去通用大模型靠“人工標注高質(zhì)量數(shù)據(jù)”,標注門檻低,但科學數(shù)據(jù)標注門檻高:很多化學分子式只有學化學的能認,天文圖像只有天文學者能解讀,得領(lǐng)域?qū)<襾順?,這個過程會很長。不過這對我國是大機會——我們是全世界本科及以上教育人數(shù)最多的國家,有足夠?qū)I(yè)人才做標注。
主持人:除了人工標注,現(xiàn)有科學數(shù)據(jù)量夠不夠?是不是還缺數(shù)據(jù)?
李鑫宇:AI發(fā)展已經(jīng)進入“下半場”,劃分標準就是存量和增量數(shù)據(jù)的比例——存量數(shù)據(jù)差不多挖透了,剩下的要利用,得更深度標注。比如很多科學數(shù)據(jù)存在數(shù)據(jù)中心、圖書館,但那是在“沒有AI”的背景下建的,沒考慮過AI能用,現(xiàn)在要給AI用,得先把“人類能看懂”的數(shù)據(jù)改成“AI能理解”的,這是第一步。
另外,現(xiàn)在很多科學儀器每天都產(chǎn)新數(shù)據(jù),我們得改造這些儀器,讓它們從“源頭”就產(chǎn)高質(zhì)量、符合AI需求的數(shù)據(jù),這也是長期過程。過去做數(shù)據(jù)是為了“人類查閱”,現(xiàn)在是為了“喂給AI(神經(jīng)網(wǎng)絡(luò))”,數(shù)據(jù)的“出口”變了,形式、標準也完全不同。我們正在建“數(shù)據(jù)與AI共同進化”的體系,但還不完善,一旦建成,AI賦能科研的能力會大幅提升,速度也會更快,它將進入到一個迭代循環(huán)的發(fā)展邏輯。
主持人:《意見》提到“強化人工智能跨學科牽引帶動作用,推動多學科融合發(fā)展”。請您給我們分享一些案例,AI是如何充當“粘合劑”,打破數(shù)學、物理、化學、生物等傳統(tǒng)學科壁壘的?
李鑫宇:先回顧學科起源——科學研究最初從哲學分化出來,核心原因是“人的生命有限”,一輩子研究不了所有領(lǐng)域,只能聚焦細分方向。久而久之,不同學科有了自己的方法、工具甚至語言體系,壁壘越來越深。AI的出現(xiàn)讓我們有了打破壁壘的能力:一是知識獲取快了,能涉獵更多領(lǐng)域;二是能“以問題為核心”而非“以學科為核心”整合知識。比如“找新藥”:化學叫“計算化學”,物理叫“計算物理”,生物叫“計算生物學”,數(shù)學叫“應(yīng)用數(shù)學”,但本質(zhì)都是解決“新藥設(shè)計”。過去學科語言不同,同樣方法可能有不同稱呼,溝通成本高;現(xiàn)在有語言模型能“內(nèi)容對齊”,輕松知道其他學科的相關(guān)成果,不用先學“對方術(shù)語”。這種“以問題為導向”的跨學科研究,過去不是不想做,是沒能力做——大家都認可融合重要,但受限于知識效率和語言壁壘,推進不了。AI正好起了“牽引”作用,讓“想做的事能落地”,所以意見里“強化牽引帶動作用”的措辭特別精準,沒有AI,跨學科可能只是“想法”。
主持人:《意見》獨到地提出了“創(chuàng)新哲學社會科學研究方法”。這是否是AI for Science概念的進一步拓展?
李鑫宇:哲學、社會學和自然科學最初也沒割裂,比如社會學也研究“科技哲學史”,后來漸行漸遠,是因為長期社會發(fā)展是“線性演進”,沒出現(xiàn)顛覆認知的科技革命?;仡櫄v史,農(nóng)耕時代取代原始社會、蒸汽時代取代農(nóng)耕時代,每次科技革命都會讓哲學、社會學“重新思考”——社會組成、倫理道德、責任主體等核心假設(shè)都會變?,F(xiàn)在AI快速發(fā)展,又是一次“顛覆性科技革命”,自然給哲學、社會學帶來新問題。比如,出現(xiàn)“全知全能的AI”,社會結(jié)構(gòu)會變嗎?AI的倫理責任怎么界定?這些問題比過去復雜。
所以,首先,哲學、社會學的“研究范圍”會隨AI拓展——不能只聚焦當下的“AI倫理挑戰(zhàn)”,要站在“科技革命重塑社會”的視角重新思考核心命題。這里我想呼吁:現(xiàn)在討論AI倫理、哲學問題的多是AI技術(shù)研究者,但長期做科學哲學、社會學的學者,可能有更深刻理解,卻常被當成“技術(shù)門外漢”排除在外,這是損失。其次,研究方法也可能改變——現(xiàn)在能用AI做“虛擬社會實驗”,比如建一個“多智能體社會”,觀察它的演進規(guī)律,這在過去不可想象。從這點看,AI確實拓展了哲學社會科學的研究邊界,算是AI for Science理念的延伸。
主持人:展望未來五到十年,被“AI+”重塑后的科研會是什么樣?剛?cè)胄械哪贻p科學家,工作方式、思維模式會和現(xiàn)在有啥大區(qū)別?
李鑫宇:可以先想個場景:你有了新科研想法,不用花幾個月寫“文獻綜述”。只需輸入模型,立刻就能得到答案:這個想法在人類知識邊界內(nèi)嗎?前人研究過嗎?這會徹底改變科研的起點。過去寫文獻綜述是“確認前人研究范圍”,要花大量時間查文獻;未來這個過程會被AI簡化,年輕科學家能把更多精力放在“創(chuàng)新”上,不是“重復驗證”。第二,年輕科學家能調(diào)動的“科研工具”會遠超現(xiàn)在。比如今天的年輕化學家,本科要花很久學“試管滴定”,手抖的人甚至做不了實驗;但未來的自動化實驗室里,只要編程設(shè)定“滴多少試劑”,AI就能精準操作。換句話說,“動手能力弱”不再是科研的障礙——哪怕你擅長理論推導,不擅長做實驗,AI也能幫你補齊短板,讓“腦力優(yōu)勢”充分發(fā)揮。這種變化會非???,不會等十年,可能三五年內(nèi),年輕科學家的工作方式就會有明顯不同。
主持人:作為AI與科研融合前沿的年輕院長,您對關(guān)注這場科技革命的青年研究人員、學子有什么建議?他們該怎么更好擁抱AI?
李鑫宇:眼下最重要的是“保持開放包容的心態(tài)”,同時“持續(xù)保持好奇心”,做科研時不給自己設(shè)限,就不會有真正的限制。把AI當成“伙伴”,用它去加速自己的研究進度,拓展自己的研究邊界。