人工智能正在重塑科研底層邏輯、加速科學發(fā)現(xiàn),“人工智能+科學”已成為趨勢,為解決人類面臨的重大科學技術難題提供了前所未有的機遇。
7月26日,中國科學院聯(lián)合團隊研發(fā)的“磐石·科學基礎大模型”在2025世界人工智能大會上正式發(fā)布。“磐石·科學基礎大模型”是采用專業(yè)科學知識和數(shù)據(jù)進行訓練、服務于科學任務的智能底座,實現(xiàn)了對波、譜、場等多種科學模態(tài)數(shù)據(jù)的深入理解,具備科學文獻萃取融合、科學知識表征推理和科學工具編排規(guī)劃等核心能力,目標為各領域科技創(chuàng)新提供“堅如磐石”的智能支撐。
發(fā)揮體系化優(yōu)勢,打造“人工智能+科學”操作系統(tǒng)
當前,“人工智能+科學”研究普遍采用領域數(shù)據(jù)微調(diào)通用大模型、各自構建單一領域專用工具的模式,面臨科學數(shù)據(jù)孤島、專業(yè)推理能力不足、研發(fā)生態(tài)封閉三大挑戰(zhàn)。
聚焦這些挑戰(zhàn),中國科學院聯(lián)合研發(fā)團隊充分發(fā)揮完整自然科學學科體系、全棧式人工智能創(chuàng)新鏈、重大科學設施與科學數(shù)據(jù)等優(yōu)勢,開展體系化布局,推動“人工智能+科學”向平臺化、體系化的新范式加速變革。
“磐石·科學基礎大模型”可實現(xiàn)對數(shù)據(jù)和模型等各類資源的管理,以及對計算仿真等各類工具的調(diào)度,深度賦能“假設提出-方案規(guī)劃-仿真推演-實驗驗證-規(guī)律發(fā)現(xiàn)”的科研全流程。這意味著,“人工智能+科學”真正擁有了跨學科“操作系統(tǒng)”。科研工作者可在科研各環(huán)節(jié)輕松調(diào)用模型,實現(xiàn)人工智能在科學研究中的無感嵌入。
科學專業(yè)能力頂尖,為一線科研提供堅實支撐
“磐石·科學基礎大模型”始終圍繞科研人員的核心需求,以強大、全面的科學專業(yè)能力支持科學發(fā)現(xiàn)。
在核心架構方面,“磐石·科學基礎大模型”采用異構混合專家架構,在國產(chǎn)開源大模型基礎上面向科學領域進行深度定制,集成了自主研發(fā)的一系列面向共性科學數(shù)據(jù)模態(tài)的專用模型,并融合了AlphaFold、MatterGen等領域專業(yè)模型。
在科學能力方面,“磐石·科學基礎大模型”已系統(tǒng)掌握數(shù)理化天地生六大學科核心定理、定律與專業(yè)知識,并實現(xiàn)了對波、譜、場等多種科學模態(tài)數(shù)據(jù)的深入理解。具體測評中,在基礎學科領域國際通用的數(shù)據(jù)集里,達到數(shù)學、物理、化學、材料、生物各學科門類當前最佳性能;在通用人工智能助手測試基準(GAIA)、事實性問答數(shù)據(jù)集(SimpleQA)等國際權威測試中,展示了領先的科學專業(yè)工具調(diào)用和科學推理性能;在人類終極考試(HLE)中取得了優(yōu)秀成績。
圖:科學基礎能力測評
圖:復雜推理問題測評
基于“磐石·科學基礎大模型”,研發(fā)團隊還開發(fā)了“磐石·文獻羅盤”和“磐石·工具調(diào)度臺”兩個科學智能體。
“磐石·文獻羅盤”旨在輔助科研人員精讀文章、撰寫綜述、評估科研選題與技術路徑,已接入1.7億篇科技文獻與實時開源科技信息,可深度理解包含公式與圖表的科學數(shù)據(jù),一次性透徹梳理上千篇文獻。在其支持下,以往需要3至5天才能完成的文獻調(diào)研工作可縮短至20分鐘。
圖:磐石·文獻羅盤
“磐石·工具調(diào)度臺”旨在降低科研工具的使用門檻,可自主規(guī)劃及調(diào)用超過300個科學計算工具,實現(xiàn)工具的協(xié)同編排和便捷調(diào)用,可自動識別科研任務、智能編排并調(diào)度最優(yōu)工具鏈,提升科研流程效率,支持用戶靈活接入自有智能體與工具,快速搭建專屬科研應用。
圖:磐石·工具調(diào)度臺
改變正在發(fā)生,加速多個領域科學發(fā)現(xiàn)
“磐石·科學基礎大模型”已經(jīng)在多個學科領域進行了深入應用,大幅加速科研進程。
在生命科學領域,團隊依托“磐石·科學基礎大模型”構建了X-Cell數(shù)字細胞大模型,實現(xiàn)了從基因序列和中心法則到細胞表型的整體建模,推動數(shù)字細胞實現(xiàn)靶點發(fā)現(xiàn)全流程自動化。X-Cell正在支持調(diào)控網(wǎng)絡分析、虛擬細胞實驗和靶點發(fā)現(xiàn)應用。以蛋白質相互作用的藥物靶點發(fā)現(xiàn)為例,相對現(xiàn)有范式科研效率加速超過10倍。
在高能物理領域,北京正負電子對撞機的研究人員依托“磐石·科學基礎大模型”正在實現(xiàn)粒子物理研究任務的自動分解與高效規(guī)劃,生成覆蓋粒子物理工作流各階段的分析程序。這有效提升了粒子模擬速度與重建效率,為探索物質基本組成和宇宙基本規(guī)律提供了助力。
在力學研究中,“磐石·科學基礎大模型”發(fā)揮強大的科學數(shù)據(jù)理解和預測能力,高效計算高鐵模型在多種流體環(huán)境下的表面壓力場,為高鐵構型設計提供了數(shù)據(jù)支持。
此外,“磐石·科學基礎大模型”也正幫助科學家在化學合成中提升實驗效率,在分子結構預測中實現(xiàn)更加準確的預測結果,在天文觀測中實現(xiàn)智能化的全球資源調(diào)度與分析……并在服務真實科學需求的過程中,持續(xù)迭代提升模型的實用性與可靠性。
圖:應用案例
目前,“磐石·科學基礎大模型”已初步成為科學知識的全能手、文獻的超級分析師、專業(yè)問題的精算家,并將逐漸成長為科研攻堅的參謀和智囊,服務科學、賦能科研。
為推動“人工智能+科學”協(xié)同創(chuàng)新,中國科學院自動化研究所已聯(lián)合四十余家科研院所、高等院校及企業(yè)合作伙伴共同啟動“科學基礎大模型生態(tài)聯(lián)盟”計劃,并積極推動國產(chǎn)算力適配,著力構建開源開放、自主可控的“人工智能+科學”新生態(tài),為全球學術共同體貢獻中國方案,賦能科研范式重塑,開啟科學研究的無限可能。
“磐石·科學基礎大模型”現(xiàn)已全面開源,歡迎體驗!