西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

本文作者：鄭佳美

2024-10-23 15:44

導(dǎo)語：科學(xué)家看著生成結(jié)果，不敢相信這是AI整出來的東西。

還記得今年夏天讓眾多科研工作者“瑟瑟發(fā)抖”的 AI scientist 嗎？

彼時的它，作為一個由谷歌Transformer 論文作者 Llion Jones 和前谷歌研究人員 David Ha 共同創(chuàng)立的全自動科學(xué)研究平臺，從提出研究設(shè)想、檢查創(chuàng)新程度，再到設(shè)計實驗、編寫程序、再GPU上執(zhí)行實驗并收集結(jié)果，到最后完成論文的撰寫，一氣呵成，讓不少科研工作者早早就有了“事業(yè)危機感”。此外，該項目還獲得了New Enterprise Associates、Khosla Ventures、Lux Capital等多家全球知名投資機構(gòu)以及NVIDIA等產(chǎn)業(yè)投資人的投資，進一步推動了其技術(shù)突破和市場化落地。

而這陣科學(xué)家“失業(yè)風”剛刮走沒多久，又一位國產(chǎn)“AI科學(xué)家” Nova 便橫空出世。

Nova 能夠生成大量突破性的科學(xué)Idea，在創(chuàng)新性、價值性、可行性等方面可以媲美甚至超過人類科學(xué)家。

歷史證明，突破性的Idea具有開啟新技術(shù)紀元的潛力——比如Transformer的出現(xiàn)引領(lǐng)了波瀾壯闊的AGI時代，ImageNet極大地加速了深度學(xué)習(xí)的發(fā)展，而最近的諾貝爾獎授予了幾位AI領(lǐng)域的科學(xué)家，也標志著AI發(fā)展史上的一個重要轉(zhuǎn)折點。如今，Nova正站在這樣的歷史節(jié)點上，以2.5倍于AI scientist的Idea生成能力，迅速在科研領(lǐng)域掀起新一輪風暴。直觀地說，當AI scientist還在思考第2個Idea時，Nova已經(jīng)提出了5個高質(zhì)量的創(chuàng)新Idea，每一個都有可能成為開啟未來科技新紀元的鑰匙。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

這個“妙 idea 連珠”的 Nova 大模型，是由西湖大學(xué)藍振忠團隊聯(lián)合浙江大學(xué)、電子科技大學(xué)等多所高校研發(fā)的。

而他們的出發(fā)點，就是解決現(xiàn)代科研工作中的一個難題：我要做什么？

他們希望大模型可以迅速閱讀最新的Paper，幫助科研工作者提取其中的關(guān)鍵信息，根據(jù)提取的信息，生成多個高質(zhì)量的 Idea。涉及到跨領(lǐng)域的知識，大模型也可以輕松完成。人類科學(xué)家只需要根據(jù)模型生成的內(nèi)容進行判斷，大大節(jié)省了科研的時間，從而提升科研的效率。

藍振忠說：“我身邊的科學(xué)家，包括我自己做科研這么多年了，有一個特別明顯的感受，就是我們雖然做著最前沿的最具探索性的事情，但實際組織工作的方式卻是非常傳統(tǒng)的，甚至像是手工作坊。”

“正因如此，Nova的誕生不僅僅是一個技術(shù)突破，更像是科研領(lǐng)域的一場革命，將極大地加速科研創(chuàng)新的過程。Nove模型的發(fā)布，只是團隊邁出的第一步，后續(xù)將持續(xù)發(fā)力：

1）從0到1：先讓模型在單個學(xué)科、領(lǐng)域?qū)崿F(xiàn)創(chuàng)新，快速驗證算法和模型效果，把基建和底子打好，讓模型成為一個可以給科學(xué)家使用的產(chǎn)品。

2）從1到10：進一步拓展模型的橫向能力，成為多學(xué)科的創(chuàng)新專家，不僅能生成創(chuàng)新的科學(xué)Idea，而且能自動執(zhí)行驗證，最終發(fā)表科研論文。

3）終極目標：讓模型能夠自驅(qū)地進行科學(xué)探索、商業(yè)創(chuàng)新，讓模型推進人類的科學(xué)突破與產(chǎn)業(yè)提升。

妙 idea 連珠

而 Nova 的實力也并不是紙上談兵，研究團隊為了評估Nova模型的綜合性能，分別從質(zhì)量、多樣性、新穎性三個方面對其進行了全面評估。

他們先是利用Claude-3 Sonnet作為裁判按照瑞士制錦標賽(Swiss System Tournament)對各個方法產(chǎn)生的idea的質(zhì)量進行評估。結(jié)果顯示，Nova方法生成的想法在質(zhì)量上顯著高于其他方法，有619和2521個想法得分為5和4，遠超過其他最新的方法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

多樣性方面，研究團隊通過計算idea之間的相似度來對生成的idea來進行去重。實驗中，隨著生成的想法數(shù)量的增加，Nova 模型可以通過迭代規(guī)劃和搜索不斷產(chǎn)生新的想法。在非重復(fù)百分比方面，Nova 的表現(xiàn)明顯優(yōu)于其他方法，超過80%的想法都是不重復(fù)的。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

最終，團隊為了探索文章提出的方法對持續(xù)生成新的idea的影響，還進一步通過消融實驗證明了該方法能持續(xù)生成新穎的非重復(fù)的idea。

實驗中，當不采用文章提出的規(guī)劃搜索方法時，迭代三次中的獨特想法數(shù)量（44.1）與迭代兩次 (42.4) 相比不再增加。這表明，如果沒有規(guī)劃搜索，僅依靠基于種子想法的檢索會限制獲取有價值的外部知識以進行創(chuàng)新。當規(guī)劃和檢索都被刪除時，由于沒有引入外部知識，獨特新穎想法的數(shù)量在迭代兩次后略有增加（從25.3增加到 30.6），在迭代三次的時候相比迭代兩次則停滯不前（從30.6增加到31.35）。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

除此之外，他們還找來了10位專家（包括對應(yīng)領(lǐng)域的博士，博后以及資深教授），對生成idea在Overall（整體），Novelty（新穎性），F(xiàn)easibility（可行性），Effectiveness（有效性）進行全面的評估。

最終研究人員發(fā)現(xiàn)在人工評估中，Nova 在整體質(zhì)量和新穎性方面均獲得了最高分。Nova貢獻了前4個想法的 37.5%，是四種方法中最高的。此外，Nova 在最差的 4個想法中所占比例非常低，在整體質(zhì)量方面僅占17.53%。在新穎性評估中也觀察到了類似的模式。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

研究團隊透露，當他們將得到的結(jié)果拿給身邊的科學(xué)家看，一眾科學(xué)家都不敢相信這是AI創(chuàng)作的！

Nova如何給科學(xué)家“整迷糊”

Nova模型之所以能讓科學(xué)家都“恍惚”，是因為它引入了一種增強的規(guī)劃和搜索方法，用于提升大語言模型的能力：

迭代規(guī)劃：Nova模型通過迭代的方式制定搜索計劃，旨在識別能夠增強當前想法新穎性和多樣性的文獻。這種規(guī)劃過程使得模型能夠不斷優(yōu)化生成的想法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

除了迭代規(guī)劃外，Nova還有其他的方法來輔助提升模型的創(chuàng)新性，包括：

外部知識檢索：Nova模型結(jié)合了外部知識檢索機制，通過獲取相關(guān)文獻來豐富生成的想法。這一過程利用了最新的研究成果，確保生成的想法與當前科學(xué)前沿保持一致。

檢索增強生成：使用了檢索增強生成的方法，結(jié)合了檢索到的信息與生成模型的內(nèi)部知識，以提高生成內(nèi)容的質(zhì)量和相關(guān)性。

自我反思機制：為了防止生成的想法出現(xiàn)幻覺，模型利用了自我檢查、自我批評和反思等機制，確保生成的想法邏輯合理且符合實際。

多源種子想法生成：Nova模型通過多種科學(xué)發(fā)現(xiàn)方法生成初始種子想法，確保生成的想法具有多樣性和創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

綜合以上方法，當Nova拿到一篇文章后，就能自動化的去想如何提出好的idea來提升當前文章里提到的方法。

比如，下面的idea是當團隊把微軟的Research Agent原始paper作為輸入得到的優(yōu)化方法，它能自動分析當前方法沒有接入實時的數(shù)據(jù)流的缺陷，并提出方案去解決這個問題，具有較強的創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

同時還能分析引入一個實時的反饋機制和自適應(yīng)的研究框架能進一步提升該方法的效果，這些都是一些實實在在可以研究和發(fā)表的idea，科學(xué)家想不“迷糊”都難：

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

制造“AI科學(xué)家”的科學(xué)家

西湖大學(xué)團隊領(lǐng)導(dǎo)人藍振忠，是Google輕量級大模型“ALBERT”（學(xué)術(shù)引用量約8000）的第一作者，《麻省理工科技評論》評選的2021年度亞太地區(qū)“35歲以下科技創(chuàng)新35人”，前Google人工智能科學(xué)家。

目前為西湖大學(xué)博士生導(dǎo)師，深度學(xué)習(xí)實驗室創(chuàng)辦人及負責人，西湖心辰創(chuàng)始人。

此外，他共同推出了對標GLUE的中文大模型評價基準ChineseGLUE（后簡稱為CLUE），廣受業(yè)界歡迎。他還帶領(lǐng)團隊研發(fā)了側(cè)重情感感知的西湖大模型和國內(nèi)首個輔助心理咨詢的AI咨詢師“小天”。

而西湖心辰推出的多模態(tài)通用大模型：西湖大模型，也具備長期記憶、情感感知和主動聊天等卓越的能力。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

雷峰網(wǎng)(公眾號：雷峰網(wǎng))據(jù)悉，他曾說：“讓AI自驅(qū)的進化，推進我們?nèi)祟惖目茖W(xué)突破與產(chǎn)業(yè)提升。”

AI可以代替人類科學(xué)家產(chǎn)生突破性的科學(xué)Idea嗎？最后，我們再拋出這個問題。至于這個問題的答案，或許就像追逐地平線一般，每當以為接近之時，它卻又在更遠的地方等待，留給我們的，是永恒的追求與思考。

“但追逐的腳步不會停止?！?/p>

論文地址：https://arxiv.org/abs/2410.14255

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

鄭佳美

編輯

發(fā)私信

當月熱門文章

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍

妙 idea 連珠

Nova如何給科學(xué)家“整迷糊”

制造“AI科學(xué)家”的科學(xué)家

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova，效果相比SOTA提升2.5倍