丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給鄭佳美
發(fā)送

0

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

本文作者: 鄭佳美 2024-10-23 15:44
導(dǎo)語:科學(xué)家看著生成結(jié)果,不敢相信這是AI整出來的東西。

還記得今年夏天讓眾多科研工作者“瑟瑟發(fā)抖”的 AI scientist 嗎?

彼時的它,作為一個由谷歌Transformer 論文作者 Llion Jones 和前谷歌研究人員 David Ha 共同創(chuàng)立的全自動科學(xué)研究平臺,從提出研究設(shè)想、檢查創(chuàng)新程度,再到設(shè)計實驗、編寫程序、再GPU上執(zhí)行實驗并收集結(jié)果,到最后完成論文的撰寫,一氣呵成,讓不少科研工作者早早就有了“事業(yè)危機感”。 此外,該項目還獲得了New Enterprise Associates、Khosla Ventures、Lux Capital等多家全球知名投資機構(gòu)以及NVIDIA等產(chǎn)業(yè)投資人的投資,進一步推動了其技術(shù)突破和市場化落地。

而這陣科學(xué)家“失業(yè)風”剛刮走沒多久,又一位國產(chǎn)“AI科學(xué)家” Nova 便橫空出世。

Nova 能夠生成大量突破性的科學(xué)Idea,在創(chuàng)新性、價值性、可行性等方面可以媲美甚至超過人類科學(xué)家。

歷史證明,突破性的Idea具有開啟新技術(shù)紀元的潛力——比如Transformer的出現(xiàn)引領(lǐng)了波瀾壯闊的AGI時代,ImageNet極大地加速了深度學(xué)習(xí)的發(fā)展,而最近的諾貝爾獎授予了幾位AI領(lǐng)域的科學(xué)家,也標志著AI發(fā)展史上的一個重要轉(zhuǎn)折點。如今,Nova正站在這樣的歷史節(jié)點上,以2.5倍于AI scientist的Idea生成能力,迅速在科研領(lǐng)域掀起新一輪風暴。直觀地說,當AI scientist還在思考第2個Idea時,Nova已經(jīng)提出了5個高質(zhì)量的創(chuàng)新Idea,每一個都有可能成為開啟未來科技新紀元的鑰匙。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

這個“妙 idea 連珠”的  Nova 大模型,是由西湖大學(xué)藍振忠團隊聯(lián)合浙江大學(xué)、電子科技大學(xué)等多所高校研發(fā)的。

而他們的出發(fā)點,就是解決現(xiàn)代科研工作中的一個難題:我要做什么?

他們希望大模型可以迅速閱讀最新的Paper,幫助科研工作者提取其中的關(guān)鍵信息,根據(jù)提取的信息,生成多個高質(zhì)量的 Idea。涉及到跨領(lǐng)域的知識,大模型也可以輕松完成。人類科學(xué)家只需要根據(jù)模型生成的內(nèi)容進行判斷,大大節(jié)省了科研的時間,從而提升科研的效率。

藍振忠說:“我身邊的科學(xué)家,包括我自己做科研這么多年了,有一個特別明顯的感受,就是我們雖然做著最前沿的最具探索性的事情,但實際組織工作的方式卻是非常傳統(tǒng)的,甚至像是手工作坊。”

“正因如此,Nova的誕生不僅僅是一個技術(shù)突破,更像是科研領(lǐng)域的一場革命,將極大地加速科研創(chuàng)新的過程。Nove模型的發(fā)布,只是團隊邁出的第一步,后續(xù)將持續(xù)發(fā)力:

1)從0到1:先讓模型在單個學(xué)科、領(lǐng)域?qū)崿F(xiàn)創(chuàng)新,快速驗證算法和模型效果,把基建和底子打好,讓模型成為一個可以給科學(xué)家使用的產(chǎn)品。

2)從1到10:進一步拓展模型的橫向能力,成為多學(xué)科的創(chuàng)新專家,不僅能生成創(chuàng)新的科學(xué)Idea,而且能自動執(zhí)行驗證,最終發(fā)表科研論文。

3)終極目標:讓模型能夠自驅(qū)地進行科學(xué)探索、商業(yè)創(chuàng)新,讓模型推進人類的科學(xué)突破與產(chǎn)業(yè)提升。

妙 idea 連珠

而 Nova 的實力也并不是紙上談兵,研究團隊為了評估Nova模型的綜合性能,分別從質(zhì)量、多樣性、新穎性三個方面對其進行了全面評估。

他們先是利用Claude-3 Sonnet作為裁判按照瑞士制錦標賽(Swiss System Tournament)對各個方法產(chǎn)生的idea的質(zhì)量進行評估。結(jié)果顯示,Nova方法生成的想法在質(zhì)量上顯著高于其他方法,有619和2521個想法得分為5和4,遠超過其他最新的方法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

多樣性方面,研究團隊通過計算idea之間的相似度來對生成的idea來進行去重。實驗中,隨著生成的想法數(shù)量的增加,Nova 模型可以通過迭代規(guī)劃和搜索不斷產(chǎn)生新的想法。在非重復(fù)百分比方面,Nova 的表現(xiàn)明顯優(yōu)于其他方法,超過80%的想法都是不重復(fù)的。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

最終,團隊為了探索文章提出的方法對持續(xù)生成新的idea的影響,還進一步通過消融實驗證明了該方法能持續(xù)生成新穎的非重復(fù)的idea。

實驗中,當不采用文章提出的規(guī)劃搜索方法時,迭代三次中的獨特想法數(shù)量(44.1)與迭代兩次 (42.4) 相比不再增加。這表明,如果沒有規(guī)劃搜索,僅依靠基于種子想法的檢索會限制獲取有價值的外部知識以進行創(chuàng)新。當規(guī)劃和檢索都被刪除時,由于沒有引入外部知識,獨特新穎想法的數(shù)量在迭代兩次后略有增加(從25.3增加到 30.6),在迭代三次的時候相比迭代兩次則停滯不前(從30.6增加到31.35)。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

除此之外,他們還找來了10位專家(包括對應(yīng)領(lǐng)域的博士,博后以及資深教授),對生成idea在Overall(整體),Novelty(新穎性),F(xiàn)easibility(可行性),Effectiveness(有效性)進行全面的評估。

最終研究人員發(fā)現(xiàn)在人工評估中,Nova 在整體質(zhì)量和新穎性方面均獲得了最高分。Nova貢獻了前4個想法的 37.5%,是四種方法中最高的。此外,Nova 在最差的 4個想法中所占比例非常低,在整體質(zhì)量方面僅占17.53%。在新穎性評估中也觀察到了類似的模式。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

研究團隊透露,當他們將得到的結(jié)果拿給身邊的科學(xué)家看,一眾科學(xué)家都不敢相信這是AI創(chuàng)作的!

Nova如何給科學(xué)家“整迷糊”

Nova模型之所以能讓科學(xué)家都“恍惚”,是因為它引入了一種增強的規(guī)劃和搜索方法,用于提升大語言模型的能力:

迭代規(guī)劃:Nova模型通過迭代的方式制定搜索計劃,旨在識別能夠增強當前想法新穎性和多樣性的文獻。這種規(guī)劃過程使得模型能夠不斷優(yōu)化生成的想法。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

除了迭代規(guī)劃外,Nova還有其他的方法來輔助提升模型的創(chuàng)新性,包括:

外部知識檢索:Nova模型結(jié)合了外部知識檢索機制,通過獲取相關(guān)文獻來豐富生成的想法。這一過程利用了最新的研究成果,確保生成的想法與當前科學(xué)前沿保持一致。

檢索增強生成:使用了檢索增強生成的方法,結(jié)合了檢索到的信息與生成模型的內(nèi)部知識,以提高生成內(nèi)容的質(zhì)量和相關(guān)性。

自我反思機制:為了防止生成的想法出現(xiàn)幻覺,模型利用了自我檢查、自我批評和反思等機制,確保生成的想法邏輯合理且符合實際。

多源種子想法生成:Nova模型通過多種科學(xué)發(fā)現(xiàn)方法生成初始種子想法,確保生成的想法具有多樣性和創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

綜合以上方法,當Nova拿到一篇文章后,就能自動化的去想如何提出好的idea來提升當前文章里提到的方法。

比如,下面的idea是當團隊把微軟的Research Agent原始paper作為輸入得到的優(yōu)化方法,它能自動分析當前方法沒有接入實時的數(shù)據(jù)流的缺陷,并提出方案去解決這個問題,具有較強的創(chuàng)新性。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

同時還能分析引入一個實時的反饋機制和自適應(yīng)的研究框架能進一步提升該方法的效果,這些都是一些實實在在可以研究和發(fā)表的idea,科學(xué)家想不“迷糊”都難:

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

制造“AI科學(xué)家”的科學(xué)家

西湖大學(xué)團隊領(lǐng)導(dǎo)人藍振忠,是Google輕量級大模型“ALBERT”(學(xué)術(shù)引用量約8000)的第一作者,《麻省理工科技評論》評選的2021年度亞太地區(qū)“35歲以下科技創(chuàng)新35人”,前Google人工智能科學(xué)家。

目前為西湖大學(xué)博士生導(dǎo)師,深度學(xué)習(xí)實驗室創(chuàng)辦人及負責人,西湖心辰創(chuàng)始人。

此外,他共同推出了對標GLUE的中文大模型評價基準ChineseGLUE(后簡稱為CLUE),廣受業(yè)界歡迎。他還帶領(lǐng)團隊研發(fā)了側(cè)重情感感知的西湖大模型和國內(nèi)首個輔助心理咨詢的AI咨詢師“小天”。

而西湖心辰推出的多模態(tài)通用大模型:西湖大模型,也具備長期記憶、情感感知和主動聊天等卓越的能力。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

雷峰網(wǎng)(公眾號:雷峰網(wǎng))據(jù)悉,他曾說:“讓AI自驅(qū)的進化,推進我們?nèi)祟惖目茖W(xué)突破與產(chǎn)業(yè)提升。”

AI可以代替人類科學(xué)家產(chǎn)生突破性的科學(xué)Idea嗎?最后,我們再拋出這個問題。至于這個問題的答案,或許就像追逐地平線一般,每當以為接近之時,它卻又在更遠的地方等待,留給我們的,是永恒的追求與思考。

“但追逐的腳步不會停止?!?/p>

論文地址:https://arxiv.org/abs/2410.14255


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

西湖大學(xué)發(fā)布 “AI 科學(xué)家” Nova,效果相比SOTA提升2.5倍

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說