0
作者:賴文昕
編輯:陳彩嫻
鮮少有人關注到這樣一個現象:
在大模型的發(fā)展初期,「研發(fā)」與「產品」往往來自同一個群體——程序員。
由于大模型技術的系統復雜,新一代大模型產品經理的數量稀少,程序員往往既是技術、又是產品。因此,程序員對 AI 大模型「究竟能解決什么問題」、「如何解決某個問題」的思考,也就在一定程度上刻畫了第一批大模型落地應用的模樣。
換言之,程序員不僅難以被淘汰,反而對大模型的進步扮演重要角色。
基于這個背景,由中國電子學會主辦、ATEC 前沿科技探索社區(qū)承辦的第四屆 ATEC 科技精英賽(ATEC2023),也以程序員為中心,將鏡頭聚焦在了程序員與大模型技術的「對話」上,探索程序員會如何利用大模型技術來解決現實生活中的實際難題,如「科技助老」。
上周,ATEC 2023 的比賽內容以真人綜藝節(jié)目《燃燒吧!天才程序員》的形式播出,讓觀眾在 48 小時的直播中觀看了青年一代程序員應用大模型思考應用解法的真實工作情況,在各大網絡平臺上引起了廣泛關注。
從賽題的內容設置來看,ATEC 2023 一反常規(guī),在評測程序員的大模型解法時,不是基于現有的學術界制定的性能評測榜單,如 C-Eval 等,而是從真實世界的用戶體驗出發(fā),圍繞老人用支付寶在生活繳費、醫(yī)療服務、紅包社交等場景中的問題,直接向程序員發(fā)起挑戰(zhàn)。
這也是國內首個圍繞大模型如何解決真實社會難題的程序員比賽。
48 小時的大模型極限挑戰(zhàn)
4 月 21 日晚,國內首個基于真實場景的大模型全鏈路應用競賽——ATEC 2023 的最后一輪比賽結束。
通過多輪線上賽、線下賽的比拼與評委的層層篩選,最終角逐出一支冠軍隊伍。團隊成員分別是畢業(yè)于哈爾濱工業(yè)大學(深圳) 電子與通信工程專業(yè)的周青松,東南大學軟件工程專業(yè)碩士在讀的吳東冬,華中科技大學軟件工程專業(yè)碩士在讀的“最年少選手”邱晨浩,以及華中科技大學網絡空間安全專業(yè)碩士在讀的王浩宇。
ATEC 2023 的線下比賽是一個「48 小時大模型極限挑戰(zhàn)」,進入線下賽的 16 名選手面對直播鏡頭的全程記錄,使用由賽事提供的近50張 A100 卡資源實戰(zhàn),最終勝出者能獲得 100 萬元獎金。
作為國內程序員與在校大學生首選的一線賽事,這已經是 ATEC 科技精英賽連續(xù)舉辦的第四個年頭了。
與傳統的技術競賽不同,ATEC 通過緊扣社會價值的命題設計,搭建模擬真實工作環(huán)境的比賽環(huán)境,旨在考察選手及其團隊成員間的綜合性問題解決能力。這種賽制設計不僅考驗參賽者的專業(yè)技能,也鍛煉了他們的團隊合作和現場應變能力,為應用型技術人才的培養(yǎng)提供了實踐平臺。
ATEC 一直倡導緊貼當下技術發(fā)展趨勢和產業(yè)實際需求命題,以反映真實工業(yè)場景中的挑戰(zhàn)。選手們在參賽過程中所面臨的技術難題和解決方案,正是工業(yè)界中亟待解決的技術或產品痛點。
圍繞真實場景和數據設計考點,ATEC 還為產業(yè)界提供了一個觀察和選拔人才的機會。在前三屆,線下賽的命題分別為「野生動物保護」、「科技反詐」與「科技助實」。
通過運營《燃燒吧!天才程序員》這一業(yè)內首檔代碼競技真人秀,ATEC 科技社區(qū)全景展現了比賽過程中青年科技選手間的競爭與合作、挑戰(zhàn)與反擊,真實地呈現了中國年輕一代科技從業(yè)者的面貌。
48小時線下賽現場
剛剛結束的 ATEC 2023 則首次圍繞大模型技術,以「科技助老」為題,基于真實場景和數據,使用清華大學計算機科學與技術系與智譜華章公司共同研發(fā)的千億參數多模態(tài)大模型 GLM,并采用全鏈路應用的考察形式,對選手的算法及工程實現能力提出了更高的要求。
比賽由中國電子學會主辦,ATEC 前沿科技社區(qū)承辦,清華大學、浙江大學、西安交通大學、上海交通大學、螞蟻集團共同協辦,包括北京大學、南京大學、新加坡南洋理工大學在內的12所高校參與合作。
作為本屆賽事的命題方之一,清華大學全程參與了線上賽、答辯、線下賽階段的命題及組織工作。
評審組負責人、清華大學副教授任炬在賽后指出:“我們希望用貼近真實工業(yè)場景的考察方式,鼓勵技術從業(yè)者和學習者腳踏實地,關注實踐應用、拒絕空中樓閣;每年會錨定一個具有社會價值的命題,提醒所有的行業(yè)同儕,技術應當造福社會;同時借助科技競技、甚至極限挑戰(zhàn)的形式,培養(yǎng)青年科技人堅忍不拔、勇于奮進的態(tài)度和面貌?!?/p>
比賽吸引了行業(yè)內眾多年輕有為的高手,賽事報名人數創(chuàng)下了歷史新高,一共有1901支隊伍、3000余位選手報名,并且超過51%的報名者來自211及以上院校。選手們來自清華大學、北京大學、中國科學技術大學、華中科技大學、中山大學、哈爾濱工業(yè)大學等高校,平均年齡只有 26 歲。
經過「大模型的知識引入」、「大模型的工具學習」、「AI新聞檢測」、「網絡安全大模型」這四個賽道長達三個月的線上淘汰賽后,最終有16支隊伍從千人競技中脫穎而出,成功殺入線下賽環(huán)節(jié)。
線下賽賽題貼近工業(yè)真實,清華大學與螞蟻集團圍繞「科技助老」來聯合命題,從「生活助老」、「智慧醫(yī)療」、「安全守護」三大板塊展開,選手們需要依托大模型技術,為銀發(fā)族開發(fā)一套能夠提供服務多方面養(yǎng)老需求的智能助理。
具體而言,這16支隊伍需要基于支付寶智能助理的真實場景,以老年人在支付寶上常用的生活類場景為例(生活繳費、醫(yī)療服務、紅包社交等),去探索如何借助大模型提供的自然語言交互的方式,使得老年人無需學習繁瑣的App操作方式,即可便捷地完成想要的操作。
在綜合性的考察下,選手們需要在48小時的極限直播中通過大模型技術破解老年人異地就醫(yī)所遇到的一系列現實問題。
冠軍團隊中的周青松認為,本屆比賽「科技助老」的主題很有實用價值,能降低智能工具的學習門檻,幫助老年人及其他存在學習障礙的人群,借助 AI 大模型的幫助,以簡單的對話就能辦理業(yè)務。
當養(yǎng)老乘上「Agent」快車
為什么本屆 ATEC 會聚焦「科技助老」呢?
ATEC出題人、螞蟻集團基礎智能部技術總監(jiān)張志強告訴雷峰網,人口老齡化已經成為當前國家人口變化發(fā)展趨勢的重要主題。一方面技術日新月異給銀發(fā)族帶來了科技鴻溝,另一方面,城市與農村地區(qū)人口分布不均衡帶來了失養(yǎng)難題,生活需求、醫(yī)療需求、安全保障需求,已經成為滿足銀發(fā)族養(yǎng)老需求、改善養(yǎng)老環(huán)境的三大重要命題。
如何依托先進的大模型技術,為老年人實現智慧養(yǎng)老,自然成為科技工作者面臨的重要挑戰(zhàn)。
基于「科技助老」這個主旨,選手們需要在比賽中解決技術與應用兩大層次的難題。
賽時選手代碼頁
在技術角度上,選手們面臨的第一個考核要點是檢索。模型需要通過網絡搜索引擎或者內部的檢索獲取文檔,然后再基于文檔來回答醫(yī)療相關的問題,文檔具有權威性,回答自然就可以更精確。
第二個考核要點則是對工具的調用。語言模型只能回復文字,但如果選手們的方案能調用工具完成實際任務,得分就會更高。比如,在對話框輸入自然語言需求“幫我訂一張明天十點從杭州到上海的二等座票”后,模型就能直接預訂好火車票。
此外,技術層面中檢測謠言、異常提問等均為語言大模型使用中的安全問題,同樣是本屆 ATEC 科技精英賽的重要考核點。
而從應用角度出發(fā),能否讓語言模型為老年人提供更好的智能化體驗,則是評判選手們的方案能否獲得高分的關鍵。其中,智能化體驗需緊密圍繞老年人需求,如出行、政策咨詢、醫(yī)療咨詢、安全能力等。
另外,探索如何降低模型部署的成本,是大模型面臨的現實問題與技術難點,同樣也是出題方設計賽題、考驗選手們是否充分思考、發(fā)揮創(chuàng)造力的考點之一。
“以前的模型不大,可以獨立部署,但現在模型部署成本很高。如果能通過隱私保護技術,對語言模型的輸入或交互方式提供保護,就可能節(jié)省大量資源。我們希望模型能變成類似發(fā)電站的工具,就不可能把發(fā)電機放在家里。因此,將原模型放在計算平臺上,通過一次計算方式調用或使用,這是一個非常有前景的技術與工程問題?!睆堉緩娫谫愂轮辈r向觀眾解讀道。
節(jié)目直播講解現場
當然,想在48小時內完成一個功能完備的 Agent 開發(fā)任務并不現實。因此,出題方將 Agent 完整的鏈路拆開成數個環(huán)節(jié),每個環(huán)節(jié)再提供對應的數據邏輯,讓選手們在有限時間內逐一攻破不同階段的任務。
周青松和團隊成員一起,贏得了這場「大模型極限挑戰(zhàn)賽」的冠軍,2022年碩士畢業(yè)于哈爾濱工業(yè)大學(深圳) 電子與通信工程專業(yè)的他,目前在科技大廠擔任高級工程師一職。
周青松擅長自然語言處理(NLP)與數據挖掘,曾獲「kaggle master」稱號,也在2021年的ATEC科技精英賽贏得了冠軍。兩年后,周青松在ATEC的賽場上再度奪得桂冠。
在談及參賽目的時,周青松坦言,高額的獎金是吸引他參賽的最初動力,同時,來自真實工業(yè)場景的命題,也讓「科技競技」變得更有價值。
讓周青松印象最深刻的是線下賽的最后一道賽題。題目落腳于醫(yī)療領域,選手們需要將醫(yī)療垂類知識引入大模型,盡可能提升大模型對診療相關問題的理解能力,增加其醫(yī)療知識的深度和廣度。
具體而言,模型需要在被問到一系列的疾病癥狀時,能提供準確的診斷并給出詳細的治療意見。診斷越精確、治療意見越恰當,選手們的得分就更高。
周青松與隊友們
在周青松看來,整場比賽中最具挑戰(zhàn)的部分是提升代碼的運行速度。代碼運行速度變慢,就會顯著增加訓練模型所需的時間和成本。
“這是一個非常極限的比賽,我們要在有限的時間內完成一系列任務,就特別依賴平時可能不太關心的代碼運行速度。”周青松告訴雷峰網,“在限時場景里,提高代碼運行速度很難也很重要,如果把它優(yōu)化好的話,就相當于整體的迭代速度都會領先于其他隊伍?!?/p>
AI First
作為國內首個基于真實場景的大模型全鏈路應用競賽,ATEC 精英賽是從本屆起開始聚焦大模型的。
“大模型技術在去年上半年火起來,在我們去年線下賽時已經很熱門,所以就提出今年賽題一定要做大模型相關的考題,這是熱點更是挑戰(zhàn)。”
張志強告訴雷峰網(公眾號:雷峰網),“大模型在業(yè)內有競賽,但結合應用的比賽較少。在判斷完各個維度后,我們認為自然語言交互一定是一種很重要的、面向未來的、AI 產品的交互模式,能夠彌補傳統交互模式的一些短板。本屆的主旨是科技助老,因為老年人不易理解手機操作邏輯,而自然語言交互對他們來說很簡單,所以基于大語言模型技術研發(fā)的 AI 產品尤其適合老年人使用?!?/p>
張志強花名「零幺」,作為螞蟻大模型的技術核心負責人,他與團隊負責螞蟻基礎技術的研發(fā),包括語言模型、知識圖譜與圖神經網絡,這些技術在支付寶中的人臉識別與金融、醫(yī)療等產品中都有所應用。
目前,語言模型的語料優(yōu)化是張志強團隊最重要的工作內容之一,團隊負責千億參數模型研發(fā)與語料優(yōu)化,并在百靈大語言模型基座的基礎上研發(fā)醫(yī)療行業(yè)大模型。
作為聯合命題方之一的螞蟻集團,與清華大學一起決定將本屆 ATEC 賽事以大模型為技術基座,也折射了螞蟻近年來「All In AI」的力度。
2023年,螞蟻集團提出了「AI First」戰(zhàn)略,與「支付寶雙飛輪」同「加速全球化」一起并稱為集團三大戰(zhàn)略。
其實早在「AI First」戰(zhàn)略對外宣布之前,螞蟻集團就已經對 AI 領域進行了深入投資和研究。大約在2022年9月,公司內部已經明確了以大模型為核心的 AI 研究方向。2022年底,螞蟻集團正式啟動大模型的研發(fā)項目。2023年11月,螞蟻百靈大模型通過備案。
除了自研模型的進程外,螞蟻的「AI First」戰(zhàn)略更體現在其不斷將大模型融入生活、金融、醫(yī)療健康等業(yè)務場景的努力中:
現正產品灰測、下月逐步開放的支付寶智能助理,能為用戶提供出行、健康、政務等領域的數字生活服務;
「金融管家」支小寶,可為用戶提供高質量的行情分析、持倉診斷、資產配置和投教陪伴等專業(yè)服務;
智能研發(fā)工具 CodeFuse,則支持整個軟件開發(fā)生命周期,可為企業(yè)提供AI研發(fā)全周期管理;
安全一體化解決方案「蟻天鑒」,能提供從檢測到防御的大模型一站式安全服務解決方案……
通過將特定領域的專業(yè)知識整合進通用大模型基座,大模型能夠更精準地適應并優(yōu)化多種垂直行業(yè)場景的應用。目前來看,螞蟻集團的大模型技術已在醫(yī)療、遙感、政務、金融等多個行業(yè)展現出顯著的應用成效,推動了這些領域的智能化轉型和效率提升。
而螞蟻自2020年起參與的 ATEC 科技精英賽也在不知不覺中成為國內最熱門的 AI 賽事之一,搭起連接優(yōu)秀技術研發(fā)者的橋梁,并以綜藝節(jié)目的方式向大眾傳播當下最新的 AI 技術。
寫在最后
ATEC 2023 由清華大學與螞蟻集團聯合命題,基于「科技助老」的主旨引入支付寶智能助理的場景和數據,賽題及數據庫會在不久后向全國眾多高校開放。清華學子們將首批在課程中直接學習到 AI 大模型在工業(yè)場景的實際應用。
不言而喻,在 ATEC 2023 中,學術界與產業(yè)界的深度合作相輔相成,中國電子學會、ATEC 前沿科技探索社區(qū)與以清華大學為代表的頂尖學術機構為競賽提供了強大的理論支持和人才培養(yǎng)平臺,螞蟻集團則提供了真實的工業(yè)場景及數據,雙方共同推動了 AI 大模型產學結合的發(fā)展。這種合作模式不僅為學生提供了實踐機會,也為科技企業(yè)輸送了高質量的人才。
作為出題方之一,螞蟻聚焦「AI First」戰(zhàn)略,在以賽事吸引 AI 人才的同時,也緊鑼密鼓的布局著自研模型與大模型的落地應用,再加上多年打磨出來的技術和積累的數據資產,螞蟻在大模型競賽中逐漸筑起一條「護城河」,擁有獨特的優(yōu)勢。
除了螞蟻集團外,隨著 AI 行業(yè)的焦點從「百模大戰(zhàn)」轉向 AI 應用落地,中國科技企業(yè)主導或深度參與的 STEM、編程、AI 領域的賽事越來越多,比如華為軟件精英挑戰(zhàn)賽、華為極客算法精英大賽、百度AI科技科技創(chuàng)新大賽、騰訊廣告算法大賽與阿里巴巴全球數學競賽等等。
科技企業(yè)紛紛在賽事布局與加注,除了讓科技青年們能提前「步入戰(zhàn)場」,在真卡、真算力、真場景下練兵外,更是以高額的獎金與校內難接觸的算力資源,拉開了一場企業(yè)間吸引尖端科技人才的較量。
畢竟,在大模型競賽中,人才方為攻城略地的關鍵。
以 ATEC 科技精英賽為首的一眾競賽不僅是科技企業(yè)對資源、技術實力的展示,更是對 AI 領域專業(yè)人才的深度挖掘和培養(yǎng)。通過競賽,企業(yè)能夠識別并吸引那些對大模型技術有深刻理解的人才,同時激發(fā)他們的創(chuàng)新潛力,促進與企業(yè)的合作。
賽事不斷,人才不斷,競爭亦不斷。
本文作者 anna042023 將持續(xù)關注AI大模型領域的人事、企業(yè)、商業(yè)應用以及行業(yè)發(fā)展趨勢,歡迎添加交流,互通有無。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。