0
作者 | 李揚霞
編輯 | 陳彩嫻
他們的大腦掌握著復(fù)雜的邏輯和算法。
他們的眼睛審視著一行行的代碼。
他們的手指是精準(zhǔn)的輸入工具。
給他們一臺電腦,他們就能改變世界……
最近,中國首檔以程序員為中心的真人綜藝節(jié)目《燃燒吧!天才程序員》第三季熱映,再次將掌握國內(nèi)頂尖科技的程序員展現(xiàn)在大眾眼前。
節(jié)目中,他們的手指在鍵盤上飛速敲擊,如同舞者在舞臺上熱烈地舞動著,技巧和熱情均展露地淋漓盡致。每一次敲擊,都是程序員與計算機的一次互動,一行行代碼也在他們的指下流出。而這些代碼所組成的世界,都有一個共同的野心:用技術(shù)改變世界。
這 16 位燃燒的程序員選手都是獨特的。他們對技術(shù)擁有不同的認(rèn)知和思考,同時也有各自的優(yōu)勢和劣勢,以及偏好和厭惡。
他們從千人的線上賽一路披荊斬棘,進(jìn)入到線下總決賽。
他們或奔著100萬獎金的誘惑而來、或為了增加自己實踐履歷、或為了在接近真實的工業(yè)場景下激發(fā)自己的創(chuàng)造力和想象力。
但無論如何,他們在這里都會有所收獲。
《燃燒吧!天才程序員3·科技助實》是基于第三屆ATEC科技精英賽(ATEC2022)錄制的節(jié)目。
在這里,“技術(shù)的力量被看見,程序員的聲音被聽見。”
1
“實踐經(jīng)驗”比獲獎更有價值
在21世紀(jì)的今天,科技的力量日益顯現(xiàn),而實踐,才是解決問題的“金鑰匙”。
擰螺絲是大家都知道的事情,但擰得熟練不熟練卻有著很大的差別,平時看似很簡單的擰螺絲,在飛行器上就成了不簡單,因為小小螺絲釘?shù)拿撀浜芸赡茚劤纱笫鹿省?/p>
數(shù)字化時代,程序員的工作就是構(gòu)筑一座座賽博朋克大廈,如果出現(xiàn)Bug,那么整座大廈系統(tǒng)就會崩潰。
程序員需要掌握各種編程語言和技術(shù),而理論并不能代替實踐。正如古人云:“紙上得來終覺淺,絕知此事要躬行?!?/p>
而比賽正是學(xué)生從學(xué)校走向社會的一個重要的練武場。ATEC科技精英賽到今年已經(jīng)舉辦到第三屆,吸引了無數(shù)的學(xué)子以及愛好技術(shù)的程序員們。
周遠(yuǎn)哲就是參加ATEC比賽的選手之一,他來參加比賽的目的很簡單,除了百萬獎金的誘惑,就是可以學(xué)習(xí)到新的技術(shù)。
在他看來,比賽是一個很好的通過實戰(zhàn)學(xué)習(xí)的途徑,在比賽中很多知識都需要現(xiàn)學(xué),這個過程讓他感覺很興奮。作為線上賽“數(shù)字化安全”第二賽道,AB榜均為第一名的選手,誰能想到能獲得這么好的成績竟然都是現(xiàn)學(xué)的。他告訴AI科技評論,包括分布式學(xué)習(xí)和聯(lián)邦學(xué)習(xí)的知識和經(jīng)驗都是在這次比賽中學(xué)到的。
而且他還是第二賽道唯一一個以個人身份參賽的選手。在周圍都是團隊作戰(zhàn),強敵環(huán)伺的情況下,他選擇單打獨斗,而且還一舉拿下線上賽第一名,這是何等的孤勇。
而此前,他還做了一件更酷的事情,就是從物理轉(zhuǎn)到計算機。為了更好的就業(yè),他自學(xué)AI,并在短短兩年時間就進(jìn)?知名???作。
而他把這些成果歸結(jié)于自己主動學(xué)習(xí)的動機更強。一來受比賽的影響,學(xué)習(xí)效率相對高一些;二來想贏,所以就會更加積極。
在他看來攢經(jīng)驗值,比獲得獎項更為重要。
賽道二“數(shù)字化安全”考驗的是選手利用隱私計算(聯(lián)邦學(xué)習(xí)/協(xié)作學(xué)習(xí))、半監(jiān)督學(xué)習(xí)、圖學(xué)習(xí)等技術(shù)能力識別風(fēng)險商戶。這是周遠(yuǎn)哲從來沒有遇到過的場景,通過一步步的學(xué)習(xí)、驗證以及構(gòu)建模型,他對于聯(lián)邦學(xué)習(xí)、分布式的整個架構(gòu)以及流程都有了一定的了解。
只有親身實踐,才能更深入的理解知識,只有將抽象的理論知識和具體的情況相結(jié)合,知識才會更加生動。
目前高校教育更多“從定義出發(fā)“,缺乏實踐操作環(huán)節(jié),學(xué)生難以接觸和了解實際項目操作流程,導(dǎo)致學(xué)生難以學(xué)以致用,創(chuàng)新能力和解決問題的能力得不到充分鍛煉,
參加比賽的選手有很大一部分是學(xué)生,而ATEC社區(qū)的價值彌補了學(xué)生從學(xué)校走向社會,實踐能力不足的這一段鴻溝。
而通過比賽,不僅讓選手接觸到了一些前沿的技術(shù),也可以吸引更多具有創(chuàng)新精神和實際操作能力的人才參與其中,為解決現(xiàn)實問題貢獻(xiàn)力量。
2
真實工業(yè)場景引領(lǐng)創(chuàng)新
“以往的比賽,大家更關(guān)注提高模型的準(zhǔn)確度以及性能,沒有考慮到隱私保護,而現(xiàn)實中更需要做好模型的隱私泄漏防范,”李金膛如是說。
在實驗室模型的精度提高的再好,僅僅體現(xiàn)在冰冷的數(shù)字和機械中,也感受不到科技對于現(xiàn)實世界帶來的變化。
沒有真實的場景是很難驅(qū)動人們?nèi)ニ伎技夹g(shù)真正的價值。
從賽題來看,今年線上賽道的設(shè)置一如去年,都是實際業(yè)務(wù)中遇到的場景。數(shù)字化運營賽道,主要聚焦在消費券發(fā)放,考察選手如何利用多種非結(jié)構(gòu)化數(shù)據(jù),如用戶歷史行為序列、用戶間關(guān)系圖、消費券知識圖譜等,來幫助提高數(shù)字消費券的分發(fā)精度。數(shù)字化安全賽道,就是圍繞數(shù)字生態(tài)中風(fēng)險商戶的識別問題,考察選手如何利用隱私計算技術(shù)來聯(lián)合來自多方的交易信息,在隱私保護的前提下,提高對風(fēng)險商戶的識別精度。
面對實實在在的業(yè)務(wù)場景,選手們也感受到了實驗室和工業(yè)場景之間的差距。
李金膛告訴AI科技評論,一方面實驗室和真實工業(yè)場景下的數(shù)據(jù)不同,實驗室使用的數(shù)據(jù)都是經(jīng)過精心處理好的理想化的數(shù)據(jù),然而在現(xiàn)實會遇到噪聲數(shù)據(jù)、數(shù)據(jù)缺失或者數(shù)據(jù)錯誤等等很多問題;另一方面實驗室的數(shù)據(jù)規(guī)模很小,在真實的工業(yè)場景下,幾千萬、幾億的規(guī)模都是很常見的,因此就會導(dǎo)致實驗室做出來的方案并不能夠擴展到大規(guī)模的數(shù)據(jù)場景,而組委會提供的真實工業(yè)場景下的數(shù)據(jù),會促使選手更好的優(yōu)化自己的方案。
讓李金膛感受最深的就是線下賽從60小時變?yōu)?8小時,賽程變短,而賽題并沒有減少。其實這樣設(shè)置也是為了模擬真實的工業(yè)場景中,需要在有限的時間內(nèi)完成工作任務(wù)的環(huán)境。這不僅可以考驗參賽者的專業(yè)技能,也鍛煉了他們在壓力下進(jìn)行決策的能力。
1000個程序員解決問題的方法有1000種。而在比賽中,李金膛認(rèn)為最有意思的就是加入隱私保護的模塊。
在線上賽數(shù)字化安全賽道,李金膛共用了三種技術(shù),包括聯(lián)邦學(xué)習(xí)、知識蒸餾、模型集成。據(jù)李金膛所述,在聯(lián)邦學(xué)習(xí)的環(huán)境下進(jìn)行比賽,模型的準(zhǔn)確性一定會有影響。選手們能做的就是盡可能降低其對模型的影響。
為了提高準(zhǔn)確度而他選擇用知識蒸餾的方法解決各個本地數(shù)據(jù)較少,模型容易產(chǎn)生過擬合的問題。最后將多個模型集成到一起解決單一模型的泛化性問題。
而這一賽道獲勝的關(guān)鍵是數(shù)據(jù)特征的構(gòu)建?!靶袠I(yè)內(nèi)有一句話,數(shù)據(jù)構(gòu)建的特征是決定整體模型最終上限,怎么去設(shè)計模型,是去不斷逼近這個上限,”李金膛如是說。
螞蟻舉辦的ATEC比賽是就是基于他們業(yè)務(wù)場景的真實的工業(yè)場景的一些數(shù)據(jù),往往這些數(shù)據(jù)會涉及到一些領(lǐng)域內(nèi)比較新的一些技術(shù),選手通過去接觸這些數(shù)據(jù),然后提出解決方案。同時也有機會去學(xué)習(xí)和掌握一些新的技術(shù)工具以及一些方法,并有助于擴展他們的一些技能包,保持對整個行業(yè)發(fā)展的敏感性,有助于其后續(xù)的職業(yè)發(fā)展。
人工智能發(fā)展到了一定程度,才去關(guān)注其他一些問題。比如說模型的可靠程度、模型的隱私保護能力等,這些相對模型精度相對沒那么重要,但是這對于整個人工智能領(lǐng)域有更好更健康的發(fā)展,是不可或缺的一部分,ATEC引發(fā)了比賽的一個新方向。
李金膛說:“參加了兩屆比賽,第一個最直接的收獲就是接觸到一些真實的工業(yè)場景數(shù)據(jù),增加了我在相關(guān)方面的實踐經(jīng)驗。另一方面就是培養(yǎng)了解決問題的能力,鍛煉了在高壓環(huán)境下的創(chuàng)造性思維?!?/p>
AI不能只待在實驗室,實踐能力的訓(xùn)練更需要真實的場景。
3
賽博世界的“手藝人”
經(jīng)濟社會發(fā)展對科技的需求,從來沒有像今天這樣重要而迫切。
數(shù)字化智能化正在深入各行各業(yè),實體企業(yè)正處在艱難的爬坡階段。
程序員就是改造這座賽博大廈手藝人,他們和作曲家、建筑師、畫家和作家一樣,都試圖創(chuàng)作出優(yōu)秀的作品。
而程序員是利用手中的代碼構(gòu)建模型從而解決現(xiàn)實問題。
ATEC每一年命題的設(shè)置都踩在時代的脈搏上,第一年的野生動物保護,第二年的科技反詐,第三年的科技助實,最終目的都是解決現(xiàn)實問題。
ATEC 2022線下賽設(shè)置的第二道賽題就是利用計算機視覺、衛(wèi)星遙感等技術(shù)來識別農(nóng)作物類別。讓人們真實的感受到了科技不僅能夠真正解決生活中遇到一些的問題,同時還讓人們了解到科技還能夠預(yù)測田地的價值。
唐靜作為為數(shù)不多的女程序員選手,在賽場上可以說是獨特的存在。
誰說女生不能是個好的算法工程師呢?唐靜參加比賽是被老公包恒達(dá)拉來的,沒想到最后輕輕松松拿下了線上賽數(shù)字化運營賽道第三名。
當(dāng)然選擇這一賽道也是因為她從事推薦算法的工作,而消費券預(yù)測的賽題有些異曲同工。
她告訴AI科技評論:“在比賽中,靠譜的線下驗證十分關(guān)鍵,因為線上提交一般都有限制,只有保證線上線下一致才能快速嘗試更多思路?!?/p>
就比賽對于唐靜本人的意義而言,最大的收獲是有機會嘗試和學(xué)習(xí)最新的技術(shù)。在算法的工作環(huán)境當(dāng)中,由于試錯成本高,更加追求穩(wěn)定,所以沒法嘗試特別多前沿技術(shù),但是比賽場景下能更靈活快速迭代模型,學(xué)習(xí)更前沿的技術(shù)。
在她看來,今年的主題比較“接地氣”,可以實實在在幫助到中小企業(yè),比如線下賽的第三個賽題,就是關(guān)于預(yù)測小微企業(yè)經(jīng)營風(fēng)險的,這是現(xiàn)實中確實存在的問題,如果這塊內(nèi)容做好了,是一件非常有意義的事情。
在科技助實這條路上,注定不是一朝一夕就能夠完成的,需要一代代人不斷努力創(chuàng)新迭代,從而構(gòu)筑一個新的賽博世界。
回想中世紀(jì)在歐洲建造的大教堂,每一座都需要數(shù)千人年的努力,時間跨度長達(dá)幾十年。從中吸取的經(jīng)驗教訓(xùn)被傳遞給下一代的建造者,最終一代代累積的造詣推動了結(jié)構(gòu)工程的發(fā)展。而木匠、石匠、雕刻師和玻璃工人都是手工藝人。
當(dāng)今時代,這座以科技為基座的高樓大廈,需要更多的手藝人去支撐,他們就是程序員?,F(xiàn)代科技高樓也需要一代代的程序員去不斷構(gòu)建。
本文作者:李揚霞,微信Dec9102。長期聚焦網(wǎng)絡(luò)安全、數(shù)字安全領(lǐng)域,同時關(guān)注AIGC、大模型等內(nèi)容,對以上領(lǐng)域感興趣的讀者歡迎添加作者微信。雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。