0
本文作者: 陳彩嫻 | 2021-06-09 16:10 |
在6月6日于杭州舉辦的全球人工智能技術(shù)大會(huì)可信AI專題論壇上,來自加州大學(xué)伯克利的宋曉冬教授(江湖人稱“安全教母”)這樣描述數(shù)據(jù):數(shù)據(jù)是一種非競(jìng)爭(zhēng)性(non-competition)的知識(shí)。
什么叫“非競(jìng)爭(zhēng)性”?所謂“非競(jìng)爭(zhēng)性”,是相對(duì)于部分商品具備的“排他性”而言。比如,同一時(shí)間與地點(diǎn)內(nèi)只存在一個(gè)充電寶,但用戶A與用戶B的手機(jī)同時(shí)沒電,兩個(gè)人都需要充電,那么A與B之間就存在競(jìng)爭(zhēng)關(guān)系。
但在數(shù)據(jù)層面,如果N個(gè)用戶都需要各品牌車輛銷售信息、平臺(tái)品類消費(fèi)總量、視頻點(diǎn)擊率等等數(shù)據(jù),那么他們是可以同時(shí)使用的。也正是因?yàn)閿?shù)據(jù)的可共享特征,人工智能才得以在現(xiàn)代科技中嶄露頭角,可以說:沒有大數(shù)據(jù),就沒有深度學(xué)習(xí);沒有深度學(xué)習(xí),就沒有火熱發(fā)展的人工智能。
然而,近幾年,隨著人們對(duì)數(shù)據(jù)隱私安全的越發(fā)重視,加之以2018年《歐盟一般數(shù)據(jù)保護(hù)條例》(即“GDPR”)為代表的各國(guó)數(shù)據(jù)隱私保護(hù)政策出爐,數(shù)據(jù)的獲取與使用受到了一定限制。今年4月,歐盟又發(fā)布了全球首個(gè)針對(duì)人工智能技術(shù)的監(jiān)管法規(guī)草案,禁止在公共場(chǎng)合使用人臉識(shí)別技術(shù)。
人臉識(shí)別是計(jì)算機(jī)視覺目前的主要商用方向,歐盟最新監(jiān)管草案的出臺(tái)無疑加大了人工智能落地的阻礙。同時(shí),人工智能作為最前沿的技術(shù)之一,在醫(yī)療、金融、交通等信息數(shù)據(jù)敏感的重要社會(huì)領(lǐng)域中能發(fā)揮的作用也會(huì)越來越少。
事實(shí)上,在人工智能領(lǐng)域,除了以人臉識(shí)別為代表的圖像感知模型對(duì)數(shù)據(jù)有較大依賴,被稱為“通往通用人工智能的必經(jīng)之路”的強(qiáng)化學(xué)習(xí)也離不開大數(shù)據(jù)的支持。強(qiáng)化學(xué)習(xí)的訓(xùn)練必須包含對(duì)數(shù)據(jù)的反復(fù)試錯(cuò)(trial and error),從而找到最優(yōu)策略,以此來提高機(jī)器的決策能力。如果數(shù)據(jù)無法到位,那么強(qiáng)化學(xué)習(xí)的進(jìn)步將受到限制,決策人工智能的實(shí)現(xiàn)也會(huì)難上加難。
那么,如何能夠保證數(shù)據(jù)隱私不被泄露、又能正常使用數(shù)據(jù)進(jìn)行研究呢?學(xué)術(shù)界與業(yè)界進(jìn)行了多方探索,從同態(tài)加密到差分隱私,再到自動(dòng)多方機(jī)器學(xué)習(xí)技術(shù),最后,能夠?qū)崿F(xiàn)“數(shù)據(jù)可用不可見”的聯(lián)邦學(xué)習(xí)(Federated Learning)技術(shù)脫穎而出,成為公認(rèn)的數(shù)據(jù)調(diào)用“一把手”。
作為一種機(jī)器學(xué)習(xí)模式,聯(lián)邦學(xué)習(xí)能夠通過AI模型,在保護(hù)數(shù)據(jù)貢獻(xiàn)方的原始隱私數(shù)據(jù)的前提下,協(xié)作完成特定的機(jī)器學(xué)習(xí)任務(wù)。
在早期,國(guó)內(nèi)將“Federated Learning”翻譯為“聯(lián)合學(xué)習(xí)”,后來又改為“聯(lián)邦學(xué)習(xí)”,因?yàn)槿绻脩羰莻€(gè)人,確實(shí)是把他們的模型「聯(lián)合」起來學(xué)習(xí);而如果用戶是企業(yè)、銀行、醫(yī)院等大數(shù)據(jù)擁有者,這種技術(shù)則更像是將諸多「城邦」結(jié)合起來,「聯(lián)邦」一詞會(huì)更為準(zhǔn)確。
來自同盾科技的李曉林教授是國(guó)內(nèi)最早推動(dòng)聯(lián)邦學(xué)習(xí)的學(xué)者之一。李曉林教授是同盾科技合伙人、人工智能研究院的院長(zhǎng)。曾任美國(guó)佛羅里達(dá)大學(xué)終身正教授、計(jì)算機(jī)工程部主任,作為創(chuàng)始中心主任,牽頭創(chuàng)立了美國(guó)首個(gè)國(guó)家級(jí)深度學(xué)習(xí)中心NSFCBL(佛羅里達(dá)大學(xué)、卡內(nèi)基梅隆大學(xué)、俄勒岡大學(xué)、密蘇里大學(xué)四校聯(lián)盟),主要研究方向包括機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、智能平臺(tái)、云計(jì)算、安全與隱私等等。
在聯(lián)邦學(xué)習(xí)的基礎(chǔ)上,李曉林教授提出了“知識(shí)聯(lián)邦”的理論框架,包括信息層、模型層、認(rèn)知層和知識(shí)層,首次將認(rèn)知和知識(shí)引入隱私計(jì)算范疇,目標(biāo)是實(shí)現(xiàn)下一代可信、可解釋、可推理、可決策的人工智能。為了提升深度學(xué)習(xí)模型的可解釋性,研究者在知識(shí)圖譜、因果推理等方向進(jìn)行了深入研究,推敲數(shù)據(jù)的真實(shí)性、區(qū)分?jǐn)?shù)據(jù)與事實(shí)的關(guān)聯(lián)性是因果解釋中的重要一環(huán)。
據(jù)悉,同盾科技還于2020年?duì)款^成立了知識(shí)聯(lián)邦產(chǎn)學(xué)研聯(lián)盟(AKF),聯(lián)合浙江大學(xué)、中科院醫(yī)學(xué)所、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)、華東師范大學(xué)、百度大數(shù)據(jù)實(shí)驗(yàn)室、360集團(tuán)、平安科技、明略科技等眾多學(xué)界、業(yè)界單位組成。促進(jìn)相關(guān)主體之間的交流和深度合作,促進(jìn)知識(shí)共享和供需對(duì)接,形成優(yōu)勢(shì)互補(bǔ),有效推進(jìn)知識(shí)聯(lián)邦學(xué)術(shù)理論、工程技術(shù)、標(biāo)準(zhǔn)化、產(chǎn)業(yè)鏈快速發(fā)展,聯(lián)手各方力量共同構(gòu)建知識(shí)聯(lián)邦優(yōu)質(zhì)生態(tài),切實(shí)解決企業(yè)、高校、研究機(jī)構(gòu)的現(xiàn)實(shí)問題。
以下是AI科技評(píng)論對(duì)李曉林教授進(jìn)行采訪的內(nèi)容整理:
1、與聯(lián)邦學(xué)習(xí)相比,“知識(shí)聯(lián)邦”進(jìn)行了哪些拓展?為什么要加入“認(rèn)知層”與“知識(shí)層”?
聯(lián)邦學(xué)習(xí)是知識(shí)聯(lián)邦的一個(gè)子集,專注于數(shù)據(jù)分布的聯(lián)合建模。知識(shí)聯(lián)邦關(guān)注的是安全的、數(shù)據(jù)到知識(shí)的“全生命周期”的知識(shí)創(chuàng)造、管理和使用及其監(jiān)管,支持智能決策,致力于推動(dòng)下一代人工智能,而不僅僅是一個(gè)安全的聯(lián)合建模。
2、與聯(lián)邦學(xué)習(xí)相比,知識(shí)聯(lián)邦的優(yōu)勢(shì)體現(xiàn)在哪些方面?實(shí)現(xiàn)知識(shí)聯(lián)邦需要突破哪些困難?
與聯(lián)邦學(xué)習(xí)相比,知識(shí)聯(lián)邦一個(gè)重要的技術(shù)前提是數(shù)據(jù)的知識(shí)化,將數(shù)據(jù)轉(zhuǎn)化成為模型策略知識(shí),再對(duì)分散的知識(shí)聚合。我們希望通過知識(shí)融合或推理,讓知識(shí)在知識(shí)網(wǎng)絡(luò)中自由流動(dòng),挖掘出更全面、更有價(jià)值的知識(shí),實(shí)現(xiàn)智能決策。
而知識(shí)驅(qū)動(dòng)的聯(lián)邦技術(shù)則是在數(shù)據(jù)聯(lián)邦的理念上進(jìn)一步升華。從定義上來說知識(shí)聯(lián)邦是一個(gè)更為宏觀的理論體系和技術(shù)框架,將數(shù)據(jù)、信息、知識(shí)、智慧納入到一種金字塔形的層次體系。雷鋒網(wǎng)
如何確立一個(gè)可信的第三方,充當(dāng)合格的協(xié)調(diào)者和監(jiān)管者;如何保證智邦平臺(tái)中數(shù)據(jù)提供者的公平性,如何解決惡意參與者的問題,怎么完善各參與方的激勵(lì)方式,激發(fā)各方的積極性和配合度,以及如何讓參與各方均無條件認(rèn)可平臺(tái)的安全性等問題,都是在未來需要我們克服的問題。
3、“知識(shí)可創(chuàng)可共享”,怎么理解這句話呢?
舉個(gè)例子,在個(gè)人信用風(fēng)險(xiǎn)評(píng)估時(shí),可能會(huì)需要個(gè)人的收入情況、消費(fèi)能力、貸款情況以及其它信息,而這些信息可能分布在不同的機(jī)構(gòu)中。如果我們想得到信用風(fēng)險(xiǎn)評(píng)估這個(gè)知識(shí),就需要聯(lián)合相關(guān)機(jī)構(gòu)參與任務(wù),建立相應(yīng)的任務(wù)聯(lián)盟。尤其是那些中小微企業(yè),自由數(shù)據(jù)量少,需要借助外部數(shù)據(jù)才能開展業(yè)務(wù),通過聯(lián)邦平臺(tái)建立小范圍的任務(wù)聯(lián)盟就可以有效解決這個(gè)難題。雷鋒網(wǎng)
這個(gè)過程中,既實(shí)現(xiàn)了“新”知識(shí)的創(chuàng)建,又實(shí)現(xiàn)了知識(shí)的共享,更重要的是缺乏數(shù)據(jù)的中小微企業(yè)也能從中分享到屬于自己的知識(shí)。雷鋒網(wǎng)
從技術(shù)角度看,這個(gè)過程是怎么實(shí)現(xiàn)的呢?在知識(shí)聯(lián)邦框架中,一旦初始知識(shí)以某種方式構(gòu)建并保存在知識(shí)庫中,聯(lián)邦將進(jìn)入一個(gè)更高層次的階段,即知識(shí)級(jí)聯(lián)盟,多個(gè)知識(shí)庫中的初始知識(shí)將進(jìn)一步協(xié)作并演化為更重要的知識(shí)。為了保證知識(shí)能夠在不同的知識(shí)源之間方便地流動(dòng),首先要通過連接所有代表獨(dú)立知識(shí)庫的知識(shí)節(jié)點(diǎn)來構(gòu)建知識(shí)網(wǎng)絡(luò)。簡(jiǎn)單地說,知識(shí)層聯(lián)邦實(shí)際上是希望通過知識(shí)融合或推理,讓知識(shí)在知識(shí)網(wǎng)絡(luò)中自由流動(dòng),挖掘出更全面、更有價(jià)值的知識(shí),這對(duì)管理者或管理者做出正確決策有很大幫助。
4、關(guān)于“知識(shí)聯(lián)邦”的研究,學(xué)術(shù)界與工業(yè)界的發(fā)展現(xiàn)狀與趨勢(shì)如何?
雖然目前還沒有完備的理論突破來實(shí)現(xiàn)AI 3.0,學(xué)術(shù)界和工業(yè)界也沒有統(tǒng)一的看法,但是可信AI的理論已逐漸成為全球?qū)W術(shù)界、產(chǎn)業(yè)界共識(shí),我們可以明顯看到當(dāng)前越來越多的企業(yè)和學(xué)術(shù)研究機(jī)構(gòu)聚焦到這個(gè)領(lǐng)域。
我們觀察到人工智能各個(gè)階段的飛躍間隔大約30年。我們目前所處的時(shí)代AI已擁有強(qiáng)大的感知能力,以深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)為代表,AI獲得了及其廣泛的應(yīng)用和社會(huì)影響力,我認(rèn)為在下一代AI時(shí)代,知識(shí)和智能決策將成為核心,知識(shí)聯(lián)邦一定會(huì)扮演重要角色。
5、您能否介紹一下知識(shí)聯(lián)邦如何促進(jìn)可信AI生態(tài)系統(tǒng)的發(fā)展?
首先是,沖破數(shù)據(jù)孤島,知識(shí)聯(lián)邦用“小數(shù)據(jù)”實(shí)現(xiàn)“大智能”當(dāng)前大背景下,數(shù)據(jù)孤島是制約AI發(fā)展的重要阻礙,公司內(nèi)部和子公司的部門之間存在很多數(shù)據(jù)壁壘。不同機(jī)構(gòu)之間的壁壘問題更甚。消除各行業(yè)的數(shù)據(jù)孤島,創(chuàng)新模式讓數(shù)據(jù)協(xié)作是未來的趨勢(shì),而在此之間,知識(shí)聯(lián)邦可以發(fā)揮重要作用。
其次是,知識(shí)聯(lián)邦不是一種單一的技術(shù)方法,是一套理論框架體系,是人工智能、大數(shù)據(jù)、密碼學(xué)等幾個(gè)領(lǐng)域交叉融合的產(chǎn)物,使其可以以更合規(guī)的方式來打破數(shù)據(jù)孤島,在利用數(shù)據(jù)的同時(shí),做到保護(hù)數(shù)據(jù)隱私。
知識(shí)聯(lián)邦的目標(biāo)就是打造數(shù)據(jù)安全的人工智能生態(tài),通過數(shù)據(jù)安全交換協(xié)議來有效利用多方的數(shù)據(jù),進(jìn)行知識(shí)共創(chuàng)、共享和推理,實(shí)現(xiàn)數(shù)據(jù)可用不可見。
6、您如何理解可信AI生態(tài)系統(tǒng)對(duì)于人工智能發(fā)展的意義?對(duì)于以深度學(xué)習(xí)為基礎(chǔ)的人工智能發(fā)展邏輯會(huì)帶來哪些新的變化?
隨著日新月異的飛速發(fā)展,人工智能的不可解釋、存在攻擊漏洞等安全問題正日益對(duì)法律、倫理、社會(huì)等方面不斷提出挑戰(zhàn)。在此背景下,“可信AI”的理念逐漸成為全球共識(shí),成為未來人工智能產(chǎn)業(yè)健康發(fā)展的必由之路。從這個(gè)意義上將,人工智能發(fā)展到當(dāng)今階段,可信AI生態(tài)系統(tǒng)的出現(xiàn)是必然的。
發(fā)展邏輯上,可信AI 將可實(shí)現(xiàn)儲(chǔ)備更多知識(shí),并且能夠做出更加復(fù)雜、自主化的智能決策,這也對(duì)“數(shù)據(jù)使用”提出了更高的要求。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。