2
本文作者: haoxiaoru | 2016-06-19 18:41 |
當(dāng)蘋果在 WWDC 2016 的主題演講中,講到“差分隱私 (Differential Privacy)”這個(gè)密碼學(xué)專有名詞的時(shí)候,只有少數(shù)人意識(shí)到,蘋果又走在了時(shí)代前列。
大部分中外觀察者都認(rèn)為,蘋果為人工智能時(shí)代所做的努力不夠,它依然是一家以硬件設(shè)備為核心的公司,對(duì)于為更大規(guī)模的用戶提供服務(wù)不感興趣(例如 iMessage 等軟件均沒有 Android 版),所以等人工智能技術(shù)得以真正嶄露頭角的時(shí)候,很可能難以追趕 Google、Facebook、亞馬遜和微軟。
這或許是對(duì)的。但蘋果在解決人工智能時(shí)代的隱私保護(hù)難題上,又似乎比其他科技巨頭,走得更遠(yuǎn)。
人工智能依賴于機(jī)器學(xué)習(xí)(深度學(xué)習(xí))算法,而機(jī)器學(xué)習(xí)又需要大規(guī)模的訓(xùn)練數(shù)據(jù),所以向用戶搜集數(shù)據(jù)比以往更加重要。
如今,當(dāng)你向一家互聯(lián)網(wǎng)公司詢問,你們收集來的用戶信息會(huì)不會(huì)侵犯用戶隱私的時(shí)候,行業(yè)標(biāo)準(zhǔn)答案是:
1、收集用戶信息是必要的,這樣有助于改善產(chǎn)品或服務(wù)。
2、我們是匿名收集用戶信息的,并不保存任何用戶的身份信息。
“匿名收集”這個(gè)答案,作為擋箭牌非常好用。外行都會(huì)被它唬住,以為匿名就意味著無法關(guān)聯(lián)到具體的某個(gè)用戶的信息。
但是對(duì)這個(gè)行業(yè)稍有了解的人,都應(yīng)該清楚,匿名并不能完全保證用戶的隱私安全。最經(jīng)典的案例莫過于,Netflix 曾放出“經(jīng)過匿名處理的”上億條電影評(píng)分?jǐn)?shù)據(jù),“僅僅保留了每個(gè)用戶對(duì)電影的評(píng)分和評(píng)分的時(shí)間戳”,希望通過競(jìng)賽的形式,找到更好的影片推薦算法。但是 2009年,德州大學(xué)的兩位研究人員,通過這些匿名數(shù)據(jù)與公開的IMDB數(shù)據(jù)做對(duì)比,成功將匿名數(shù)據(jù)與具體的用戶對(duì)應(yīng)了起來。Netflix 不得不取消了,這項(xiàng)原計(jì)劃每年舉行的競(jìng)賽。
蘋果想把(一定會(huì)收集用戶信息的)科技公司在隱私保護(hù)方面的級(jí)別,提升到新的高度。而“差分隱私 (Differential Privacy)”,正是它找到的答案。這項(xiàng)密碼學(xué)前沿技術(shù)的基本原理,就是向包含個(gè)體信息的大量數(shù)據(jù)集里注入噪音(或者說擾動(dòng)),目標(biāo)是保證每個(gè)個(gè)體信息都無法泄露,同時(shí)這個(gè)數(shù)據(jù)集的統(tǒng)計(jì)學(xué)信息依然可以被外界分析。
科學(xué)家們正在研究,究竟注入多少噪音,可以實(shí)現(xiàn)隱私保護(hù)和數(shù)據(jù)分析的最佳平衡。
不出意外的話,蘋果將成為第一個(gè)真正大規(guī)模使用這項(xiàng)“差分隱私 (Differential Privacy)”算法的公司。但是也有學(xué)者表達(dá)了自己的擔(dān)心,他們認(rèn)為這項(xiàng)技術(shù)前景可期,但還沒有成熟到大規(guī)模商用的時(shí)候。
也有人猜測(cè),蘋果應(yīng)該與微軟達(dá)成了某種私下協(xié)議,因?yàn)檫@項(xiàng)“差分隱私 (Differential Privacy)”算法的提出者,來自微軟研究院。蘋果在 WWDC 上引用了一名大學(xué)教授對(duì)蘋果使用該算法的看法——“使用這項(xiàng)算法說明蘋果很有遠(yuǎn)見,蘋果在隱私保護(hù)方面領(lǐng)先其他科技公司”,而這名教授是《The Algorithmic Foundations of Differential Privacy》(差分隱私的算法基礎(chǔ))一書的兩個(gè)作者之一,另一位就是微軟的研究員。
一個(gè)可能的情況是,研究這項(xiàng)算法的大公司不止蘋果一家,只不過它是最先表明積極態(tài)度的,至少在輿論方面占得先機(jī)。
總結(jié)一下。讀完本文,你只需要知道“匿名收集信息”并不能回答互聯(lián)網(wǎng)公司如何保護(hù)用戶隱私的問題,就可以了。就像亞馬遜CEO貝佐斯在 Re/code 大會(huì)上講的那樣,保護(hù)隱私是這個(gè)時(shí)代的難題。只不過,愿意給出新解法的公司,卻少得可憐。
注:更多關(guān)于蘋果“差分隱私”的報(bào)道,參見本站的其他文章:
《蘋果如何在收集你們數(shù)據(jù)的同時(shí),卻不侵犯你的隱私?》
《差別隱私,iOS 10 更新升級(jí)的保護(hù)傘》
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。