AI博士從“解放”鑒黃師起步，十年專(zhuān)注安全AI

本文作者：李勤

2019-04-30 12:45

導(dǎo)語(yǔ)：十年前你在干什么？

2009 年，主要從事數(shù)字信號(hào)和圖像處理研究、博士剛剛畢業(yè)的薛暉拿到了阿里巴巴的 offer，那一年淘寶的全年交易額已經(jīng)達(dá)到 2083 億元，薛暉激動(dòng)地搓搓小手，阿里巴巴的網(wǎng)站上有大量未被挖掘利用的數(shù)據(jù)，比如照片、視頻、語(yǔ)音以及非結(jié)構(gòu)化的文本，如果能讓機(jī)器做到看清和讀懂這些信息，一定是一件非常有意義和有價(jià)值的事。

薛暉的構(gòu)想很美好，要將圖像識(shí)別的技術(shù)應(yīng)用到阿里巴巴的搜索、廣告以及安全審核中。然而，正經(jīng)如薛博士，萬(wàn)萬(wàn)沒(méi)有想到，公司先給了他一項(xiàng)重要的任務(wù)：解放千千萬(wàn)萬(wàn)奮斗在電腦前的鑒黃師們。

“我來(lái)的時(shí)候，要解決的最大問(wèn)題是淘寶的審核問(wèn)題，當(dāng)時(shí)淘寶有很多違規(guī)圖片，色情圖片或是其他違法圖片。鑒別文字時(shí)，我們還能通過(guò)關(guān)鍵詞或者變體詞匯來(lái)審核，但是對(duì)待圖片，完全沒(méi)有能力，都靠人工?！毖煂?duì)雷鋒網(wǎng)說(shuō)。

所以，接下來(lái)雷鋒網(wǎng)要講述的是十年 AI 大佬如何從“解放”鑒黃師起步的故事。

AI博士從“解放”鑒黃師起步，十年專(zhuān)注安全AI 【阿里安全圖靈實(shí)驗(yàn)室負(fù)責(zé)人薛暉】

一

有些學(xué)霸選專(zhuān)業(yè)，哪里分?jǐn)?shù)高，就去哪里。

十年前，阿里巴巴搜索部技術(shù)很牛，于是，薛暉雄心勃勃地來(lái)到搜索部，并在 2010 年，與兩個(gè)男同事提出了一個(gè)非常創(chuàng)新的方案：將搜圖應(yīng)用在電商場(chǎng)景，比如用戶搜索時(shí)設(shè)置顏色導(dǎo)航，只要搜一件格子襯衫，蹦出一個(gè)調(diào)色板，點(diǎn)選顏色后，就會(huì)出來(lái)顏色一樣的格子襯衫，他們甚至提出了現(xiàn)在非常流行的“以圖搜圖”的設(shè)想。

AI博士從“解放”鑒黃師起步，十年專(zhuān)注安全AI

想象很美好，現(xiàn)實(shí)很殘忍。那會(huì)，多數(shù)人手里還拿著諾基亞，超過(guò) 1 M流量，可能要被運(yùn)營(yíng)商收走 5 塊錢(qián)，這樣“超前”的業(yè)務(wù)理念夭折了。

深度學(xué)習(xí)技術(shù)和高性能計(jì)算服務(wù)器并未成熟，移動(dòng)端的各類(lèi)應(yīng)用也未普及，薛暉還覺(jué)得，自己對(duì)業(yè)務(wù)痛點(diǎn)和場(chǎng)景的理解不足，對(duì)技術(shù)天花板的判斷不足，特別是當(dāng)兩者遇到矛盾時(shí)找不到可以妥善解決的方法。

隨著淘寶業(yè)務(wù)量的大量級(jí)提升，包括商品和社區(qū)板塊的 UGC 信息量增長(zhǎng)很快，原有的規(guī)則加人工的審核模式無(wú)法滿足需求，也就是說(shuō)，幾十個(gè)淘寶小二（鑒黃師）面對(duì)數(shù)據(jù)海量增長(zhǎng)，筋疲力竭。阿里內(nèi)部愈發(fā)發(fā)現(xiàn)，安全更加重要，以淘寶安全為基礎(chǔ)，阿里集團(tuán)安全部正式成立。

這個(gè)部門(mén)吸引了薛暉的注意力。

學(xué)霸內(nèi)心一盤(pán)算，阿里是一個(gè)典型的技術(shù)要與業(yè)務(wù)高度結(jié)合的公司，要把之前的技術(shù)推下去，得有應(yīng)用場(chǎng)景啊！鑒于之前在搜索部初試反擊黃賭毒有一定效果，薛暉覺(jué)得，自己推行的技術(shù)在安全領(lǐng)域可能比較容易落地，于是，他主動(dòng)申請(qǐng)轉(zhuǎn)崗到阿里安全部。

薛暉把黃圖鑒別和以圖搜圖的技術(shù)用到了這里。最早，他采用的是利用黑樣本圖片找到類(lèi)似圖片的方法，并逐漸加上了 OCR 和人臉識(shí)別技術(shù)，當(dāng)然，這些都是基于傳統(tǒng)技術(shù)，當(dāng)初并沒(méi)有深度學(xué)習(xí)技術(shù)的應(yīng)用。

比如，當(dāng)時(shí)薛暉等人是這樣區(qū)別一張色情圖片與正常圖片的：

有大面積的接近皮膚顏色的像素
像素之間是有連通性而不是很分散
紋理特征接近皮膚
存在類(lèi)似軀干比例的矩形或橢圓
皮膚區(qū)域是否集中在人臉以下的特定位置等

所有這些特征的權(quán)重組合通過(guò)機(jī)器學(xué)習(xí)模型決定，也因此，機(jī)器通過(guò)顏色、紋理、形狀來(lái)識(shí)別黃圖，大量肉色的沙發(fā)、地板會(huì)被“無(wú)辜牽連”，機(jī)器鑒黃也只能識(shí)別正經(jīng)臉的蒼老師，動(dòng)漫版、大幅度傾斜的小黃圖無(wú)法識(shí)別。

薛暉還面臨剛起步需要“證明自己”的問(wèn)題——這項(xiàng)業(yè)務(wù)看起來(lái)還沒(méi)有那么重要，大家不相信他們可以做出來(lái)什么，所以薛暉等人要不到研究的錢(qián)和資源。比如，他們要想申請(qǐng)一臺(tái)幾萬(wàn)塊的物理訓(xùn)練機(jī)，要把報(bào)告打到高層老板那里。

要想證明項(xiàng)目可行，就要提效省錢(qián)。

雖然上述首次使用的基于統(tǒng)計(jì)模型的機(jī)器學(xué)習(xí)方法現(xiàn)在早已被迭代，但在過(guò)去，它能把效率提升幾十甚至上百倍?！爱?dāng)時(shí)全人工審核沒(méi)法篩選圖片，降人力是最關(guān)鍵的，也是最直接的?！毖熣f(shuō)，幾年間，數(shù)據(jù)量呈線性增長(zhǎng)，剛開(kāi)始負(fù)責(zé)人工審核的小二是幾十個(gè)人，現(xiàn)在依然是幾十個(gè)人。

二

薛暉一邊解放著人肉鑒黃師的人力，一邊迎來(lái)人工智能發(fā)展的大勢(shì)。

2016 年，Alpha-go 戰(zhàn)勝了李世石，谷歌也正式發(fā)布了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)，神經(jīng)網(wǎng)絡(luò)通過(guò)各種應(yīng)用正在重塑圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域。同一年，阿里安全部將薛暉所在的整個(gè)基礎(chǔ)算法團(tuán)隊(duì)更名為“阿里安全圖靈實(shí)驗(yàn)室”。

薛暉忙著將負(fù)責(zé)業(yè)務(wù)的模型往深度學(xué)習(xí)上的遷移，一邊與團(tuán)隊(duì)一起將人工智能技術(shù)落地到更多的場(chǎng)景，如知識(shí)產(chǎn)權(quán)、身份核驗(yàn)以及各種基于人臉識(shí)別技術(shù)的 IOT 應(yīng)用等。

比如，他們將這套鑒黃體系以產(chǎn)品形式推了出來(lái)——有“AI 鑒黃師之稱(chēng)的阿里巴巴“綠網(wǎng)”用人工智能識(shí)別網(wǎng)絡(luò)上包括色情、暴力在內(nèi)的違規(guī)信息，通過(guò)人工智能、深度學(xué)習(xí)等技術(shù)，識(shí)別千萬(wàn)張正常圖片與色情圖片，最終生成一個(gè)智能鑒黃模型。

淘寶店鋪邁向?qū)嵢苏J(rèn)證也是其中的應(yīng)用之一。剛開(kāi)始，上傳到后臺(tái)的信息都由人工比對(duì)，兩個(gè)人是不是同一個(gè)人？身份證號(hào)碼是否和人匹配？2016 年，實(shí)人認(rèn)證進(jìn)入了完全自動(dòng)化時(shí)代，很少有人知道，一個(gè)機(jī)器大腦正在處理這個(gè)龐大的信息庫(kù)。店鋪用戶上傳的所有信息經(jīng)過(guò)機(jī)器之手，人類(lèi)卻無(wú)權(quán)調(diào)用。

薛暉所在的團(tuán)隊(duì)在證明可以“提效省錢(qián)”的基礎(chǔ)上，面臨了“賺錢(qián)”的挑戰(zhàn)。

上面提到的“綠網(wǎng)”是在阿里提出生態(tài)戰(zhàn)略的背景下被阿里云“集成”的技術(shù)，這款提供內(nèi)容安全、實(shí)人認(rèn)證的云服務(wù)產(chǎn)品推出伊始，瞄準(zhǔn)的是阿里體系的生態(tài)企業(yè)，現(xiàn)在也包括阿里云上的客戶。

“本來(lái)對(duì)內(nèi)服務(wù)的產(chǎn)品，走到到一個(gè)充分面向市場(chǎng)競(jìng)爭(zhēng)的環(huán)境，一下子還不太適應(yīng)。”薛暉發(fā)現(xiàn)，在阿里內(nèi)部場(chǎng)景積累的經(jīng)驗(yàn)和模型并不可以直接拿來(lái)使用，尤其是面對(duì)云上形形色色的非電商行業(yè)客戶。從阿里內(nèi)部跳出來(lái)看，“綠網(wǎng)”的競(jìng)爭(zhēng)對(duì)手并不是傳統(tǒng)意義的巨頭企業(yè)，而是各類(lèi)做計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理的獨(dú)角獸和創(chuàng)業(yè)公司。

沒(méi)什么別的好辦法，只有不斷在標(biāo)準(zhǔn)化、通用性、技術(shù)先進(jìn)性上打磨產(chǎn)品。對(duì)于“被集成”的綠網(wǎng)，要靠業(yè)績(jī)說(shuō)話，薛暉對(duì)雷鋒網(wǎng)透露，綠網(wǎng)現(xiàn)在每年為阿里云貢獻(xiàn)了不少收入。

證明了自己對(duì)業(yè)務(wù)的重要性后，阿里安全圖靈實(shí)驗(yàn)室從二十幾人一下躍升到幾十人的規(guī)模，并且在北京建立了新的小分隊(duì)，薛暉不斷在北京和杭州間來(lái)回，讓新團(tuán)隊(duì)跟上節(jié)奏。

三

他們的節(jié)奏不得不提起來(lái)了。

對(duì)薛暉而言，更多技術(shù)的落地并沒(méi)有那么容易。光拿下阿里杭州園區(qū)的門(mén)禁，他們就費(fèi)了一番力氣。園區(qū)的行政部門(mén)的同事對(duì)使用門(mén)禁刷臉有顧慮：

識(shí)別率到底高不高？園區(qū)里這么多人，誤識(shí)別了怎么辦？
無(wú)人值守這些人臉識(shí)別設(shè)備時(shí)，會(huì)不會(huì)有人就拿著照片或者手機(jī)屏幕直接破解？
上班人流高峰期，過(guò)人臉識(shí)別這一關(guān)快不快？不要大家都擠在一起上不了班。
最重要的是，你讓我們?cè)黾痈咔鍞z像頭，成本會(huì)不會(huì)蹭蹭上漲？

薛暉帶著人一步一步去說(shuō)服，通過(guò)一些數(shù)據(jù)和 ROI 的分析說(shuō)服了業(yè)務(wù)愿意試點(diǎn)，一開(kāi)始是在一個(gè)卡口上進(jìn)行，為了取得最好的調(diào)試效果，工程師們自己扛著攝像頭到現(xiàn)場(chǎng)進(jìn)行參數(shù)調(diào)試和角度安裝，甚至要考慮安裝在室外的閘機(jī)是否受到環(huán)境光照影響，還要人工審核、分析每一個(gè)錯(cuò)誤識(shí)別的案例，到底哪里出了幺蛾子。

把攝像頭放在線下的外部商場(chǎng)里，提供線下新零售的安全解決方案更難。

首先是成本控制問(wèn)題，不能用太貴的攝像頭，還要解決人群、人體、貨架的遮擋，每個(gè)店的地理環(huán)境甚至都有影響，比如，有些店是長(zhǎng)廊形式，但有些店面是完全開(kāi)放的，甚至沒(méi)有明確的邊界，入口和出口的數(shù)量不一，攝像頭擺放的角度和數(shù)量都有講究，而這些都只是為背后的“安全 AI 大腦”助力的觸手。

薛暉等人還要解決的是“人”都很難解決的問(wèn)題。

人工智能技術(shù)在很多場(chǎng)景能應(yīng)用好依賴于幾個(gè)條件：第一，場(chǎng)景比較封閉，是一個(gè)比較容易定義的問(wèn)題。第二，有大量的標(biāo)注數(shù)據(jù)。第三，計(jì)算能力。

線上結(jié)構(gòu)化的信息可以告訴你，那些是垃圾賬號(hào)，哪些注冊(cè)地和登陸地時(shí)常修改，客戶下單的正常、非正常路徑是哪些，依靠這些數(shù)據(jù)，AI 可以洞悉一切不安全。但是，到了線下，小偷可以從任何一張門(mén)進(jìn)來(lái)，買(mǎi)貨之前可能有無(wú)數(shù)正常的路徑，還可以躲在各種遮擋背后。

上面那些條件很難成立，薛暉只能再次向?qū)嶋H的保安或安全人員學(xué)習(xí)抓小偷的經(jīng)驗(yàn)，再用機(jī)器實(shí)現(xiàn)。

“現(xiàn)在我們有團(tuán)隊(duì)直接在商場(chǎng)里點(diǎn)對(duì)點(diǎn)做，就是不停地去調(diào)現(xiàn)場(chǎng)的問(wèn)題，不停地跟他們的店長(zhǎng)、店員、安全人員溝通，這是一個(gè)非常復(fù)雜的問(wèn)題?！毖熣f(shuō)。

除了內(nèi)容安全、知識(shí)產(chǎn)權(quán)保護(hù)、實(shí)人認(rèn)證與身份核驗(yàn)、安防以及新零售的線下安全，薛暉還想把 AI 推到更垂直的安全場(chǎng)景中。

3 月 30 日 18 時(shí)，四川省涼山州木里縣一個(gè)名為雅礱江鎮(zhèn)立爾的村落村，發(fā)生嚴(yán)重的森林火災(zāi)。30 名滅火員犧牲，其中 27 名消防員，最小的才 18 歲。

薛暉認(rèn)認(rèn)真真想了兩天，以前開(kāi)玩笑說(shuō)要用 AI 解放全人類(lèi)，這種高危的場(chǎng)景下更應(yīng)該有 AI 的應(yīng)用。比如，火災(zāi)防控也會(huì)涉及到很多圖像和視覺(jué)的問(wèn)題，是否有更好的制定戰(zhàn)術(shù)控制火勢(shì)的方法？

“30 個(gè)人員犧牲，這代價(jià)是非常大的，我女兒小學(xué)班的家長(zhǎng)里有人是消防員，曾經(jīng)組織過(guò)小學(xué)生和家長(zhǎng)去參觀消防隊(duì)怎么工作，所以我也特別想到這個(gè)點(diǎn)，這是非常重要的工作，我們身邊也會(huì)有人在做這件事情，我有時(shí)候在想，這屬不屬于 AI 安全或者是安全 AI ，讓我們今天從事的工作更安全，這也是保護(hù)人?！毖熣f(shuō)。

十年前，薛暉隔壁實(shí)驗(yàn)室的同學(xué)現(xiàn)在已經(jīng)做出了卓越的成就——嫦娥四號(hào)向地球傳回了世界上第一張近距離拍攝的月背影圖像。

有些人“上了天”，薛暉想做的，是讓人工智能和安全“落了地”。

4 月 10 日，坐在雷鋒網(wǎng)編輯面前的薛暉聊了這些故事。18 天后，阿里安全圖靈實(shí)驗(yàn)室將 AI 圖像識(shí)別技術(shù)應(yīng)用在 AI 安全廚房解決方案，這個(gè)值守廚房的“AI 防火員”開(kāi)啟了薛暉夢(mèng)想的第一步。

AI博士從“解放”鑒黃師起步，十年專(zhuān)注安全AI