0
雷鋒網(wǎng)按:為了讓你在聊天斗圖中立于不敗之地,谷歌使用機(jī)器學(xué)習(xí)技術(shù),最新開發(fā)了一個(gè)可以讓你用自拍生成個(gè)人專屬表情包的工具,更新在自家聊天軟件Allo上。
拍照、分享、再查看——自拍已經(jīng)成為很多人的日常習(xí)慣,我們和香車自拍、美裝自拍、旅行自拍,還有“早晨,我醒了~”諸如此類的自拍。自拍已經(jīng)成為人類社會(huì)行為的一部分,長久以來被用來展示自我。對于一些人,自拍展示的是外貌;另一些人,自拍展示的是他們想要?jiǎng)e人認(rèn)為的樣子。還有一些人,兩方面都想展示。自拍是基于現(xiàn)實(shí)的直觀表達(dá),而用漫畫表現(xiàn)自我,相比現(xiàn)實(shí)更加溫馨而輕松。
Google推出的Allo內(nèi)置機(jī)器學(xué)習(xí)驅(qū)動(dòng)聊天程序。是網(wǎng)絡(luò)和藝術(shù)家合作的產(chǎn)品,想象一下,你的表情回復(fù)欄中,有一個(gè)按鍵——“自拍一鍵變表情”,它可以飛速自動(dòng)生成你的“漫畫版”。觸動(dòng)按鍵,程序會(huì)提示你自拍。接著,谷歌的圖像識(shí)別將會(huì)識(shí)別你的臉,將你的特征掃描到由Lamar Abrams繪制的工具包里,Lamar Abrams是一位故事板畫家兼作家,代表作是廣受好評的網(wǎng)絡(luò)卡通Steven Universe系列。該工具包儲(chǔ)存成百上千的眼睛、鼻子、臉型、發(fā)型和眼鏡元素。谷歌稱,工具包可以生成563,000,000億張不同的臉。系統(tǒng)生成最初漫畫,你還可以做出調(diào)整:換一個(gè)發(fā)型,或者換不同的眼鏡。最后,機(jī)器會(huì)自動(dòng)生成22個(gè)你的表情。
該工具起源于一項(xiàng)內(nèi)部研究項(xiàng)目,目的是想看看機(jī)器學(xué)習(xí)是否能用一張自拍照來生成一個(gè)即時(shí)的卡通人物。但正如谷歌用戶體驗(yàn)項(xiàng)目的負(fù)責(zé)人,Jason Cornwell所指出的那樣,制作某一個(gè)人的卡通畫并不是最終的目標(biāo)?!叭绾巫鲆恍┎恢荒鼙憩F(xiàn)你自己的外貌顏值,還能投射你的個(gè)性的東西?”Cornwell談到,“這個(gè)問題很有趣。它既能呈現(xiàn)機(jī)器學(xué)習(xí)和電腦的視覺感,也能表達(dá)人的表情。這就是Jennifer加入的原因,為你提供藝術(shù)的自我表現(xiàn)方式。
Cornwell提到的Jennifer Daniel,著名的藝術(shù)總監(jiān),她是首位在Richard Turley時(shí)代為《Bloomberg Businessweek》創(chuàng)作出名聲大噪的視圖的設(shè)計(jì)師,后來她又為《the New York Times》做了一系列視覺專欄。Daniel指出,“插圖能傳遞自拍不能表達(dá)的情緒狀態(tài)?!弊耘氖悄愕睦硐霠顟B(tài)。相比之下,表情則是對你的感受的一種升華和夸張化。因此,表情設(shè)計(jì)得很搞笑滑稽:你可以拿塊披薩,或者變成流著口水的僵尸。Cornwell表示:“我們的目標(biāo)不是一個(gè)確切的東西,我們是為了讓用戶創(chuàng)造出自己喜歡的東西?!币虼?,用戶測試尊重人們的感受,會(huì)提出問題:你在這張圖片中看到自己了嗎?你的朋友能認(rèn)出你嗎?
谷歌把這個(gè)項(xiàng)目列為長期運(yùn)作的項(xiàng)目,以期探索出新的方法,讓機(jī)器學(xué)習(xí)越來越廣泛地應(yīng)用。按谷歌的說法,谷歌的機(jī)器學(xué)習(xí)水平領(lǐng)先世界,如果它能讓機(jī)器學(xué)習(xí)成為應(yīng)用程序和網(wǎng)站的必備功能,那么它的產(chǎn)品將碾壓競爭對手。順著Google的計(jì)劃,目前Allo已經(jīng)成為各種新型機(jī)器學(xué)習(xí)應(yīng)用程序的試驗(yàn)臺(tái)。Cornwell稱:“我們在Allo平臺(tái)的試驗(yàn),目的是找出機(jī)器學(xué)習(xí)更好地傳遞信息的方法,從在確切時(shí)間表述確切事件,躍升到在確切時(shí)間表達(dá)準(zhǔn)確感情。”
這聽起來有點(diǎn)嚇人,好像Allo正試圖取代我們本人,成為對話的必需品?然而在實(shí)踐中,應(yīng)用程序幾乎是不可避免的。當(dāng)有人給你發(fā)信息時(shí),Allo會(huì)根據(jù)你們的談話記錄給出快速的回復(fù)。例如,如果你的朋友發(fā)給你一張她跳傘的照片,系統(tǒng)就會(huì)回復(fù):“太棒了!”?;蛘?,你正在群組里聊天,Allo會(huì)使用機(jī)器學(xué)習(xí)彈出一系列定制的搞笑動(dòng)圖來回復(fù)。這個(gè)想法是,即便你本人不在,也能增強(qiáng)你的表達(dá)能力,像是你本人親臨一樣。Cornwell表示:“我們在很多其他方面都在思考同一個(gè)的問題,藝術(shù)和機(jī)器學(xué)習(xí)會(huì)以怎樣的方式相遇?”不過他拒絕透露谷歌的研究方向。于此同時(shí),Daniel承認(rèn)了會(huì)有新的表情圖符推出,分別由不同的藝術(shù)家來完成,有著全新的風(fēng)格。雷鋒網(wǎng)覺得,如果真將有這樣一個(gè)新的表情包,能把自己幻化成一只可愛的狗狗?拜托,讓這一天早日來到吧!
Daniel指出,這個(gè)項(xiàng)目代表了藝術(shù)和工程新的交集。畢竟,我們才剛剛開始觸及機(jī)器學(xué)習(xí)對藝術(shù)的作用。如果達(dá)芬奇還活著,我們很難相信蒙娜麗莎會(huì)是怎樣一幅畫。相反,也許這將是一個(gè)用戶專屬的形象,可以為自己重新塑造出一個(gè)表情神秘的女性形象,還可以跨越不同的文化和時(shí)代。但是目前我們在惠特尼雙年展上還沒有發(fā)現(xiàn)什么酷炫的東西,也許需要由谷歌這樣的公司來打破僵局。Daniel,作為勝利解決了美國技術(shù)設(shè)計(jì)場景的人,一向直言不諱。對于與谷歌的合作,她評價(jià)道:“我感興趣的是工程與藝術(shù)合作的交集,還有這個(gè)合作平臺(tái)。在這個(gè)平臺(tái)上,我們創(chuàng)造的不僅僅是內(nèi)容,還有產(chǎn)品本身。
傳統(tǒng)的計(jì)算機(jī)把自拍照藝術(shù)化轉(zhuǎn)換,是通過分析圖像的像素,通過算法來確定屬性值,再通過像素值來評估顏色、形狀或紋理。然而,如今人們的自拍在不同背景光下,有各種姿勢。雖然人們很容易辨別一些定性特征,比如不管光照如何,都可以辨別出眼睛的顏色。但這對計(jì)算機(jī)來說是一項(xiàng)非常復(fù)雜的任務(wù)。這是因?yàn)?,?dāng)人們辨別眼睛顏色時(shí),不僅觀察眼睛的像素值,還會(huì)結(jié)合周圍的環(huán)境考慮。
為了解決這個(gè)問題,我們研究了類似人眼選擇特征的算法,而不是傳統(tǒng)的編碼方法,去解釋每種照明條件下眼睛的顏色。同時(shí)我們可以從頭開始創(chuàng)造一個(gè)大型神經(jīng)網(wǎng)絡(luò),也許可以做到這一點(diǎn)。我們想得到更有效的方式達(dá)到目的,因?yàn)橐獙⑷四樲D(zhuǎn)化成漫畫將是一個(gè)反復(fù)漫長的過程。
為了給你的朋友們塑造一個(gè)你所期待的形象,我們和藝術(shù)團(tuán)隊(duì)一起創(chuàng)作了各種各樣的元素。例如,藝術(shù)家最初設(shè)計(jì)的發(fā)型,用于實(shí)驗(yàn)在人工介入下,訓(xùn)練網(wǎng)絡(luò)為自拍匹配相應(yīng)的漫畫。之后,人工評判輸出的表情和輸入照片的匹配程度,以了解工具的表現(xiàn)。在某些情況下,評估者認(rèn)為有些風(fēng)格并沒有很好的表現(xiàn),所以藝術(shù)家們創(chuàng)造了更多神經(jīng)網(wǎng)絡(luò)可以識(shí)別的元素。
評估者對發(fā)型進(jìn)行分類,越左邊的圖標(biāo)代表越接近的。達(dá)成共識(shí)之后,常駐藝術(shù)家Lamar Abrams就根據(jù)圖片的共同之處創(chuàng)作出表情。
在美學(xué)研究中,有一個(gè)著名的問題 “恐怖谷效應(yīng)”——這一假說認(rèn)為,如果人類的復(fù)制品幾乎就像真人一樣,就會(huì)讓人感到厭惡。在機(jī)器學(xué)習(xí)中,如果遇到計(jì)算機(jī)對你的看法,比對你對自己的看法,這可能會(huì)變得更加復(fù)雜。
相比準(zhǔn)確復(fù)制一個(gè)人的外表,得到一個(gè)低分辨率模型,比如表情和貼紙,讓團(tuán)隊(duì)探索通過返送圖像增強(qiáng)表達(dá),這與其說是重現(xiàn)現(xiàn)實(shí),更多的是打破規(guī)則。
團(tuán)隊(duì)與藝術(shù)家Lamar Abrams合作設(shè)計(jì)的組合超過563,000,000億
計(jì)算機(jī)如何感知你,和你如何看待你自己以及你想怎么展示自己,協(xié)調(diào)這兩者的關(guān)系是一種藝術(shù)實(shí)踐。這是一個(gè)定制功能,包括不同的發(fā)型、皮膚色調(diào)和鼻子形狀,這是至關(guān)重要的。畢竟,漫畫的定義是主觀的。美學(xué)是由種族、文化和階級定義的,它會(huì)引導(dǎo)人們不自覺地因異排外。因此,我們努力創(chuàng)造的空間擁有不同種族、年齡、男性、女性和雌雄同體。我們的團(tuán)隊(duì)將繼續(xù)對研究結(jié)果進(jìn)行評估,以防止在訓(xùn)練系統(tǒng)時(shí)產(chǎn)生偏見。
沒有所謂的“普遍的審美”或“單調(diào)的你”。人們與父母交談的方式不同于與朋友交談的方式,也與同事交談的方式不同。當(dāng)你有很多社會(huì)角色的時(shí)候,制作一個(gè)虛擬的化身是不夠的。為了解決這一問題,Allo團(tuán)隊(duì)正在研究一系列的藝術(shù)聲音,以幫助其他人擴(kuò)展自己的聲音。目前發(fā)布的第一款風(fēng)格,可能是一種自黑風(fēng)格,下一款用于那些真誠時(shí)刻,可能會(huì)更可愛。在那之后,也許他們會(huì)把你變成一只狗。如果表情符號(hào)擴(kuò)大了交流的世界,最興奮的點(diǎn)不是這種技術(shù)和語言是如何演變的,而是人們對工具本身功能的看法。
雷鋒網(wǎng)獲知,Allo目前已Android系統(tǒng)中推出,并將很快在iOS系統(tǒng)上推出。
via CO.DESIGN
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。