3
本文作者: 李勤 | 2017-09-17 12:13 |
本文作者:雷鋒網(wǎng)宅客頻道主筆,李勤。
說到閱片無數(shù),你一定記得首席鑒黃師唐馬儒。
如果一天同時(shí)有一萬個(gè)唐馬儒實(shí)時(shí)在線鑒片,世界將會(huì)變成怎樣?
是的,那畫面太美我也不敢想。不過,9月15日,在百度云智峰會(huì)的分論壇“視頻智能技術(shù)與平臺(tái)”上,百度云高級(jí)產(chǎn)品專家黃鋒在視頻 AI 產(chǎn)品發(fā)布中介紹了“復(fù)制10000個(gè)唐馬儒”的功能。
到底怎么回事?
現(xiàn)在大家直播玩得666,短視頻也十分火熱,攝像頭還到處都要,這造成了一種嚴(yán)峻的局面:視頻量海量增長,誰知道里面有沒有混入一些黃賭毒等奇怪的東西。
個(gè)人可能看得開心(或者不開心?),平臺(tái)要承擔(dān)相應(yīng)的責(zé)任。于是,這些企業(yè)很煩惱:現(xiàn)在群主都可能被拉下水,何況我們平臺(tái)?!
于是,百度云就趁機(jī)利用視頻人工智能技術(shù)推出了內(nèi)容分析 VCA 、內(nèi)容審核VCR 和封面智選 VCS 。
我們先從內(nèi)容分析 VCA說起 。
除了視頻量比海深,之前很多企業(yè)依靠的是人工審核標(biāo)注團(tuán)隊(duì),所謂人工審核標(biāo)注,就是一堆勤勞的唐馬儒不停地鑒定視頻,給視頻打上標(biāo)簽。如果只是篩選出黃賭毒也就罷了,要是要做內(nèi)容分類、推薦怎么辦?
唐馬儒的身體不只被掏空~人力成本太高,企業(yè)請(qǐng)不起這么多唐馬儒,畢竟人家在用生命工作,很貴的。
這時(shí),AI 技術(shù)派上了用場。
AI 版唐馬儒拿到一個(gè)視頻后,把視頻分為了幾層:鏡頭、幀和語音。然后,它開始了視頻場景識(shí)別、人臉識(shí)別、字幕識(shí)別、物體識(shí)別,同步進(jìn)行語言識(shí)別,并將語音識(shí)別的結(jié)果與之進(jìn)行交叉認(rèn)證,從而精準(zhǔn)地判斷這個(gè)人在什么場景下在干嘛,他周圍有些什么物體。
黃鋒稱,這些識(shí)別模型使用了 1000 萬+訓(xùn)練數(shù)據(jù),能識(shí)別 5000 多個(gè)場景與40000 種物體,并且用上了百度的人臉識(shí)別技術(shù),還有百度百科公眾人物庫與自定義人臉庫。
也就是說,他不僅能從海量視頻中檢索出鹿晗,還能識(shí)別這是一個(gè)在郵筒邊拍照的鹿晗,還是在跳舞的鹿晗。
或者,是一個(gè)在中國工作拿著仙女棒的波多野結(jié)衣或在日本和道具一起加班的波老師。
黃鋒說,對(duì)比人工,VCA 分析效率提升5倍,日吞吐能力相當(dāng)于10000人,分析成本降低了 50%,召回率提高 10 倍。
下面來到了你們最關(guān)心的鑒黃,哦不,內(nèi)容審核 VCR 。
還是按照內(nèi)容分析VCA 一樣,AI 唐馬儒講視頻分層成了幀和音頻,然后將兩者(圖像)與視頻黑庫中的圖像指紋和聲紋指紋進(jìn)行對(duì)比,AI 會(huì)自動(dòng)對(duì)這個(gè)視頻進(jìn)行色情識(shí)別、暴恐識(shí)別、政治人物識(shí)別和廣告識(shí)別。
(看上去,視頻黑庫其實(shí)就是小黑屋?)
視頻中的畫面進(jìn)行文字識(shí)別得到字幕,視頻中的語音通過長語音識(shí)別也變成文字,這兩部分文字都再進(jìn)行文本審核。
問題來了,假如什么話都沒有,畫面也不暴露,一言不合就開車,只剩下不能描述的哼哼唧唧的聲音怎么辦?
黃鋒表示,不要擔(dān)心,我們 AI 識(shí)別還有“嬌喘模式”,能識(shí)別這些不可描述的聲音。
對(duì)這些視頻內(nèi)容進(jìn)行嚴(yán)格的審核后,AI 唐馬儒有三個(gè)處理模式:通過、封禁、人審。
所謂人審,就是你藏得太深了,連本 AI 都搞不定,讓我家真正的唐馬儒出馬吧!
黃鋒指出,VCR 還有更多的用武之地:
視頻去重:兩個(gè)清晰度不一、但內(nèi)容相同的視頻,當(dāng)然是取其一了。
廣電監(jiān)播。
侵權(quán)檢測:納尼,你怎么是個(gè)盜版,殺無赦。
雷鋒網(wǎng)宅客頻道編輯也不想承認(rèn)這一點(diǎn),但是沒辦法,你去超市買個(gè)西紅柿都會(huì)選更好看的那一個(gè)?。。?!
黃鋒稱,視頻封面質(zhì)量對(duì)用戶點(diǎn)擊影響很大。
也就是說,平臺(tái)當(dāng)然是要選更具有精神內(nèi)涵和和諧美感的封面了!
他向雷鋒網(wǎng)介紹了 VCS 封面選圖過程,通過鏡頭檢測——主/客觀質(zhì)量過濾——內(nèi)容相關(guān)性三個(gè)步驟,AI 幫助一個(gè)視頻選出了自己賣相最好的那一張封面照。
(這個(gè)過程不亞于女生從一堆自拍照里選出一張發(fā)朋友圈吧?)
我們來看一下以前的封面選圖效果和VCS 的選圖效果對(duì)比照:
[圖1]
[圖2]
[圖3]
[圖4]
圖1和圖3均是以前封面選圖的結(jié)果,呈現(xiàn)局部或者單一圖像,圖2和圖4是VCS的選圖,圖2呈現(xiàn)了人和寵物的關(guān)系,圖4展現(xiàn)的是完整的車。
其實(shí),聽到最后,宅客頻道編輯弱弱提出了一個(gè)終極疑惑:這和百度云是什么關(guān)系?
黃鋒說,這是百度云接入的視頻 AI 能力,通過線上溝通、定制方案、測試對(duì)接,最后就能正式上線。
好吧好吧,你說什么都對(duì)。
反正聽到“嬌喘模式”那一節(jié)時(shí),雷鋒網(wǎng)編輯已經(jīng)笑到抽搐不在線了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。