為了找出羞羞視頻，百度云居然有“嬌喘模式”

本文作者：李勤

2017-09-17 12:13

導(dǎo)語：如果一天有一萬個唐馬儒實時在線鑒片，世界將會變成怎樣？

本文作者：雷鋒網(wǎng)宅客頻道主筆，李勤。

說到閱片無數(shù)，你一定記得首席鑒黃師唐馬儒。

為了找出羞羞視頻，百度云居然有“嬌喘模式”

如果一天同時有一萬個唐馬儒實時在線鑒片，世界將會變成怎樣？

為了找出羞羞視頻，百度云居然有“嬌喘模式”

是的，那畫面太美我也不敢想。不過，9月15日，在百度云智峰會的分論壇“視頻智能技術(shù)與平臺”上，百度云高級產(chǎn)品專家黃鋒在視頻 AI 產(chǎn)品發(fā)布中介紹了“復(fù)制10000個唐馬儒”的功能。

到底怎么回事？

現(xiàn)在大家直播玩得666，短視頻也十分火熱，攝像頭還到處都要，這造成了一種嚴峻的局面：視頻量海量增長，誰知道里面有沒有混入一些黃賭毒等奇怪的東西。

個人可能看得開心（或者不開心？），平臺要承擔相應(yīng)的責任。于是，這些企業(yè)很煩惱：現(xiàn)在群主都可能被拉下水，何況我們平臺？！

于是，百度云就趁機利用視頻人工智能技術(shù)推出了內(nèi)容分析 VCA 、內(nèi)容審核VCR 和封面智選 VCS 。

精準分析鹿晗和波老師在干什么

我們先從內(nèi)容分析 VCA說起。

除了視頻量比海深，之前很多企業(yè)依靠的是人工審核標注團隊，所謂人工審核標注，就是一堆勤勞的唐馬儒不停地鑒定視頻，給視頻打上標簽。如果只是篩選出黃賭毒也就罷了，要是要做內(nèi)容分類、推薦怎么辦？

唐馬儒的身體不只被掏空～人力成本太高，企業(yè)請不起這么多唐馬儒，畢竟人家在用生命工作，很貴的。

這時，AI 技術(shù)派上了用場。

AI 版唐馬儒拿到一個視頻后，把視頻分為了幾層：鏡頭、幀和語音。然后，它開始了視頻場景識別、人臉識別、字幕識別、物體識別，同步進行語言識別，并將語音識別的結(jié)果與之進行交叉認證，從而精準地判斷這個人在什么場景下在干嘛，他周圍有些什么物體。

黃鋒稱，這些識別模型使用了 1000 萬＋訓(xùn)練數(shù)據(jù)，能識別 5000 多個場景與40000 種物體，并且用上了百度的人臉識別技術(shù)，還有百度百科公眾人物庫與自定義人臉庫。

也就是說，他不僅能從海量視頻中檢索出鹿晗，還能識別這是一個在郵筒邊拍照的鹿晗，還是在跳舞的鹿晗。

為了找出羞羞視頻，百度云居然有“嬌喘模式”

或者，是一個在中國工作拿著仙女棒的波多野結(jié)衣或在日本和道具一起加班的波老師。

為了找出羞羞視頻，百度云居然有“嬌喘模式”

黃鋒說，對比人工，VCA 分析效率提升5倍，日吞吐能力相當于10000人，分析成本降低了 50%，召回率提高 10 倍。

“嬌喘模式”識別一言不合就開車

下面來到了你們最關(guān)心的鑒黃，哦不，內(nèi)容審核 VCR 。

還是按照內(nèi)容分析VCA 一樣，AI 唐馬儒講視頻分層成了幀和音頻，然后將兩者（圖像）與視頻黑庫中的圖像指紋和聲紋指紋進行對比，AI 會自動對這個視頻進行色情識別、暴恐識別、政治人物識別和廣告識別。

為了找出羞羞視頻，百度云居然有“嬌喘模式”

（看上去，視頻黑庫其實就是小黑屋？）

視頻中的畫面進行文字識別得到字幕，視頻中的語音通過長語音識別也變成文字，這兩部分文字都再進行文本審核。

問題來了，假如什么話都沒有，畫面也不暴露，一言不合就開車，只剩下不能描述的哼哼唧唧的聲音怎么辦？

為了找出羞羞視頻，百度云居然有“嬌喘模式”

黃鋒表示，不要擔心，我們 AI 識別還有“嬌喘模式”，能識別這些不可描述的聲音。

為了找出羞羞視頻，百度云居然有“嬌喘模式”

對這些視頻內(nèi)容進行嚴格的審核后，AI 唐馬儒有三個處理模式：通過、封禁、人審。

所謂人審，就是你藏得太深了，連本 AI 都搞不定，讓我家真正的唐馬儒出馬吧！

黃鋒指出，VCR 還有更多的用武之地：

視頻去重：兩個清晰度不一、但內(nèi)容相同的視頻，當然是取其一了。
廣電監(jiān)播。
侵權(quán)檢測：納尼，你怎么是個盜版，殺無赦。

顏值即正義：幫你選點擊高的封面圖

雷鋒網(wǎng)宅客頻道編輯也不想承認這一點，但是沒辦法，你去超市買個西紅柿都會選更好看的那一個啊?。?！

為了找出羞羞視頻，百度云居然有“嬌喘模式”

黃鋒稱，視頻封面質(zhì)量對用戶點擊影響很大。

也就是說，平臺當然是要選更具有精神內(nèi)涵和和諧美感的封面了！

他向雷鋒網(wǎng)介紹了 VCS 封面選圖過程，通過鏡頭檢測——主／客觀質(zhì)量過濾——內(nèi)容相關(guān)性三個步驟，AI 幫助一個視頻選出了自己賣相最好的那一張封面照。

（這個過程不亞于女生從一堆自拍照里選出一張發(fā)朋友圈吧？）

為了找出羞羞視頻，百度云居然有“嬌喘模式”

我們來看一下以前的封面選圖效果和VCS 的選圖效果對比照：

為了找出羞羞視頻，百度云居然有“嬌喘模式”

［圖1］

為了找出羞羞視頻，百度云居然有“嬌喘模式”

［圖2］

為了找出羞羞視頻，百度云居然有“嬌喘模式”

［圖3］

為了找出羞羞視頻，百度云居然有“嬌喘模式”

［圖4］

圖1和圖3均是以前封面選圖的結(jié)果，呈現(xiàn)局部或者單一圖像，圖2和圖4是VCS的選圖，圖2呈現(xiàn)了人和寵物的關(guān)系，圖4展現(xiàn)的是完整的車。

其實，聽到最后，宅客頻道編輯弱弱提出了一個終極疑惑：這和百度云是什么關(guān)系？

黃鋒說，這是百度云接入的視頻 AI 能力，通過線上溝通、定制方案、測試對接，最后就能正式上線。

好吧好吧，你說什么都對。

反正聽到“嬌喘模式”那一節(jié)時，雷鋒網(wǎng)編輯已經(jīng)笑到抽搐不在線了。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

李勤

編輯、作者

跟蹤互聯(lián)網(wǎng)安全、黑客、極客。微信：qinqin0511。

掃描關(guān)注作者微信

發(fā)私信

當月熱門文章