丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
政企安全 正文
發(fā)私信給史中
發(fā)送

1

直播狂歡背后,如何揪出“不按套路出牌”的主播和觀眾?

本文作者: 史中 2016-10-08 10:31
導(dǎo)語(yǔ):當(dāng)成本上升到和他的收益持平的那一刻,也許就是作惡者轉(zhuǎn)身離開(kāi)的瞬間。

在你對(duì)著美麗的女主播流口水時(shí),偶爾會(huì)看到屏幕上冒出一條不和諧的彈幕,例如:“看艾薇;加X(jué)XXXX?!?/span>

對(duì)于這種不健康的信息,你可能會(huì)感到非常憤怒,然后按照號(hào)碼加一下。。。

這樣的觀眾“福利”,對(duì)于直播平臺(tái) CEO 來(lái)說(shuō)卻是不折不扣的災(zāi)難。每一個(gè)這樣的彈幕,都把他向“快播王欣”的角色推進(jìn)了一步。更何況時(shí)不時(shí)出現(xiàn)的“造人”直播,恨不能導(dǎo)致“有關(guān)部門(mén)”直接把直播平臺(tái)干掉。

直播狂歡背后,如何揪出“不按套路出牌”的主播和觀眾?

“合規(guī)性”這個(gè)并不性感的詞,在某些時(shí)刻成為了直播平臺(tái)的生死線。從這個(gè)角度看,直播反垃圾信息成為了一種剛需。雷鋒網(wǎng)采訪到了同盾科技的小伙伴,對(duì)于直播行業(yè)的反欺詐和反垃圾,他們有一些獨(dú)特的理解。

會(huì)“變臉”的敏感詞

彈幕里這些影響社會(huì)主義和諧社會(huì)建設(shè)的詞匯,統(tǒng)稱(chēng)為“敏感詞”,而這些讓人心旌動(dòng)搖的信息,就是“敏感信息”。同盾科技反欺詐及基礎(chǔ)產(chǎn)品總監(jiān)祝偉根據(jù)發(fā)布人群和傳播形式的特點(diǎn),給直播彈幕的敏感信息做了個(gè)分類(lèi):

涉黃涉政言論:通常是無(wú)組織,由普通直播觀眾發(fā)起。


虛假謠言:通常由水軍組織,作為“節(jié)奏”發(fā)動(dòng)機(jī),帶動(dòng)一般觀眾,快速形成熱點(diǎn)。


垃圾廣告:通常都是黑產(chǎn)組織,發(fā)布廣告內(nèi)容。會(huì)和直播平臺(tái)的風(fēng)控系統(tǒng)形成強(qiáng)對(duì)抗。

祝偉說(shuō),現(xiàn)在越來(lái)越多出現(xiàn)人氣很旺的直播場(chǎng)景。在其中往往聚集了幾萬(wàn)甚至更多人。這就像現(xiàn)實(shí)當(dāng)中眾人聚集的廣場(chǎng),不當(dāng)?shù)难哉摃?huì)起到煽動(dòng)的作用。

數(shù)萬(wàn)人、數(shù)十萬(wàn)人在網(wǎng)絡(luò)上聚集狂歡,這種情況正在加速出現(xiàn)。在9月27日舉行的小米發(fā)布會(huì),通過(guò)愛(ài)奇藝平臺(tái)對(duì)外直播。這場(chǎng)發(fā)布會(huì)聚集了大量的觀眾。在直播過(guò)程中,不時(shí)有“看A片加微信”的字幕從雷軍的臉上劃過(guò),讓人有一種“碉堡了”的錯(cuò)覺(jué)。

直播狂歡背后,如何揪出“不按套路出牌”的主播和觀眾?

【彈幕示意圖】

對(duì)于愛(ài)奇藝這樣的平臺(tái)來(lái)說(shuō),顯然會(huì)有基本的反垃圾彈幕功能。但是“漏網(wǎng)之魚(yú)”數(shù)量依然龐大。這就要?dú)w罪于反垃圾引擎的智能性了。因?yàn)閺摹奥┚W(wǎng)彈幕”的形式來(lái)看,大多是敏感詞的“變體”,即在敏感詞中間加入符號(hào),用同音字、近義字代替敏感詞。

有關(guān)敏感信息的屏蔽,難度并不小。這是一個(gè)從論壇時(shí)代就困擾各大平臺(tái)的難題。祝偉舉了幾個(gè)例子:

  • 很多情況下,各大平臺(tái)都需要屏蔽“鵬”這個(gè)人名,但是發(fā)彈幕者會(huì)用“月月鳥(niǎo)”嘗試代替“鵬”字。這種方法被用在很多漢字上。


  • 而事實(shí)上還存在另外一種情況。例如在論壇里經(jīng)常出現(xiàn)的“進(jìn)群交流”這樣的留言,本來(lái)是正常的留言,卻很容易因?yàn)橹虚g兩個(gè)字而被關(guān)鍵詞系統(tǒng)錯(cuò)殺。。。

雷鋒網(wǎng)想說(shuō),漢語(yǔ)的博大精深真是讓人跪服得妥妥的。

在這種情況下,一個(gè)“厲害”的垃圾信息屏蔽系統(tǒng),就涉及到語(yǔ)義分析功能。語(yǔ)義分析是人工智能的一個(gè)重要的分支技術(shù),簡(jiǎn)單說(shuō)來(lái)就是消除掉詞語(yǔ)的歧義,給一個(gè)確定的句子以語(yǔ)義理解。

語(yǔ)義分析這門(mén)技術(shù)其實(shí)已經(jīng)被用在諸多領(lǐng)域,但是由于人工智能發(fā)展程度的限制,使得“通用型”的語(yǔ)義分析可用性不理想。不過(guò)祝偉告訴雷鋒網(wǎng),

語(yǔ)義分析如果局限在特定的領(lǐng)域,就可以針對(duì)這個(gè)領(lǐng)域做大量的優(yōu)化,從而大大提高識(shí)別的準(zhǔn)確性。

他的話通俗來(lái)說(shuō)就是:在彈幕上發(fā)垃圾信息,是有套路的。

祝偉表示,死磕直播垃圾彈幕的場(chǎng)景中,一套語(yǔ)義模型是必要的。而模型里包含的要素,就是“樣本”“規(guī)則”“數(shù)據(jù)”。隨著時(shí)間的演進(jìn),會(huì)產(chǎn)生新的“黑話”,廣告的形式和語(yǔ)句也會(huì)發(fā)生“進(jìn)化”。但是通常這種變化都是有潮流可循的。也就是說(shuō),只要把最新出現(xiàn)的垃圾彈幕不斷加入語(yǔ)義模型,系統(tǒng)就會(huì)自動(dòng)演化出對(duì)這類(lèi)彈幕的識(shí)別能力。

就是在這種不斷和垃圾彈幕作斗爭(zhēng)的“貓鼠游戲”中,可以達(dá)到越來(lái)越強(qiáng)的反擊能力。這像極了人類(lèi)的抗生素和病毒的對(duì)抗過(guò)程。

人:一切違規(guī)的根源

如果你仔細(xì)思考:當(dāng)我們反垃圾彈幕的時(shí)候,我們?cè)诜词裁矗?/strong>

你可能會(huì)得出這樣的結(jié)論:我們?cè)诜磳?duì)“不按規(guī)矩出牌”的人。

沒(méi)錯(cuò),事情的重點(diǎn)在于“人”。每一條違規(guī)彈幕,都會(huì)溯源到一個(gè)具體的人。祝偉告訴雷鋒網(wǎng),根據(jù)實(shí)踐經(jīng)驗(yàn),大多數(shù)情況下發(fā)送黃暴彈幕或廣告彈幕的人員穩(wěn)定性很高。

也就是說(shuō),有一批人,會(huì)經(jīng)常出沒(méi)于不同平臺(tái),散發(fā)垃圾彈幕。對(duì)他們來(lái)說(shuō),這是一份相對(duì)穩(wěn)定的職業(yè)。

在這種情況下,就可以把違規(guī)的行為,和背后的人建立起相對(duì)固定的聯(lián)系。從而根據(jù)人或他使用的設(shè)備的信用情況,對(duì)違規(guī)行為的可能性做出判斷。

當(dāng)然,對(duì)于直播的觀眾,做到強(qiáng)實(shí)名認(rèn)證并不現(xiàn)實(shí)。但通過(guò)大數(shù)據(jù)的方式,這個(gè)問(wèn)題在很大程度上可以解決。

祝偉簡(jiǎn)單推演了這個(gè)邏輯:

對(duì)于一個(gè)真實(shí)的人來(lái)說(shuō),他的注冊(cè)賬號(hào)、手機(jī)號(hào)、所使用的設(shè)備、網(wǎng)段 IP 等等信息會(huì)產(chǎn)生很強(qiáng)的關(guān)聯(lián)性。根據(jù)這種關(guān)聯(lián)性,可以對(duì)一個(gè)新賬號(hào)和信用庫(kù)中的信息進(jìn)行比對(duì),從而“揪出”那些存在“案底”的人。

可以想象一下,同一個(gè)人做到同時(shí)更換登錄設(shè)備、注冊(cè)賬號(hào)、手機(jī)號(hào)和網(wǎng)絡(luò)環(huán)境,還是有一定難度的。當(dāng)然,對(duì)于這些“指紋”信息,各自存在一些繞過(guò)的技術(shù),但繞過(guò)的成本并不低:

首先,很多繞過(guò)技術(shù)可以被感知,例如虛擬設(shè)備、或者 VPN 代理等。


其次,這些繞過(guò)措施存在一定的技術(shù)門(mén)檻,這些門(mén)檻乍一看表現(xiàn)在技術(shù)上,而實(shí)質(zhì)都會(huì)反映在金錢(qián)成本上。

當(dāng)然,行為和設(shè)備指紋的關(guān)聯(lián)只是判定規(guī)則的一部分。祝偉舉了一個(gè)同盾提供給直播商的反垃圾工具中的例子:

例如有一條規(guī)則:一個(gè)用戶設(shè)備關(guān)聯(lián)的登錄 IP 超過(guò)3個(gè),系統(tǒng)就會(huì)向直播平臺(tái)預(yù)警風(fēng)險(xiǎn)。平臺(tái)可以根據(jù)我們的提示選擇封禁或者忽略,也可以修改規(guī)則的參數(shù),例如把關(guān)聯(lián) IP 的限度從3改成5。

類(lèi)似這種的規(guī)則還有很多,而且可以根據(jù)對(duì)抗的方向不斷修改或增刪規(guī)則。可以在很大程度上保證阻攔掉那些“圖謀不軌”的用戶。

當(dāng)然,這種技術(shù)有一個(gè)最核心的需求,就是各個(gè)平臺(tái)數(shù)據(jù)之間的共通。

在 A 平臺(tái)上的違規(guī)記錄,會(huì)影響這個(gè)用戶在 B 平臺(tái)的信用,這才能大大提高違規(guī)用戶的成本。

這就是所謂的跨平臺(tái)封禁。祝偉說(shuō)。(當(dāng)然他認(rèn)為同盾科技就是在這方面很有競(jìng)爭(zhēng)力的服務(wù)提供商。)

厲害的上帝視角

這個(gè)邏輯對(duì)于主播同樣適用。

隨著直播平臺(tái)的規(guī)范,主播進(jìn)入直播平臺(tái)需要認(rèn)證的信息也越來(lái)越多。以斗魚(yú)為例,目前主播想要加入直播平臺(tái),有關(guān)身份證和銀行卡的校驗(yàn)是必須的。

直播狂歡背后,如何揪出“不按套路出牌”的主播和觀眾?

【斗魚(yú)直播平臺(tái)的主播認(rèn)證頁(yè)面】

“但是,中國(guó)目前信息泄露非常嚴(yán)重,盜用其他人全套的個(gè)人信息很容易。祝偉說(shuō)。

在這種情況下,就需要建立更強(qiáng)大的主播認(rèn)證體制和主播信用體制。例如,

  • 通過(guò)人像識(shí)別技術(shù),判斷主播的形象是否和注冊(cè)身份證一致。


  • 建立主播的信用記錄,記錄 Ta 是否在其他平臺(tái)曾經(jīng)涉嫌淫穢內(nèi)容。

這些工作當(dāng)然可以在很大程度上提高主播違規(guī)的成本,但是祝偉覺(jué)得這還不夠?!叭W(wǎng)負(fù)面信息”,這個(gè)聽(tīng)起來(lái)很厲害的詞正是升級(jí)方案之一。

比如說(shuō),一個(gè)主播曾經(jīng)在婚戀網(wǎng)站商扮演過(guò)“婚托”和“酒托”的角色,或者在我們合作的幾千家論壇中發(fā)送過(guò)涉黃、廣告的帖子,那么 Ta 的信用評(píng)分就會(huì)受到很大的影響,這個(gè)評(píng)分會(huì)被直播平臺(tái)看到,從而很可能做出拒絕主播注冊(cè)的決策。

祝偉承認(rèn),對(duì)于直播行業(yè)的反垃圾,是一個(gè)長(zhǎng)期的對(duì)抗過(guò)程。而無(wú)論是主播還是觀眾,涉及的違規(guī)多數(shù)是“道德風(fēng)險(xiǎn)”,這并不是安全的范疇。

而對(duì)于道德風(fēng)險(xiǎn),只有一種方法,那就是不斷提高違規(guī)者作惡的成本。當(dāng)成本上升到和他的收益持平的那一刻,也許就是作惡者轉(zhuǎn)身離開(kāi)的瞬間。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,關(guān)注科技人文,安全、黑客及芯片。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄