0
本文作者: 史中 | 2016-12-17 09:18 |
一天深夜,你正在訪問某大型科技媒體網站,突然,所有的網頁都變成了不可描述的模樣:充滿了“同城約”“鈣片”的圖片和鏈接。
你十分震驚,然后批判性地瀏覽了一晚上。
作為一個有科學精神的媒體,雷鋒網宅客頻道決定深度探尋一下,這些網站究竟是如何出現(xiàn)在我們面前的。
首先,科普一些硬技術基礎知識:
1、黃賭毒網站,國家一般是不太允許的。。。
2、黃賭毒網站,搜索引擎一般是不收錄的。。。
3、黃賭毒網站,網站廣告位一般是不賣給他們的。。。
實際上,如果你站在黃賭毒網站站長的立場上來看,他們宣傳自己的“光明大道”已經幾乎被法律和規(guī)則堵死。留給他們的,只有一條路——黑產。
先來看看這些急于宣傳自己的非法網站都是什么“貨色”。360 搜索技術負責人張向征告訴雷鋒網宅科頻道,為了制作可以識別網站被黑的“悟空算法”,他和團隊對一些賭博黑產做了詳細的研究。
賭博網站一般會利用國家福利彩票的數(shù)據(jù),然后自己“坐莊”。也就是說,“彩民”以為自己的錢用來買了真正的彩票。但實際上都交到了“莊家”手上。
每期開獎時,當彩民中獎金額遠小于投注金額時(這是大概率事件),莊家會真的把獎金兌給彩民;當彩民運氣爆棚,拿著五百萬的獎券找莊家兌獎時,發(fā)現(xiàn)再也打不開這個網站了。
這類賭博站大都坐落在境外,所以他們的網址經常發(fā)生變化。關鍵是,普通的“用戶”如果想找到他們比登天還難。(實際上涉及到跨境,公安機關也很難找到他們)
如此讓人眼花繚亂的“盈利模式”,最終顯然都是靠不明真相的群眾買單。
【某偽造的福利彩票頁面】
如何獲得群眾基礎呢?黑產盯上了搜索引擎。
在搜索引擎中“權重”越高的網站,顯然瀏覽的人就越多。為了能夠進入搜索引擎,黑產才想出把正常網頁“偷天換日”的伎倆。
簡單來說,就是利用網站系統(tǒng)漏洞,把正常的網頁篡改成“黃賭毒”的網頁。
目測這個龐大的黑色產業(yè)已經達到了百億級別。
張向征說。
一方面看,這門生意相當好賺;當然另一個方面也要考慮“黑站”的難度。
從難度上說,最容易被黑的站是教育、政府和企業(yè)網站。
一般來說兩類站容易被黑,一是不涉及到直接交易的,二是以信息發(fā)布為主要功能的。
真正的銀行、電商類網站,防護的力量比較強,不會輕易被攻擊。
教育政府網站,一般訪問人數(shù)較少,或者只有特定人群訪問,而建站的主體往往并不需要經常運營維護網站。而更大數(shù)量的企業(yè)網站,可能是用模板制作,僅僅用于產品展示。企業(yè)關心的是自己業(yè)務層面,對網站并不非常關心。
相信你已經可以腦補出這些容易被攻擊網站的形象了。
【某政府網站被黑/圖片來自互聯(lián)網】
這些網頁被篡改,不僅僅是需要改回來這么簡單。黑客侵入網站,說明網站存在著嚴重的可以被利用的漏洞。利用這些漏洞,黑客可以把網站的所有注冊用戶數(shù)據(jù)竊取下來。而這又造成了新的更大問題:
很多用戶在注冊多個網站時會使用相同的密碼,而一旦密碼泄露,黑客就可以用這些密碼去嘗試登錄你的支付寶、淘寶、網銀賬戶等等,俗稱撞庫。
如果黑客掌握了你的足夠多的個人信息,還可以把它們賣給詐騙集團,用來精準詐騙。沒錯,震驚全國的徐玉玉案,陰影中的黑手可能就是這樣伸向無辜的人。
另外,利用網站漏洞,黑客還可以植入木馬病毒,當用戶瀏覽這個網頁,就有可能感染病毒。病毒會寄生在用戶的電腦上,監(jiān)視用戶的所有行為。
既然已經形成一個黑色產業(yè),就意味著有相當多的黑帽子黑客“一起玩”。而這些黑客,顯然也會分開不同的流派。簡單說來有兩個方向:
這類篡改,粗獷無比。往往粗暴地把網站的全部內容直接替換成大幅的非法網站圖片和鏈接。這樣的玩法,即使是老眼昏花的老奶奶都能看出區(qū)別。
這種情況,會造成網站嚴重的流量異常(根本就不是一個網站了好不好),一旦被站長發(fā)現(xiàn),會被第一時間處理。
【被篡改網頁充斥非法廣告】
這類篡改,一般不會動網站的主體結構,而是在某些特定的地方加入黃賭毒網站的宣傳圖片或鏈接。這些入口可能被放置在首頁,也可能被放在不同的欄目下面。對于訪問這個黃色網站的用戶來說,他們也許依然能找到自己想要的資料。同事他們也會看到非法的廣告或鏈接,可能會點擊進入。
這種情況一般不會給網站流量造成巨大的負面影響(反而有時會升高,你懂的)。由于隱蔽性好,也不容易被站長發(fā)現(xiàn)。
某網絡安全專家曾經向雷鋒網宅客頻道(微信公眾號:宅客頻道)表示:
有些政府網站管理員很“喜歡”網站被黑,因為這樣會給本來沒多少人看的網頁帶來不錯的流量。在年終做匯報的時候,倒是可以拿出不錯的數(shù)據(jù)。
雷鋒網宅客頻道表示:竟然好有道理,我竟無言以對。
很多站長并不關心自己的網站被黑客篡改,很多站長也無法感知自己的網頁被黑客掛了非法鏈接。那么,最擔心這件事情的就輪到了搜索引擎。因為大多數(shù)無辜群眾都是通過搜索引擎才進入這些危險網頁的,用戶受害之后,搜索引擎“責任重大”。這也是為什么 360 搜索的安全專家要“挺身而出”的原因。
張向征介紹,小伙伴們最新研究的死磕黑客的方法,叫做“悟空算法”。
對于剛剛提到的兩類篡改網頁的行為,“悟空算法”都有應對的技巧。
【某境外賭博網站】
搜索引擎可以利用機器學習的方法,對正常的網站已有的標題和內容做語義分布的判斷。如果同一個網站在短時間內語義分布突然發(fā)生了大面積偏移,就可以證明這個網站的頁面遭遇的大規(guī)模改動。
另外,網站在短時間內突然增加了大量的外部鏈接,或者原有的鏈接全部成為“死鏈”,這些都是用來判定網頁被篡改的識別規(guī)則。
當然,網站新的語義分布中,如果充斥著不可描述的詞語,就更加可以確定它遭受了“血洗”。
由于只有少量的內容發(fā)生變化,所以在統(tǒng)計意義上,并不能產生能夠說明問題的偏移。這個時候就要增加參考的維度。
例如要和以前的網頁做比對,對于新加入的內容做分析。
有些網站相比之前可能只有幾十個字存在風險,而這恰恰就是被黑客篡改的內容。
張向征說。
所謂道高一尺,魔高一丈。月如百萬的黑客們并不愿意束手就擒,想出了奇葩的對抗方法。
張向征告訴雷鋒網宅客頻道:
有些黑客篡改網頁,會采用“作弊”的方法。當檢測到用戶是通過輸入網址的方法進入網頁時,網頁一切正常。當檢測到用戶是通過搜索引擎進入網頁時,才會“兇相畢露”。
顯然站長不會通過搜索引擎進入自己的網站,所以當他進入網站的時候,一派歡樂祥和。當用戶通過搜索進入的時候,卻如同進入了“月球的背面”,一片牛鬼蛇神魑魅魍魎。
這種情況下,站長很難意識到發(fā)生了什么,也可能忽略搜索引擎發(fā)來的警告。這個時候對于 360 搜索團隊也是一個考驗。
另外,有些黑客在篡改網頁的時候,甚至把域名都做了改變。此時搜索引擎就無法比對該網頁的歷史信息,也就沒有辦法判斷它相對于歷史形態(tài)有哪些微笑的改動。
這個時候,我們的系統(tǒng)就只能對新網頁和我們歷史數(shù)據(jù)中的網頁做智能比對,從而判斷它的“前世”是哪個網站。
張向征說。
除了這些,團隊還要面對在識別過程中那些“擦邊”的情況。張向征告訴雷鋒網宅客頻道:
有些網站本身不是賭博網站,但是也許報道了很多非法“六合彩”的內容。
有些網站有大量的類色情詞匯分布,但也可能并不是真正的色情網站。
有些網站備案不太完整,也可能增加系統(tǒng)的不信任。
這些情況也許都會導致系統(tǒng)誤判。
對于誤判,除了不斷改進算法之外,最有效的辦法就是人工接受站長反饋。
只要人工審核認為不是真正的黑產,我們都會放開。只要你不是誘導用戶去賭博。。。
他說。
至此,網頁篡改的黑產大軍,以及和他們“神魔斗法”的搜索團隊,硝煙彌漫的戰(zhàn)爭圖景展現(xiàn)在你的面前。
也許,正在看文章的你對于自己的判斷力有充足的信心,并不認為自己會被黃賭毒網頁引入歧途。但是也許你身邊的人,年邁的父母,稚嫩的孩子,都是“黃賭毒”網站最肥美的獵物。
龐大的黑產告訴我們網絡世界遠不是天堂。而面對危險,埋怨從來無濟于事。為網絡世界構建秩序的點滴努力,都彌足珍貴。
文/史中(微信ID:Fungun,歡迎講述你的故事)
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。