丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給楊文
發(fā)送

1

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

本文作者: 楊文 2017-12-20 18:44
導(dǎo)語(yǔ):網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究

雷鋒網(wǎng)AI科技評(píng)論按:網(wǎng)絡(luò)是大數(shù)據(jù)的重要組織形式,然而網(wǎng)絡(luò)化的數(shù)據(jù)由于缺少高效可用的節(jié)點(diǎn)表示,而難于直接應(yīng)用。網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)通過(guò)將高維稀疏難于應(yīng)用的數(shù)據(jù)轉(zhuǎn)化為低維緊湊易于應(yīng)用的表達(dá)而受到廣泛關(guān)注。網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的一個(gè)重要任務(wù)就是重疊社區(qū)發(fā)現(xiàn)。本文就是為大家介紹基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)的最新研究。文章內(nèi)容根據(jù)中科院孫冰杰博士在雷鋒網(wǎng)GAIR大講堂的線上直播公開(kāi)課整理而成。

在近日雷鋒網(wǎng) GAIR 大講堂線上直播課上,來(lái)自中科院計(jì)算所網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室的孫冰杰博士為大家做了一場(chǎng)主題為「基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究」的分享,詳細(xì)介紹了他們團(tuán)隊(duì)最近在基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究上的相關(guān)工作。

孫冰杰,中科院計(jì)算所博士研究生,主要研究方向?yàn)榫W(wǎng)絡(luò)結(jié)構(gòu)分析,網(wǎng)絡(luò)表示學(xué)習(xí)。

分享內(nèi)容:

我將從以下四個(gè)方面對(duì)我們團(tuán)隊(duì)最近所做的研究做詳細(xì)介紹。

  • 研究背景及挑戰(zhàn)

  • 對(duì)稱編解碼重疊社區(qū)發(fā)現(xiàn)方法:SEND

  • 重疊社區(qū)發(fā)現(xiàn)方法加速研究

  • 總結(jié)

首先看我們研究工作的背景及挑戰(zhàn)。

大數(shù)據(jù)領(lǐng)域中大部分?jǐn)?shù)據(jù)是以網(wǎng)絡(luò)形式進(jìn)行組織的,比如社交媒體中的社交網(wǎng)絡(luò),科研領(lǐng)域中的引用網(wǎng)絡(luò),生物領(lǐng)域的中蛋白質(zhì)相互作用網(wǎng)絡(luò),以及交通領(lǐng)域中的航空網(wǎng)路或路網(wǎng)。網(wǎng)絡(luò)化數(shù)據(jù)之后節(jié)點(diǎn)之間的復(fù)雜關(guān)系是導(dǎo)致大數(shù)據(jù)處理困難的重要原因。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

網(wǎng)絡(luò)化數(shù)據(jù)在不同粒度下對(duì)應(yīng)的理論與應(yīng)用研究也是不同的。在微觀粒度上,主要研究的是節(jié)點(diǎn)層面上的任務(wù),當(dāng)節(jié)點(diǎn)聚集形成社區(qū)的時(shí)候,研究的是社區(qū)層面上的任務(wù)。在宏觀層面上,我們研究的是在整個(gè)網(wǎng)絡(luò)上的任務(wù)。

在這次分享上,我們主要研究在中觀粒度下的社區(qū)發(fā)現(xiàn)任務(wù)。它主要由三元閉包理論和強(qiáng)弱連接理論為支撐,主要支撐的應(yīng)用有社區(qū)發(fā)現(xiàn)應(yīng)用等。

中觀粒度上的社區(qū)發(fā)現(xiàn)任務(wù):向下可通過(guò)節(jié)點(diǎn)表示支持微觀粒度的任務(wù),向上可通過(guò)網(wǎng)絡(luò)生成支持宏觀粒度的任務(wù)。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)所面臨的問(wèn)題和挑戰(zhàn)

相對(duì)于傳統(tǒng)節(jié)點(diǎn)表示,它的功能是比較單一的,只支持重疊社區(qū)指示,無(wú)法支持一些其他的任務(wù)。但現(xiàn)有的重疊社區(qū)指示方法沒(méi)辦法用在大規(guī)模網(wǎng)絡(luò)上。這是針對(duì)社區(qū)指示能力和多任務(wù)支持能力之間的矛盾以及海量數(shù)據(jù)處理任務(wù)的挑戰(zhàn)。

為此我們團(tuán)隊(duì)做了兩方面的工作。

工作一:非負(fù)對(duì)稱編解碼模型

節(jié)點(diǎn)表示的社區(qū)指示能力需要滿足多種約束條件。一般需要滿足三個(gè)約束條件,非負(fù)性,稀疏性和分布性。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

節(jié)點(diǎn)表示的多任務(wù)支持能力

需要節(jié)點(diǎn)表示能充分恢復(fù)數(shù)據(jù)在原始空間中的相似性關(guān)系,對(duì)節(jié)點(diǎn)表示添加的約束越多,對(duì)數(shù)據(jù)的恢復(fù)能力影響越大。因此這之間是矛盾的。矛盾主要體現(xiàn)在基于網(wǎng)絡(luò)化數(shù)據(jù)表示的社區(qū)發(fā)現(xiàn)相關(guān)工作。     中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

工作一是針對(duì)重疊社區(qū)得到節(jié)點(diǎn)表示的社區(qū)表示能力和數(shù)據(jù)還原能力之間的矛盾。目標(biāo)是保證節(jié)點(diǎn)表示的社區(qū)指示能力和對(duì)原始數(shù)據(jù)的還原能力。

所面臨的問(wèn)題:

  • 如何在數(shù)據(jù)恢復(fù)過(guò)程中對(duì)節(jié)點(diǎn)表示進(jìn)行約束增加指示能力。

  • 傳統(tǒng)的OCD只優(yōu)化解碼過(guò)程,節(jié)點(diǎn)表示功能單一,不能應(yīng)用于其他任務(wù)。

  • OCD節(jié)點(diǎn)表示的顯示約束使優(yōu)化困難

解決方案:用戶點(diǎn)表示同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行編解碼操作,保證學(xué)習(xí)到高質(zhì)量節(jié)點(diǎn)表示。通過(guò)編解碼過(guò)程對(duì)對(duì)稱性節(jié)點(diǎn)表示進(jìn)行隱式約束,保證指示能力。

具體來(lái)說(shuō),OCD模型通過(guò)重構(gòu)輸入數(shù)據(jù)學(xué)習(xí)節(jié)點(diǎn)表示,通過(guò)正則項(xiàng)等對(duì)節(jié)點(diǎn)表示進(jìn)行顯式約束,保證節(jié)點(diǎn)表示的指示能力。但傳統(tǒng)的OCD目標(biāo)函數(shù)相當(dāng)于只優(yōu)化了解碼過(guò)程(生成原始數(shù)據(jù))

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

OCD目標(biāo)函數(shù)忽略了編碼過(guò)程,導(dǎo)致模型學(xué)習(xí)到的節(jié)點(diǎn)表示無(wú)法充分體現(xiàn)節(jié)點(diǎn)在原空間中的相似性,因此應(yīng)用在下游任務(wù)上準(zhǔn)備性較低,且無(wú)法處理新樣本數(shù)據(jù)。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

以上提出的對(duì)稱編解碼模型可以同時(shí)解決節(jié)點(diǎn)表示的指示能力和對(duì)多種下游任務(wù)的支持能力。

通過(guò)優(yōu)化編碼和解碼過(guò)程保證節(jié)點(diǎn)表示的數(shù)據(jù)還原能力,通過(guò)隱式約束保證節(jié)點(diǎn)表示的社區(qū)表示能力,從而最終在多種類型網(wǎng)絡(luò)的多個(gè)任務(wù)上取得了目前最好的效果。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

進(jìn)一步介紹這個(gè)模型的普適性,我們希望這個(gè)節(jié)點(diǎn)表示能夠用在更多的任務(wù)上。因此我們采用了多種類型的網(wǎng)絡(luò),比如說(shuō)二部網(wǎng)絡(luò),有向網(wǎng)絡(luò)、有權(quán)網(wǎng)絡(luò)、層次網(wǎng)絡(luò)等,也采用了多種類型輸入,比如說(shuō)節(jié)點(diǎn)序列輸入,鄰接矩陣輸入等。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

工作小結(jié):本文工作針對(duì)重疊社區(qū)發(fā)現(xiàn)得到的節(jié)點(diǎn)表示存在的“指示能力和多任務(wù)支持”之間的矛盾,設(shè)計(jì)了一種同時(shí)優(yōu)化編解碼過(guò)程的模型,可以保證節(jié)點(diǎn)表示的指示能力并且在多種類型網(wǎng)絡(luò)的多個(gè)任務(wù)上取得了最好的效果。

工作二:重疊社區(qū)發(fā)現(xiàn)方法加速研究

現(xiàn)有的重疊社區(qū)發(fā)現(xiàn)方法存在“速度與精度”之間的矛盾,在面臨大規(guī)模網(wǎng)絡(luò)時(shí),無(wú)法拿來(lái)急用。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

關(guān)于問(wèn)題一,如何選擇高質(zhì)量的參數(shù)迭代初始點(diǎn)。提出利用一個(gè)與非凸目標(biāo)函數(shù)近似的凸目標(biāo)函數(shù)的優(yōu)化結(jié)果作為非凸目標(biāo)函數(shù)優(yōu)化的迭代初始點(diǎn),以保證最終速度和效果。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié) 

重疊社區(qū)發(fā)現(xiàn)的模型選擇

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

關(guān)于問(wèn)題二,解決由迭代過(guò)程的復(fù)雜性帶來(lái)的優(yōu)化困難問(wèn)題。傳統(tǒng)的應(yīng)對(duì)迭代過(guò)程復(fù)雜性的方法是采樣和近似。這類方法是影響精度且仍然不夠快。

解決方案:網(wǎng)絡(luò)結(jié)構(gòu)局部聚集特性和節(jié)點(diǎn)表示的稀疏性,相應(yīng)地設(shè)計(jì)了“維度級(jí)”和“連邊級(jí)”兩級(jí)加速策略,對(duì)模型進(jìn)行加速。 

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

工作小結(jié):針對(duì)基于泊松模型的重疊社區(qū)發(fā)現(xiàn)方法,目標(biāo)函數(shù)的非凸性和迭代過(guò)程的復(fù)雜性,提出了兩種加速策略,分別解決了初始點(diǎn)選擇問(wèn)題和迭代過(guò)程復(fù)雜問(wèn)題??梢蕴幚碚鎸?shí)大規(guī)模網(wǎng)絡(luò)。

綜上所述:針對(duì)重疊社區(qū)發(fā)現(xiàn)任務(wù),我們主要解決了三個(gè)問(wèn)題。編解碼模型解決了重疊社區(qū)發(fā)現(xiàn)得到的節(jié)點(diǎn)表示的社區(qū)指示能力和數(shù)據(jù)恢復(fù)能力之間的矛盾??焖俪踔的P徒鉀Q了目標(biāo)函數(shù)非凸性帶來(lái)的可擴(kuò)展性問(wèn)題。兩級(jí)加速模型解決了優(yōu)化過(guò)程復(fù)雜性帶來(lái)的可擴(kuò)展性問(wèn)題。

視頻回放鏈接:http://www.mooc.ai/open/course/357

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

中科院孫冰杰博士:基于網(wǎng)絡(luò)化數(shù)據(jù)表示學(xué)習(xí)的重疊社區(qū)發(fā)現(xiàn)研究 | 分享總結(jié)

分享:
相關(guān)文章

編輯&記者

AI科技評(píng)論員,微信:yeohandwin
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)