0
本文作者: skura | 2019-01-22 14:58 |
雷鋒網(wǎng) AI 科技評論按,1 月 21 日,清華大學(xué)人工智能研究院知識中心(以下簡稱「知識中心」)成立儀式暨知識平臺發(fā)布會在清華大學(xué)東南門內(nèi) FIT 樓隆重舉行。作為清華人工智能研究院成立的首個(gè)研究中心,知識中心的成立是清華大學(xué)推進(jìn)人工智能發(fā)展的重要舉措,也是中國人工智能研究院的里程碑事件。
知識中心主任由李涓子老師擔(dān)任。
李涓子,清華大學(xué)長聘教授,博士生導(dǎo)師。中國中文信息學(xué)會語言與知識計(jì)算專委會主任。研究方向?yàn)橹R工程、語義 Web 和文本挖掘。近年來在重要國際會議和學(xué)術(shù)期刊上發(fā)表論文 100 余篇,編著出版《Mining User Generated Content》,《Semantic Mining in Social Networks》。主持國家自然科學(xué)基金重點(diǎn)課題、歐盟第七合作框架等多項(xiàng)國家、國際和部委項(xiàng)目。獲得 2017 年北京市科技進(jìn)步一等獎(jiǎng)、2013 年人工智能學(xué)會科技創(chuàng)新一等獎(jiǎng)等多個(gè)獎(jiǎng)項(xiàng)。
知識智能研究中心成立儀式
清華大學(xué)人工智能研究院常務(wù)副院長孫茂松教授是本次會議的主持人,清華大學(xué)人工智能研究院院長張鈸院士,清華大學(xué)副校長、清華大學(xué)人工智能研究院管委會主任尤政院士分別進(jìn)行了致辭,并為知識中心舉行了揭牌儀式。李涓子老師被聘任為知識中心主任,董振東先生被聘任為知識中心學(xué)術(shù)顧問。
清華大學(xué)人工智能研究院院長張鈸院士首先代表清華大學(xué)人工智能研究院致辭。他指出知識是人類智能的重要特征,我們已經(jīng)進(jìn)入后深度學(xué)習(xí)時(shí)代,讓計(jì)算機(jī)擁有大規(guī)模、高質(zhì)量的形式化知識,是實(shí)現(xiàn)安全可信人工智能的重要使命,知識表示、獲取、推理與計(jì)算將是新一代人工智能研究面臨的核心問題。清華大學(xué)在知識智能方面有著深厚的研究積累,清華大學(xué)人工智能研究院目標(biāo)是從事人工智能基礎(chǔ)理論與方法研究,希望通過成立知識中心,打造國際一流的知識智能創(chuàng)新高地,推動(dòng)魯棒可解釋人工智能的跨越式發(fā)展。
張鈸院士致辭
清華大學(xué)副校長、清華大學(xué)人工智能研究院管委會主任尤政院士在致辭中表示,成立知識中心是清華大學(xué)推進(jìn)人工智能發(fā)展的重要舉措,也是清華大學(xué)人工智能研究院的一個(gè)里程碑事件。希望知識智能研究中心更好地匯聚校內(nèi)外相關(guān)研究力量,在知識智能方面開展原創(chuàng)性的研究工作和技術(shù)創(chuàng)新,在實(shí)現(xiàn)魯棒可解釋人工智能方向上取得跨越式進(jìn)展,更好地服務(wù)于國家和清華的人工智能發(fā)展戰(zhàn)略。
尤政院士致辭
清華大學(xué)人工智能研究院于 2018 年 6 月 28 日在李兆基科技大樓揭牌成立。清華大學(xué)計(jì)算機(jī)系教授、中國科學(xué)院院士張鈸出任首任院長,清華大學(xué)交叉信息研究院院長、圖靈獎(jiǎng)獲得者姚期智擔(dān)綱學(xué)術(shù)委員會主任。研究院以人工智能基礎(chǔ)理論和基本方法研究為核心,積極推進(jìn)大跨度的學(xué)科交叉融合,積極推進(jìn)大范圍的技術(shù)與產(chǎn)業(yè)、學(xué)校與企業(yè)融合,充分發(fā)揮清華大學(xué)在多學(xué)科綜合、優(yōu)秀人才匯聚、高水平國際合作等方面的獨(dú)特優(yōu)勢,在人工智能的基礎(chǔ)理論和基本方法上開展源頭性和顛覆性創(chuàng)新,力爭將人工智能研究院打造成為一個(gè)具有全球影響力的人工智能高端研究機(jī)構(gòu)。在 2018 年 7 月,清華大學(xué)人工智能研究院剛成立時(shí),雷鋒網(wǎng)也曾采訪過首任院長張鈸院士,可以查看清華大學(xué)人工智能研究院成立第二天,我們請教了張鈸院士四個(gè)問題。
知識中心(Knowledge Intelligence Research Center (KIRC))成立于 2019 年 1 月 21 日,是清華大學(xué)人工智能研究院設(shè)立的首個(gè)研究中心。中心將致力于:
開展理論研究。研究支持魯棒可解釋人工智能的大規(guī)模知識的表示、獲取、推理與計(jì)算的基礎(chǔ)理論和方法。
構(gòu)建知識平臺。建設(shè)包含語言知識、常識知識、世界知識、認(rèn)知知識的大規(guī)模知識圖譜以及典型行業(yè)知識庫,建成清華大學(xué)知識計(jì)算開放平臺。
促進(jìn)交流合作。舉辦開放的、國際化的與知識智能相關(guān)的學(xué)術(shù)活動(dòng),增進(jìn)學(xué)術(shù)交流;普及知識智能技術(shù),促進(jìn)產(chǎn)學(xué)合作。
知識中心將以促進(jìn)清華和國家知識智能研究與發(fā)展為宗旨,打造具有廣泛影響力的學(xué)術(shù)研究、知識計(jì)算平臺與學(xué)術(shù)交流中心。
除了李涓子老師之外,知識中心的知名學(xué)者還包括孫茂松、朱小燕、唐杰、許斌、劉洋、黃民烈、劉知遠(yuǎn)等。
知識中心的知名學(xué)者
知識中心目前有三個(gè)實(shí)驗(yàn)室:
知識中心自然語言處理實(shí)驗(yàn)室(THUNLP):由孫茂松教授、劉洋副教授、劉知遠(yuǎn)副教授帶領(lǐng),主要從事中文信息處理、社會計(jì)算和知識圖譜研究。最近在孫茂松教授牽頭的 973 項(xiàng)目支持下,提出融合知識的統(tǒng)一語義表示框架和知識指導(dǎo)的自然語言處理的學(xué)術(shù)思想,取得一系列原創(chuàng)成果。
知識工程實(shí)驗(yàn)室(THUKEG):由李涓子教授、唐杰教授、許斌老師帶領(lǐng),主要從事知識工程、社會網(wǎng)絡(luò)分析研究。最近研制的科技知識挖掘系統(tǒng) AMiner 和跨語言知識圖譜 XLORE,獲得國內(nèi)外廣泛關(guān)注與使用,曾獲北京市科技進(jìn)步一等獎(jiǎng),中國人工智能學(xué)會科技進(jìn)步一等獎(jiǎng)。
交互式人工智能實(shí)驗(yàn)室(THUCoAI):由朱小燕教授、黃民烈副教授帶領(lǐng)。主要從事機(jī)器學(xué)習(xí)與自然語言處理應(yīng)用基礎(chǔ)研究,主要研究方向包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、問答系統(tǒng)、對話系統(tǒng)、情感理解、邏輯推理、語言生成等。最近探索將常識知識融入對話系統(tǒng)與文本生成,取得一系列原創(chuàng)成果。
清華大學(xué)知識計(jì)算開放平臺(THUKC)發(fā)布會
知識中心在成立儀式上還發(fā)布了體現(xiàn)國內(nèi)領(lǐng)先水平的清華大學(xué)知識計(jì)算開放平臺(http://ai.tsinghua.edu.cn/kirc/),內(nèi)容涵蓋語言知識、常識知識、世界知識和科技知識庫,包括:
在我國著名機(jī)器翻譯專家董振東先生畢三十年之功建立的語言和常識知識庫《知網(wǎng)》(HowNet)基礎(chǔ)上所研制的 OpenHowNet;
中英文跨語言百科知識圖譜 XLORE;
科技知識挖掘平臺 AMiner。
基于AMiner的《清華大學(xué)人工智能技術(shù)系列報(bào)告》(THUAITR)。
XLORE:中英文跨語言百科知識圖譜
網(wǎng)址:https://xlore.org/
XLORE 是融合中英文維基、法語維基和百度百科,對百科知識進(jìn)行結(jié)構(gòu)化和跨語言鏈接構(gòu)建的多語言知識圖譜,是中英文知識規(guī)模較平衡的大規(guī)模多語言通用知識圖譜。
XLORE 是中英文知識規(guī)模平衡的大規(guī)??缯Z言百科知識圖譜。該圖譜通過融合維基百科和百度百科,并對百科知識進(jìn)行結(jié)構(gòu)化和跨語言鏈接構(gòu)建而成。該圖譜以結(jié)構(gòu)化形式描述客觀世界中的概念、實(shí)例、屬性及其豐富語義關(guān)系。XLORE 目前包含約 247 萬概念、44.6 萬屬性/關(guān)系、1628 萬實(shí)例和 260 萬跨語言鏈接。XLORE 作為世界知識圖譜,將為包括搜索引擎、智能問答等人工智能應(yīng)用提供有力支撐。
XLORE 集成了多項(xiàng)創(chuàng)新研究成果:
利用基于鏈接因子圖模型的知識鏈接方法,實(shí)現(xiàn)對不同語言知識資源之間的實(shí)體知識關(guān)聯(lián);
利用跨語言概念層次關(guān)系的驗(yàn)證保證生成跨語言本體中概念關(guān)系的質(zhì)量,并進(jìn)一步研究了跨語言知識圖譜的概念層次剪枝和優(yōu)化算法以規(guī)范知識分類體系;
利用因子圖模型建立跨語言屬性間的對應(yīng)關(guān)系,減少知識圖譜的冗余;
聯(lián)合使用 DBpedia 分類樹、維基分類體系、百度百科詞條標(biāo)簽對未分類實(shí)體進(jìn)行類別標(biāo)注。相關(guān)成果發(fā)表在 WWW、IJCAI、ACL、EMNLP 等人工智能和自然語言處理領(lǐng)域重要國際會議上。
與著名知識圖譜 DBpedia 相比,XLORE 的中文實(shí)體數(shù)量是其的 3.6 倍,中英文跨語言鏈接增加 39%。XLORE 還提供多樣化數(shù)據(jù) API 服務(wù),系統(tǒng)累計(jì)訪問次數(shù)過億次,訪問來自 53 個(gè)不同國家或地區(qū);2018 年 API 響應(yīng)調(diào)用 160 萬余次。XLORE 項(xiàng)目計(jì)劃于 2019 年正式發(fā)布跨語言實(shí)體鏈接服務(wù) XLINK。
在世界知識的獲取、表示與計(jì)算方面,中心還研制發(fā)布了很多開源工具和評測數(shù)據(jù)集,如知識表示學(xué)習(xí)工具包 OpenKE(https://github.com/thunlp/OpenKE)、神經(jīng)網(wǎng)絡(luò)關(guān)系抽取工具包 OpenNRE(https://github.com/thunlp/OpenNRE)、Few shot learning 關(guān)系抽取數(shù)據(jù)集 FewRel(https://github.com/thunlp/FewRel)等,自發(fā)布以來獲得學(xué)術(shù)界與產(chǎn)業(yè)界廣泛使用。
OpenHowNet:基于義原的開放語言知識庫
網(wǎng)址:https://openhownet.thunlp.org/
OpenHowNet 是一個(gè)以詞語的概念為抽象描述對象,以「義原」為基本語義單位,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識語言知識圖譜。
HowNet 是由董振東先生、董強(qiáng)先生父子畢三十年之功建立的一個(gè)以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間、以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的語言和常識知識庫。知網(wǎng) HowNet 秉承還原論思想,認(rèn)為詞義概念可以用更小的語義單位來描述,這種語義單位被稱為「義原」(Sememe),是最基本的、不易于再分割的意義的最小單位。在不斷標(biāo)注的過程中,HowNet 逐漸構(gòu)建出了一套精細(xì)的義原體系(約 2000 個(gè)義原)。HowNet 基于該義原體系累計(jì)標(biāo)注了數(shù)十萬詞匯/詞義的語義信息,自 1999 年正式發(fā)布以來引起了中文信息處理領(lǐng)域極大的研究熱情,在詞匯相似度計(jì)算、文本分類、信息檢索等方面探索了 HowNet 的重要應(yīng)用價(jià)值,建立了廣泛而深遠(yuǎn)的學(xué)術(shù)影響力。
2017 年以來,清華大學(xué)研究團(tuán)隊(duì)系統(tǒng)探索 HowNet 知識庫在深度學(xué)習(xí)時(shí)代的應(yīng)用價(jià)值,并在詞匯語義表示、句子語義表示、詞典擴(kuò)展等任務(wù)上均得到了驗(yàn)證。研究發(fā)現(xiàn),HowNet 通過統(tǒng)一的義原標(biāo)注體系直接精準(zhǔn)刻畫語義信息,一方面能夠突破詞匯屏障,深入了解詞匯背后豐富語義信息;另一方面每個(gè)義原含義明確固定,可被直接作為語義標(biāo)簽融入機(jī)器學(xué)習(xí)模型,使自然語言處理深度學(xué)習(xí)模型具有更好的魯棒可解釋性。相關(guān)成果均發(fā)表在 AAAI、IJCAI、ACL、EMNLP 等人工智能和自然語言處理領(lǐng)域頂級國際會議上。
為了讓 HowNet 知識庫及其學(xué)術(shù)思想得到更廣泛的應(yīng)用,知識中心聯(lián)合董氏父子共同開源 HowNet 知識庫核心數(shù)據(jù),研制了知識庫的訪問與計(jì)算工具包,并將在清華大學(xué)知識計(jì)算平臺上持續(xù)地維護(hù)、更新和擴(kuò)展。
AMiner:科技知識挖掘平臺
網(wǎng)址:https://aminer.cn/
「AMiner」是一個(gè)研究者學(xué)術(shù)搜索類網(wǎng)站,能夠?yàn)橛?jì)算機(jī)科學(xué)相關(guān)領(lǐng)域的研究者提供更全面的領(lǐng)域知識和更具針對性的研究話題和合作者信息,為科研人員提供信息獲取和幫助。
AMiner 作為科技情報(bào)網(wǎng)絡(luò)大數(shù)據(jù)挖掘平臺,包含超過 2 億篇學(xué)術(shù)論文和專利以及 1.36 億科研人員學(xué)術(shù)網(wǎng)絡(luò)。該平臺于 2006 年上線,已經(jīng)累計(jì)吸引全球 220 個(gè)國家和地區(qū)的 800 多萬獨(dú)立 IP 訪問,數(shù)據(jù)下載量 230 萬次,年度訪問量超過 1000 萬,成為學(xué)術(shù)搜索和社會網(wǎng)絡(luò)挖掘研究的重要數(shù)據(jù)和實(shí)驗(yàn)平臺。
AMiner 項(xiàng)目團(tuán)隊(duì)與中國工程科技知識中心、微軟學(xué)術(shù)搜索、ACM、IEEE、DBLP、美國艾倫研究所、英國南安普頓大學(xué)等機(jī)構(gòu)建立了良好的合作關(guān)系,項(xiàng)目成果及核心技術(shù)應(yīng)用于中國工程院、科技部、國家自然科學(xué)基金委、華為、騰訊、阿里巴巴等國內(nèi)外 20 多家企事業(yè)單位,為各單位的專家系統(tǒng)建設(shè)及產(chǎn)品升級提供了重要數(shù)據(jù)及技術(shù)支撐。
THUAITR:清華大學(xué)人工智能技術(shù)系列報(bào)告
網(wǎng)址:https://reports.aminer.cn/
「THUATIR」是以 AMiner 全球科技情報(bào)大數(shù)據(jù)挖掘服務(wù)平臺為基礎(chǔ),聘請領(lǐng)域頂級專家作為顧問,采用人工智能自動(dòng)生成技術(shù),匯集而成的科技領(lǐng)域洞察報(bào)告。
THUAITR 以 AMiner 全球科技情報(bào)大數(shù)據(jù)挖掘服務(wù)平臺為基礎(chǔ),聘請領(lǐng)域?qū)<易鳛轭檰?,結(jié)合人工智能自動(dòng)生成技術(shù),以嚴(yán)謹(jǐn)、嚴(yán)肅、負(fù)責(zé)的態(tài)度制作發(fā)布的人工智能技術(shù)評論及人才分析。報(bào)告內(nèi)容涵蓋技術(shù)趨勢、前沿預(yù)測、人才分布、實(shí)力對比、以及洞察情報(bào)等。
2018 年共發(fā)布 14 份技術(shù)報(bào)告(主題包括:自動(dòng)駕駛 [基礎(chǔ)版]、機(jī)器人、區(qū)塊鏈、行為經(jīng)濟(jì)學(xué)、機(jī)器翻譯、通信與人工智能、自動(dòng)駕駛、自然語言處理、計(jì)算機(jī)圖形學(xué)、超級計(jì)算機(jī)、3D 打印、智能機(jī)器人、人臉識別、人工智能芯片),累計(jì)閱讀量超過 120 萬人次。本次將新發(fā)布「知識圖譜研究報(bào)告」和「數(shù)據(jù)挖掘研究報(bào)告」。
董強(qiáng)先生、李涓子教授、唐杰教授、黃民烈副教授、劉知遠(yuǎn)副教授分別介紹了知識計(jì)算開放平臺本次發(fā)布的相關(guān)資源及應(yīng)用案例。知識中心負(fù)責(zé)人李涓子教授表示,中心將在清華大學(xué)和人工智能研究院的支持下,以本次發(fā)布會為起點(diǎn),堅(jiān)持做好做強(qiáng)知識計(jì)算開放平臺,用知識為 AI 賦能。
雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。