0
雙語原文鏈接:What’s the Difference Between an Ontology and a Knowledge Graph?
隨著語義應(yīng)用程序成為業(yè)界越來越熱門的話題,客戶經(jīng)常來EK詢問有關(guān)本體和知識圖譜的問題。具體來說,他們想知道兩者之間的區(qū)別。本體和知識圖譜是一回事嗎?它們有何不同?兩者之間是什么關(guān)系?
在這篇博客中,我將引導(dǎo)您了解本體和知識知識圖譜,講述它們之間的區(qū)別以及它們?nèi)绾谓M織大量數(shù)據(jù)和信息。
本體是語義數(shù)據(jù)模型,用于定義domain中事物的類型以及可用于描述它們的屬性。本體是廣義的數(shù)據(jù)模型,這意味著它們僅對具有某些屬性的事物的一般類型進(jìn)行建模,而并不包含有關(guān)我們domain中具體個體的信息。例如,本體論不能描述您的狗,斑點和它的所有個體特征,主要描述狗的一般概念,嘗試描述大多數(shù)狗可能具有的特征。這樣做可以使我們在將來用本體來描述其他狗。
本體有三個主要組成部分,通常描述如下:
類: 存在于數(shù)據(jù)中的不同類型的。
關(guān)系:連接兩個類的屬性。
屬性:描述單個類的屬性。
例如,假設(shè)我們有以下關(guān)于書籍、作者和出版商的信息:
首先,我們要標(biāo)識類(數(shù)據(jù)中事物的唯一類型)。這個示例數(shù)據(jù)似乎捕獲了關(guān)于書籍的信息,因此它是類的一個很好的候選項。具體來說,示例數(shù)據(jù)捕獲了關(guān)于書籍的某些類型的內(nèi)容,比如作家和出版商。再深入一點,我們可以看到我們的數(shù)據(jù)還捕獲了關(guān)于出版商和作者的信息,比如他們的位置。這給我們留下了這個例子中的四個類:
書籍
作者
出版商
位置
下一步,我們需要標(biāo)識關(guān)系和屬性(為了簡單,我們可以將關(guān)系和實體屬性都視為屬性)。使用我們在之前定義的類,我們可以查看數(shù)據(jù)并開始列出我們看到的每個類的所有屬性。例如,在書籍類中,一些屬性可能是:
書籍有作者
書籍有出版商
書集是在一個日期出版的
書籍之后有續(xù)集(其他書)
其中一些屬性是連接兩個類的關(guān)系。例如,關(guān)系屬性“書籍有作者”是一個連接書籍類和作者類的關(guān)系。其他屬性,像“書籍發(fā)布的日期”是實體屬性,只描述一個類,而不是將兩個類連接在一起。
需要注意的是,這些屬性可能適用于任何給定的書籍,但它們不一定適用于每一本書。例如,很多書都沒有續(xù)集。這在我們的本體中很好,因為我們只是想確保我們捕獲了可能適用于許多(但不一定是所有)書籍的屬性。
雖然上面的屬性列表很容易閱讀,但是重寫這些屬性以更清楚地定義我們的類和屬性會有所幫助。例如,“書籍有作者”可以寫成:
書→有作者→作者
盡管你可以包括更多的屬性,這取決于你的用例,對于這個博客,我已經(jīng)定義了以下屬性:
書→有作者→作者
書→有出版商→出版商
書→出版于→出版日期
書→后面是→書
出版商 →位于→位置
位置→位于→位置
記住,我們的本體是一個通用的數(shù)據(jù)模型,這意味著我們不想在本體中包含關(guān)于特定書籍的信息。相反,我們希望創(chuàng)建一個可重用的框架,將來我們可以用它來描述其他書籍。
當(dāng)我們結(jié)合類和關(guān)系時,我們能夠以圖的形式查看本體:
使用本體作為一個框架,我們可以添加關(guān)于個別書籍、作者、出版商和位置的真實數(shù)據(jù)來創(chuàng)建一個知識圖譜。利用上面表中的信息和本體,我們可以創(chuàng)建每個本體關(guān)系的特定實例。比如,如果我們的本體中有這樣的關(guān)系“書籍→有作者→作者”,這個關(guān)系的單個實例如下:
如果我們把我們擁有的關(guān)于《殺死一只知更鳥》這本書的所有信息加進(jìn)去,我們可以看到知識圖譜的開端:
如果我們對所有的數(shù)據(jù)都這么做,我們最終會得到一個使用本體對數(shù)據(jù)進(jìn)行編碼的圖。通過使用知識圖譜,我們可以將數(shù)據(jù)看作一個關(guān)系網(wǎng)絡(luò),而不是作為單獨的表格在我們無法理解的數(shù)據(jù)點間繪制新的連接。具體來說,使用SPARQL,我們可以查詢數(shù)據(jù)和使用推理功能(讓知識圖譜建立之前沒有定義的連接)。
正如你在上面例子中所看的,當(dāng)你將本體(我們的數(shù)據(jù)模型)應(yīng)用到一組單獨的數(shù)據(jù)點(書籍、作者和出版商數(shù)據(jù))時,那么就是創(chuàng)建了一個知識圖譜。換句話說:
本體+數(shù)據(jù)=知識圖譜
AI研習(xí)社是AI學(xué)術(shù)青年和AI開發(fā)者技術(shù)交流的在線社區(qū)。我們與高校、學(xué)術(shù)機(jī)構(gòu)和產(chǎn)業(yè)界合作,通過提供學(xué)習(xí)、實戰(zhàn)和求職服務(wù),為AI學(xué)術(shù)青年和開發(fā)者的交流互助和職業(yè)發(fā)展打造一站式平臺,致力成為中國最大的科技創(chuàng)新人才聚集地。
如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學(xué)習(xí)新知,分享成長。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。