丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給AI研習社-譯站
發(fā)送

0

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

本文作者: AI研習社-譯站 2020-11-21 10:17
導語:在FIBO執(zhí)行推理時,OWL2RL是比RDFS更好的選擇。

譯者:AI研習社(季一帆

雙語原文鏈接:Exploring FIBO Using the Inference and Property Path Features of GraphDB


知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

簡介

本體知識圖譜可不是隨拿隨用的,使用者需要做出相應的努力才能發(fā)揮其作用,使其成為有效可用的工具。我們知道,領(lǐng)域知識的用處極大,然而這些知識卻總是不完備的,將領(lǐng)域知識表示為圖中的數(shù)據(jù)可不容易。在這個過程中,關(guān)鍵在于將你掌握的領(lǐng)域知識完美匹配到圖中的知識表示。在本文中,我們將就GraphDB特性進行一系列討論,其中就包括上述的知識匹配/對齊。

FIBO概況

金融業(yè)業(yè)務(wù)本體(FIBO)是由企業(yè)數(shù)據(jù)管理委員會(EDMC)開發(fā)的金融行業(yè)概念模型,至今仍由EDMC支持著FIBO的維護和開發(fā)。FIBO的目標是在金融業(yè)務(wù)數(shù)據(jù)構(gòu)件的描述中,提供獨立于數(shù)據(jù)構(gòu)件的精確含義。具體而言,F(xiàn)IBO包含構(gòu)建、擴展及集成金融業(yè)務(wù)應用所需的實體和關(guān)聯(lián)信息。由于FIBO基于RDF(S)和OWL,因此可以使用SPARQL和OWL推理進行分析。本文應用的版本(2020第2季度)包含以下內(nèi)容:

  • 122個命名空間,表示模塊結(jié)構(gòu);

  • 1542類別

  • 1328概念

  • 535斷言

自2017年首次發(fā)布FIBO以來,受益于金融業(yè)的廣泛參與,該標準已取得廣大發(fā)展,并符合許多現(xiàn)有標準。從一個稱為“語義知識庫”的Excel工作簿開始,F(xiàn)IBO已經(jīng)發(fā)展成為基于RDF和OWL的復雜本體。在這個過程中,還發(fā)展了其他一些意外成果,包括本體工程的實踐指南,例如使用傳統(tǒng)基于文本的版本控制系統(tǒng)的RDF文本穩(wěn)定性,通過與對象管理組(OMG)的密切關(guān)系實現(xiàn)嚴格的元數(shù)據(jù)標準,以及對OWL推理能力的使用。更多細節(jié)可見此處。

FIBO的內(nèi)容多種多樣,其中,RDF和OWL本體是包含業(yè)務(wù)知識的核心實體。這些業(yè)務(wù)知識可表示為RDF-XML、Turtle、JSON-LD和N-Quads/N-Triples等形式。此外:

  • FIBO詞匯表基于SKOS分類法,用于RDF-XML、Turtle和JSON-LD序列化的分類管理。

  • FIBO數(shù)據(jù)字典有.csv和.xlsx格式,包含F(xiàn)IBO中的操作類及其附帶屬性。

  • FIBO-DM是一種企業(yè)數(shù)據(jù)模型,可用作SAP PowerDesigner概念和邏輯數(shù)據(jù)模型。

在本文中,我們重點關(guān)注FIBO本體和詞匯表。由于它們都使用RDF編碼,因此可使用SPARQL和OWL推理進行分析。

兩不同層次結(jié)構(gòu)

FIBO詞匯表中的所有概念都是由FIBO本體中的實體定義的。因此,這些概念包含有豐富的上下文信息,在應用中使用該詞匯表會同時為用戶提供這些信息。如,fibo-v-be:DomesticUltimateParent 由實體 fibo-be-oac-cctl:DomesticUltimateParent 所定義。

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

FIBO詞匯表中的概念由 skos:broader  和 skos:narrower 兩種不同層次的謂詞進行定義。在上圖中,Total Controlling Interest Party 是比 Domestic Ultimate Parent 更為寬泛的概念。在已公布的詞匯表中,僅使用了 skos:broader。如 SKOS 規(guī)范所述,“skos:broader 和 skos:narrower  彼此相反。當概念X比概念Y表示更廣泛時,意味著Y相對是X是更小、更準確的概念“。因此,從 fibo-v-be:TotalControllingInterestParty fibo-v-be:DomesticUltimateParent  存在 skos:narrower 的關(guān)系。 

如果給定詞匯表的層次結(jié)構(gòu)和本體的層次結(jié)構(gòu),那么層次結(jié)構(gòu)之間的關(guān)系是什么呢?fibo-be-oac-cctl:DomesticUltimateParent 的每一個父類在詞匯中都有對應概念嗎?這些概念是否表達了skos:broaderTransitive/skos:narrowerTransitive 與 fibo-v-be:DomesticUltimateParent 的層次結(jié)構(gòu)?在本文的其余部分,我們將借助GraphDB解答這些問題。

FIBO導入GraphDB

GraphDB是Ontotext開發(fā)的一個可擴展、高性能的三元組數(shù)據(jù)庫,其前身是OWLIM。當前的9.4.1版本支持RDF1.1、SPARQL 1.1和OWL2推理,此外還支持其他許多用于索引、可視化、分析和聯(lián)合工具。同時,還提供有web訪問的API(包括用于終端的SPARQL協(xié)議),因此可以結(jié)合任何編程語言使用。在下一節(jié)會展示該數(shù)據(jù)庫對SPARQL1.1,OWL2推理及其規(guī)范屬性路徑的支持。

首先通過GraphDB創(chuàng)建一個存儲庫,通過導航窗口Setup -> Repositories > Create Repository 等步驟實現(xiàn)。其中,表單關(guān)鍵字包括:

  • Repository ID,本例中是 FIBO。

  • Ruleset,本例中選擇下拉菜單中的 OWL 2-RL (Optimized)。

  • 選中“Use context index”,因為FIBO本體包含反映本體模塊結(jié)構(gòu)的命名圖。

其余字段使用默認值即可,以下為屏幕截圖:

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

接下來導入RDF圖,有以下要求:

  1. EDMC FIBO本體站點下載FIBO Production zipped N-Quads發(fā)行版。本文使用為2020年第2季度版。

  2. EDMC FIBO詞匯站點下載FIBO Production zipped N-Quads發(fā)行版。本文使用為2020年第2季度版。

  3. 從W3C獲取所需的SKOS簡單知識管理系統(tǒng)http://www.w3.org/2004/02/skos/core#。因為W3C具有HTTP303重定向功能,在web中瀏覽該URI會自動生成HTML,并在導入GraphDB時生成RDF。

為了提高效率,最好將FIBO下載到本地磁盤,存儲到GraphDB的import目錄,而SKOS直接通過internet下載。

從磁盤導入詞匯表需要1秒,導入本體需要1分10秒,通過互聯(lián)網(wǎng)導入sko需要2秒。之所以速度相差之大,是因為在導入過程中要執(zhí)行推斷操作。詞匯表基于開放SKOS,借助生成新三元組的結(jié)構(gòu)元素,詞匯表和SKOS的導入訓練。而由于在本體構(gòu)建過程中OWL的復雜性,消耗了較長時間。最終,導入圖譜的106187條顯式語句生成405493條推斷語句,總計511680條語句。需要注意的是,所有推斷語句存在于默認圖,同時該圖還包含命名圖中的所有語句。

使用GraphDB Workbench的Explore菜單中的類層次結(jié)構(gòu)圖能夠獲得本體概述,該圖將子類表示為嵌套在父類中的圓:

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

GraphDB中的推理

OWL 2支持許多不同的推理機制,GraphDB為其中的一些程序語言配置文件提供支持。在GraphDB中,存儲相關(guān)的語言配置文件由規(guī)則集合確定。無論是通過SPARQL插入數(shù)據(jù)還是直接導入圖譜,只要將三元組添加到知識庫中,就會調(diào)用專門的規(guī)則引擎——reasoner。除非不進行推理操作,否則任何規(guī)則集都通過額外的隱式三元組實現(xiàn)并存儲,而不是顯式插入的三元組。GraphDB的特殊指出在于,提交SPARQL DELETE操作后,將回收無效的推斷語句。此外,存儲內(nèi)容和選定規(guī)則集決定了新建三元組的屬性。例如,如果兩個謂詞的定義表明它們是相反的,那么當其中一個謂詞出現(xiàn)在一個三元組時,將創(chuàng)建一個相應逆屬性的三元組。

在本文的FIBO應用中,我們選擇了OWL2RL語言配置文件,該配置適用于對可擴展推理有一定要求,同時保留一定表達能力的應用。我們還用RDF Schema(RDFS)規(guī)則集加載FIBO,該規(guī)則集非常簡單,只包含rdfs:subPropertyOf, rdfs:subClassOf, rdfs:domain和rdfs:range。正如預期的那樣,使用RDFS加載FIBO本體的NQ文件只需不到一秒鐘,而使用OWL2RL則需要一分鐘以上。但是,RDFS只推斷出170804個隱式語句,比OWL2RL少2倍多,一些重要的推論被忽略。例如,執(zhí)行以下查詢將會提取出OWL2RL知識庫存在但RDFS缺失的子類關(guān)系:

SELECT * WHERE {
 { SERVICE <repository:FIBO-RL> {
     ?sub_class rdfs:subClassOf ?super_class
     FILTER(?sub_class != ?super_class)
     FILTER(?super_class != owl:Thing)
     FILTER(contains(str(?sub_class),'fibo')
         && contains(str(?super_class),'fibo'))
 }  }
 FILTER NOT EXISTS {
         ?sub_class rdfs:subClassOf ?super_class
 }
}

GraphDB內(nèi)部聯(lián)合能夠?qū)崿F(xiàn)跨知識庫的相同實例數(shù)據(jù)高效查詢。以下是RDFS推理庫缺失的子類關(guān)系:

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

究其原因,是因為RDFS推理器無法處理概念的定義。例如,Rate和Ratio類被定義為與以下語句等價:

fibo-fnd-qt-qtu:Rateowl:equivalentClassfibo-fnd-utl-alx:Ratio

在OWL2的所有語言配置文件中,這表示它們是彼此的子類,但RDFS語義卻不是如此。

基于屬性路徑的增強推理

屬性路徑是SPARQL的特殊屬性,通過屬性路徑,能夠在RDF圖中跨不同三元組的節(jié)點。三元組是SPARQL中最簡單的屬性路徑。

在FIBO本體中,類層次結(jié)構(gòu)由及物謂詞表示,即rdfs:subClassOf。FIBO詞匯概念的層次結(jié)構(gòu)由不及物謂詞表示,如skos:broader。這意味著,本體的類層次結(jié)構(gòu)與常用編程語言的層次結(jié)構(gòu)的概念類似,如java、python和C++,以及UML等規(guī)范語言。類層次結(jié)構(gòu)被映射到謂詞,然而由于無法精準表示預期,映射是有損的,謂詞概念一般無法完整表達原有語義。

至于詞匯表的使用,則是為了給領(lǐng)域特定詞匯提供更廣泛的上下文。因此,使用者必須區(qū)分他們的詞匯結(jié)構(gòu)和FIBO的詞匯結(jié)構(gòu)。因為層次結(jié)構(gòu)隱式地反映了本體的及物類結(jié)構(gòu),所以任何情況下進行集成都要求外部詞匯表與隱式FIBO層次結(jié)構(gòu)相關(guān)聯(lián)。

由于FIBO本體層次結(jié)構(gòu)實際上是要映射到skos:broaderTransitiveskos:narrower_transitive謂詞,因此通過推理可以緩解映射問題。將GraphDB知識庫與OWL2RL (Optimized) 規(guī)則集配合使用,能夠創(chuàng)建所有必需三元組。SKOS語義屬性的頂層結(jié)構(gòu)是skos:semanticRelation,該謂詞提供了可視化表示和詞匯表導航所必需的結(jié)構(gòu)。skos:broader  和 skos:narrower三元組可用于降低對FIBO的本體需求。

skos:broader 和 skos:narrower可用于FIBO的高層本體,至于選擇何種方式,由使用者自行決定,可以單獨應用,也可以按一定策略結(jié)合SPARQL使用。

對兩種層次結(jié)構(gòu)的lint check驗證了屬性路徑和推斷的實用性。每個詞匯概念都由本體中的實體定義,那么哪些實體由于詞匯表沒有相應詞匯而進行了類層次結(jié)構(gòu)的映射呢?

結(jié)構(gòu)完整性約束

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

使用SPARQL分析圖譜

利用SPAERL查詢語句,查找與類層次結(jié)構(gòu)的概念槽子類相關(guān)聯(lián)、但與FIBO詞匯表的概念層次結(jié)構(gòu)缺乏關(guān)聯(lián)的類別。

Lint查詢

SELECT DISTINCT ?parentEntity  where {
   ?concept a skos:Concept ;
            rdfs:isDefinedBy ?entity .
   # Every concept is defined by an entity
   ?entity rdfs:subClassOf ?parentEntity .
   # Exclude restrictions
   FILTER(ISIRI(?parentEntity))
   # Only consider resources in the FIBO namespaces
   FILTER(CONTAINS(str(?parentEntity),'fibo'))
   FILTER NOT EXISTS {
       # Find where there is no semantic relation
       # between concept and related concept
       ?relatedConcept rdfs:isDefinedBy ?parentEntity .
       # Consider the entire set of
       # related concepts in the hierarchy
       ?concept (skos:semanticRelation)+ ?relatedConcept
   }
}

至于詞匯表和本體之間的屬性路徑,一部分依賴于skos:semanticRelation,另一部分依賴于rdfs:subClassOf。

skos:semanticRelation后面的加號(+)表示此謂詞可用作與主語通過rdfs:subClassOf匹配的一個或多個謂語之間的路徑。此外,在屬性路徑中可以執(zhí)行其他許多操作,本文不再討論,有興趣的讀者請查閱SPARQL 1.1 Query language W3C Recommendation 21 March 2013

至此,我們得到一個知識庫,該庫包含F(xiàn)IBO本體和FIBO詞匯表的顯式和隱式RDF語句。執(zhí)行l(wèi)int查詢將會生成不滿足上述完整性檢查的類列表:父類應該鏈接到詞匯表中與相應子類相關(guān)的概念。

parentEntity 
 fibo-der-drc-swp:SwapLifecycleEventIdentifier
 fibo-fbc-fct-bc:BusinessCenterCodeScheme
 fibo-fbc-fct-breg:RegistrationAuthorityCode
 fibo-fbc-fct-fse:FinancialServiceProviderIdentifierScheme
 fibo-fbc-fct-rga:RegulationIdentificationScheme
 fibo-fbc-fct-rga:RegulationIdentifier
 fibo-fbc-fct-usjrga:FederalReserveDistrictIdentifier
 fibo-fbc-fi-fi:SecuritiesTransactionIdentifier
 fibo-fnd-arr-arr:CollectionConstituent
 fibo-fnd-arr-arr:DatedCollectionConstituent
 fibo-fnd-arr-arr:DatedStructuredCollection
 fibo-fnd-arr-arr:Scheme
 fibo-fnd-arr-arr:StructuredCollection
 fibo-fnd-dt-fd:CombinedDateTime
 fibo-fnd-gao-gl:Goal
 fibo-fnd-law-lcap:LicenseIdentifier
 fibo-fnd-oac-ctl:Control
 fibo-fnd-oac-oac:OwnershipAndControl
 fibo-fnd-oac-own:Ownership
 fibo-fnd-pas-pas:ProductIdentifier
 fibo-fnd-plc-adr:RegionSpecificIdentifier
 fibo-fnd-plc-loc:County
 fibo-fnd-plc-loc:FederalCapitalArea
 fibo-fnd-plc-loc:FederalState
 fibo-fnd-plc-loc:Parcel
 fibo-fnd-plc-uspsa:DeliveryAddressCodeSet
 fibo-fnd-plc-uspsa:DeliveryPointCodeSet
 fibo-fnd-plc-uspsa:ZipCodeScheme
 fibo-fnd-plc-vrt:NotionalPlace
 fibo-fnd-pty-pty:Situation
 fibo-fnd-rel-rel:Reference
 fibo-fnd-utl-alx:StatisticalAreaIdentifier
 fibo-sec-sec-iss:SecurityOfferingDistributionType

結(jié)論

FIBO是本體工程一個非常復雜的展示,需要由具有廣泛金融知識以及具有豐富的本體及其管理知識的人員執(zhí)行,只靠閱讀代碼是不夠用的。為了最好的利用FIBO,需要借助GraphDB這樣強大的工具,以充分利用FIBO的豐富知識來輔助開發(fā)。本文證明,在FIBO執(zhí)行推理時,OWL2RL是比RDFS更好的選擇。同時,結(jié)合推理和屬性路徑能夠檢測到一些結(jié)構(gòu)性問題,這些技術(shù)的研究為大型、復雜的本體和知識圖譜提供質(zhì)量保證。

之后,我們會陸陸續(xù)續(xù)發(fā)布一系列相關(guān)文章,對如何使用圖數(shù)據(jù)庫引擎和語義技術(shù)來處理金融服務(wù)部門的本體和數(shù)據(jù)進行介紹。


AI研習社是AI學術(shù)青年和AI開發(fā)者技術(shù)交流的在線社區(qū)。我們與高校、學術(shù)機構(gòu)和產(chǎn)業(yè)界合作,通過提供學習、實戰(zhàn)和求職服務(wù),為AI學術(shù)青年和開發(fā)者的交流互助和職業(yè)發(fā)展打造一站式平臺,致力成為中國最大的科技創(chuàng)新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

知識圖譜改變銀行業(yè)務(wù)模式?基于GraphDB探索FIBO

分享:
相關(guān)文章

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說