日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
模式設(shè)計和原則在知識圖譜中的應(yīng)用

知識圖譜是一種非常強大的表示工具,它可以通過一張圖表達復(fù)雜的概念,這就是為什么常說“一圖勝千言”。但是,如果我們在沒有明確定義的模式下創(chuàng)建知識圖譜,就會存在一些問題。這就是為什么需要一種模式來限制鏈接的類型,充當(dāng)文檔,提供和機器可讀的語義,并確保軟件按照預(yù)期的方式來組織信息。

公司主營業(yè)務(wù):成都做網(wǎng)站、成都網(wǎng)站設(shè)計、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。創(chuàng)新互聯(lián)建站是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團隊。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團隊有機會用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)建站推出岐山免費做網(wǎng)站回饋大家。

對于知識圖譜而言,良好的模式設(shè)計比關(guān)系數(shù)據(jù)庫更為重要和核心。不幸的是,對于如何完成相對簡單的任務(wù)而言,目前缺乏詳細(xì)的指導(dǎo)。根據(jù)我的經(jīng)驗,我想至少提供一些幫助。

為了更好地了解模式設(shè)計的模式和原則,我們可以使用TerminusCMS。雖然其中許多想法也適用于其他領(lǐng)域。

文檔(Documents)

在知識圖譜TerminusDB中,數(shù)據(jù)被視為由具有特定數(shù)據(jù)類型的字段組成的基本單元,這些字段可以是字符串、整數(shù)或日期等類型。這些基本單元會被組織成一個數(shù)據(jù)集合,稱為“文檔”。

舉個例子,我們可以看看“Person”文檔,以更好地理解這個概念。

{ "@type" : "Class",
"@id" : "Person",
"first_name" : "xsd:string",
"family_name" : "xsd:string",
"date_of_birth" : "xsd:dateTime"
}

這個人的信息包括姓名和出生日期,類似于關(guān)系型數(shù)據(jù)庫(RDBMS)或逗號分隔值(CSV)文件中的行記錄。為了讓數(shù)據(jù)更加豐富,可以添加一些額外的鏈接。

{ "@type" : "Class",
"@id" : "Person",
"first_name" : "xsd:string",
"family_name" : "xsd:string",
"date_of_birth" : "xsd:dateTime",
"friends" : { "@type" : "Set", "@class" : "Person" }
}

在知識圖譜中,我們可以將人與他們的朋友之間建立鏈接。這種數(shù)據(jù)結(jié)構(gòu)非常適合用于社交網(wǎng)絡(luò)或聯(lián)系人管理應(yīng)用程序。我們可以將每個人視為一個文檔,其中包含許多數(shù)據(jù)屬性,例如姓名和出生日期。此外,我們可以在文檔中添加指向其他文檔的鏈接,以建立人與他們的朋友之間的聯(lián)系。這種建模方式非常簡單和靈活,讓我們能夠方便地捆綁所有的數(shù)據(jù)屬性和鏈接在一起。

子文檔(Subdocuments)

有時,您需要在文檔中包含一個內(nèi)部結(jié)構(gòu),這個結(jié)構(gòu)不僅僅是一個數(shù)據(jù)原子,而是與該對象有緊密聯(lián)系,而不只是指向另一個對象的鏈接。這種類型的對象最常見的變體是注釋了一些附加結(jié)構(gòu)的數(shù)據(jù)。例如,我們可能希望在某個時間范圍內(nèi)得到數(shù)據(jù)點,該數(shù)據(jù)點具有特定的來源或可能有一個單位。

{ "@type" : "Enum",
"@id" : "Unit",
"@value" : [ "meters", "kilograms" ] }

{ "@type" : "Class",
"@id" : "UnitValue",
"@subdocument" : [],
"value" : "xsd:decimal",
"unit" : "Unit" }

有時候一個數(shù)據(jù)原子的值本身并沒有意義,但是在特定對象的上下文中卻很有用,例如人的身高。為了表達這種內(nèi)在聯(lián)系,我們可以使用子文檔,它可以將數(shù)據(jù)與額外的結(jié)構(gòu)注釋關(guān)聯(lián)起來。使用"@subdocument" : []指定一個子文檔類,這個子文檔將完全屬于包含類,不允許其他人對其進行引用,并且當(dāng)我們搜索包含文檔時,它將始終以完全擴展的 JSON 文檔返回。

{ "@type" : "Class",
"@id" : "Person",
"first_name" : "xsd:string",
"family_name" : "xsd:string",
"date_of_birth" : "xsd:dateTime",
"friends" : { "@type" : "Set", "@class" : "Person" }
"height" : "UnitValue",
"weight" : "UnitValue",
}

您可能已經(jīng)發(fā)現(xiàn),“height”和“weight”都被表示為“UnitValue”,但是可能沒有使用正確的單位。為了確保單位的正確性,我們正在加入一些限制。

關(guān)系(Relationships)

并非所有關(guān)系都可以簡化為一個簡單的鏈接。xsd:decimal是表示數(shù)字的一種數(shù)據(jù)類型,然而,對于復(fù)雜的關(guān)系,通??梢允褂米游臋n來表示它們,就像我們使用單位裝飾基本類型以添加輔助信息一樣。如果您有一個復(fù)雜的關(guān)系,將其升級為一級對象通常是有意義的。例如,假設(shè)我們要表示股權(quán)關(guān)系,我們可以使用子文檔來描述持股人、股票數(shù)量、股份轉(zhuǎn)讓條款等詳細(xì)信息。

{ "@type" : "Class",
"@id" : "Company",
"name" : "xsd:string" }
{ "@type" : "Class",
"@id" : "Shareholder",
"name" : "xsd:string" }
{ "@type" : "Class",
"@id" : "Company",
"@inherits" : "Shareholder" }
{ "@type" : "Class",
"@id" : "Person",
"@inherits" : "Shareholder" }
{ "@type" : "Class",
"@id" : "Shareholding",
"quantity" : "xsd:decimal",
"shares_in" : "Company",
"held_by" : "Shareholder",
"from" : "xsd:date",
"to" : { "@type" : "Optional", "@class" : "xsd:date" }}

我們的Shareholding關(guān)系包含兩個不同的角色:持股公司和股東,他們可以是個人或公司。此外,我們還添加了關(guān)于這個關(guān)系的兩個附加信息:持股數(shù)量和持有時間。這種一流關(guān)系鏈接的方法可以擴展到處理超圖,即涉及兩個或更多對象的關(guān)系(例如接管)。

混合(Mixins):面向方面編程的多重繼承

在編程語言中,多重繼承是一種有效的工具,但在數(shù)據(jù)處理中,它更加實用。混合是數(shù)據(jù)建模中可重復(fù)使用的一種方法,可以用來解決一些通用問題,例如空間、時間、來源和單位等。在我的建模經(jīng)驗中,我發(fā)現(xiàn)這些通用問題在數(shù)據(jù)建模中屢次出現(xiàn),它們是跨多個領(lǐng)域的共同問題。

時域范圍(Temporal Scope)

上面的例子Shareholding使用了時間組件,但該組件也可作為mixin(混入)在其他地方重用。mixin是一種可組合的代碼單元,可在不同類或?qū)ο笾羞M行重復(fù)利用,以實現(xiàn)更高的代碼復(fù)用性和靈活性。因此,將時間組件提取為mixin可以在其他數(shù)據(jù)建模中方便地進行復(fù)用,提高建模效率和代碼質(zhì)量。

{ "@type" : "Class",
"@id" : "TemporalScope"
"from" : "xsd:date",
"to" : { "@type" : "Optional", "@class" : "xsd:date" }
}

在數(shù)據(jù)建模中,時間范圍的起始日期(from)是必須要有的,因為它描述了一些事情的開始時間。但是,結(jié)束日期(to)是可選的,這樣可以建模尚未結(jié)束的時間范圍。當(dāng)然,并不總是需要這樣做,但通常這是一種非常有用的方法。

此外,我們可能還需要建模只發(fā)生一次的事件,即在某個特定時刻發(fā)生且不再重復(fù)發(fā)生的事件,例如一個人的生日或一場比賽的開始時間。

{ "@type" : "Class",
"@id" : "Event"
"at" : "xsd:date"
}

空間范圍(spatial scope)

在知識圖譜中,我們可以利用幾何形狀為對象添加空間范圍,這可以通過繼承來實現(xiàn)。我們可以將不同的幾何形狀組合在一起來表示空間范圍,例如矩形、圓形或多邊形。這種方法使我們能夠描述一個實體或概念在地理上的位置或空間范圍。

{ "@type" : "Class",
"@id" : "GeographicScope",
"geometry" : "Geometry" }

在這個上下文中,“Geometry”所指的是GeoJson中的一個類,具體指的是“Geometry類”。

溯源(Provenance)

為了更好地了解某些信息,通常需要記錄相關(guān)資源的來源。例如,當(dāng)我們從網(wǎng)站等途徑獲取資源時,這種記錄就很常見。在這種情況下,我們可能需要創(chuàng)建一個繼承Event和Source類的對象來記錄這些信息。

{ "@type" : "Class",
"@id" : "Source",
"source" : "xsd:anyURI"
}
{ "@type" : "Class",
"@id" : "WebScrape",
"@inherits" : ["Event", "Source"],
"page" : "xsd:string",
}

集合體(Collections)

在知識圖譜中,有許多不同的方式可以對集合進行建模。TerminusDB 實現(xiàn)了三種不同的方法,旨在嘗試簡化建模過程,這三種方法是:Set、List和Array。了解這三種方法之間的差異非常重要:Set表示集合,List表示列表,而Array則表示數(shù)組。

集合(Set)

Set是三種集合模型中最簡單的一種,因為它沒有順序,實際上只是一條邊,可以包含多個元素。在圖中,具有三個元素的Set集合可以表示為以下形式:

數(shù)組(Array)

Array是一個更復(fù)雜的對象,它通過索引來對元素進行編碼,并且可以根據(jù)位置來訪問它們。與Sets和Lists不同,Array具有固定的大小,其元素是有序的。此外,Array還提供了一些額外的功能,使其與Sets和Lists區(qū)別開來。

數(shù)組中的每個值元素都有一個附加的(隱藏)間接對象,帶有索引(或多維數(shù)組的多個索引)。這使得我們不僅可以有順序,還可以有多個維度來表示“間隔”。當(dāng)返回 JSON 中的值時,我們將返回一個多維數(shù)組,其中包含未填充區(qū)域的null字段。但實際上,這些未填充區(qū)域并沒有在數(shù)據(jù)庫中出現(xiàn)。

列表(List)

List 是直接從 RDF 數(shù)據(jù)中提取 rdf:List 并使用 rdf:first 和 rdf:rest 字段來表示。三個元素的列表結(jié)構(gòu)如下所示:

° → ° rest→ ° rest→ ° rest→ rdf:nil
↓ first ↓ first ↓ first
v0 v1 v2

鏈表式結(jié)構(gòu)具有潛在的技術(shù)優(yōu)勢。相較于數(shù)組,您可以在列表中的任何位置插入新元素,而不必在給定元素之后重新索引所有內(nèi)容。但是,鏈表式結(jié)構(gòu)需要遍歷圖中的長鏈來解碼列表,這可能會對性能產(chǎn)生影響。在列表非常長時,它可能會導(dǎo)致解碼時間顯著延長,因此需要權(quán)衡其優(yōu)缺點來選擇適合特定場景的數(shù)據(jù)結(jié)構(gòu)。

結(jié)論

通過使用知識圖譜,可以實現(xiàn)更加輕松地操作和發(fā)現(xiàn)數(shù)據(jù)。知識圖譜是一個基于圖形結(jié)構(gòu)的數(shù)據(jù)模型,可以將各種實體和概念以及它們之間的關(guān)系表示為節(jié)點和邊,使得數(shù)據(jù)之間的關(guān)系和結(jié)構(gòu)更加清晰和易于理解。在使用知識圖譜進行數(shù)據(jù)建模后,用戶可以方便地進行數(shù)據(jù)操作和發(fā)現(xiàn),從而更加高效地利用數(shù)據(jù)。


當(dāng)前文章:模式設(shè)計和原則在知識圖譜中的應(yīng)用
URL標(biāo)題:http://www.dlmjj.cn/article/dpiecdp.html