DOCS

知識圖譜(Knowledge Graph)的定義為何?

最後更新於: October 21, 2023

知識圖譜是什麼?

Knowledge Graph,中文譯為知識圖譜,象徵著一個由不同實體所串聯在一起的網路,為一種機器可讀的資料結構。

整個知識圖譜主要由兩個元素所組成,一為實體(Entity),在圖普上以一個節點(Node)象徵,代表的是任何形式的個體,譬如人、企業、年份、或是一種概念。譬如像是口罩、衛生、2019、病毒,都可以為一個節點/實體。

另一個元素則是邊(Edge),在圖譜上以一條線去串聯兩個不同的節點,象徵著的是這兩者之間的關係。

相對於一般的表格式的資料庫來說,知識圖譜以更為直覺的方式代表著一個實體背後的涵義與相關概念,Google的搜尋引擎也是以同樣的技術去區分使用者在搜尋詞彙時的真正的意圖。

而不只是Google,亞馬遜也是以知識圖譜的方式管理其產品、音樂、Prime影片、以及Alexa的問答資料庫;同樣的應用也可以在許多處理複雜的資料庫的產品與解決方案中看到,像是Facebook在管理用戶的檔案、Uber管理司機與乘客,其他像是Spotify與Netflix也都有專門的知識圖譜團隊落實整個機制的建立與維護。

 

科技Snapshot

知識圖譜的潛在價值為何?

出於KG(Knowledge Graph)本身能夠很直覺的將不同來源的資料以關係式的方法結構化,當前知識圖譜的主要應用聚焦在Metadata或是Taxonomy這一類中的數據管理模式上,不過僅是這一特性,就能夠支撐整個組織在分享、搜尋、以及分析等活動的落實,並且孕育出無數個種應用。

在零售業中,知識圖譜可以應用在產品的資料庫當中,並以此為基準,去做相關產品在電商平台上的推薦機制。

在金融業中,KG也能將來自KYC、Due Diligence、投資評估、受保物件或受保人等數據中,以知識圖譜的方式儲存,並且在各種不同的使用案例中應用,最為常見的應用案例包含風險評估、法遵、異常行為偵測、投資組合商品推薦機制等。

驅動因素有哪些?

KG在近年來得到了非常多的討論,不過是否知識圖譜能夠進一步的普及成為許多資料庫的基礎,去支撐運營、機器學習、以及其他IT需求,將取決於以下的幾種動因要素:

  • KG在既有基礎上的突破,抑或是新的KG架構將會進一步優化該技術的指標,譬如像是速度、可依賴性、公式化、規模化等等。 譬如這兩年比較受討論的EEA, Embedding-based Entity Alignment 就因為其在速度上的突破而受到許多關注,雖然在與其他第三方資訊的串接上仍然有規模化的問題。
  • 隨著技術逐漸穩定,再加上全球各個領域都因為IoT等技術的蓬勃發展,而需要處理越來越複雜、且量越來越大的數據,在這樣的一個趨勢之下,KG這種直覺性且有非常好的可規模化的基礎的資料結構,也在各個領域受到關注與研究,甚至是領先企業的導入。
  • 基於機器學習等領域在處理非結構化數據的需求, 知識圖譜也提供了卓越的優勢在這一領域上,支撐機構處理文件、圖像、以及影像等數據類型,以及這當中之間的關聯性。
  • Web3技術的採納也進一步的讓去中心化的資料庫受到關注,而這進一步的驅動了去中心化的知識圖譜(DKG, Decentralized Knowledge Graph)的發展。

阻礙有哪些?

  • 雖然知識圖譜承載著許多商業價值,不過對於絕大多數的企業來說,相對於既有的資料庫管理方式其所提供的額外價值並不大,故此也讓這項技術雖然逐漸的被技術單位意識,但仍然無法在短期普及。
  • 相對於已經在IT領域上有數十年的歷史的關聯式資料庫,知識圖譜在IT領域上不到五年的發展使其仍有各個面向尚不成熟,企業不僅需要從頭到尾的去建立起系統整合的模組以支援各個不同IT系統的相容,其在架構、治理、以及維護上都需要相關的IT技術,故此對於大多數企業來說是一個極大的限制因素。

 

參考資料
作者:專案小組

我們的專案小組結合了內部團隊、外部專家、合作夥伴,並協助客戶探勘市場機會、落實市場進入與成長。

Connect With Authors
*Your message will be sent straight to the team/individual responsible for the article.