非結構化數據的定義(Unstructured Data)為何?

最後更新於:October 17, 2022

歡迎來到OOSGA官網!我們團隊從幫客戶落實市場進入的實地經驗,以及合作機構的產業調研中彙整了來自各國人口統計、經貿、政策、經商、以及產業的資訊,並免費提供給業者,盼能讓更多朋友了解其他市場的發展,並且讓商業可以真正的無國界。
定義

非結構化數據是什麼?

非結構化數據所指的是沒有結構的數據,像是文字、圖片、影片、音訊等。這一類型的數據並非一種行列式表格、沒有一種固定的規則與模式、沒有結構,故此也無法儲存於關聯式資料庫(Relationsal Database),不同於結構化數據

非結構化數據在過去是幾乎無法有效地被電腦利用或分析。那當然,這邊所說的是「過去」以及「幾乎無法」,這主要原因就是因為現在隨著機器學習、以及基於神經網路的深度學習演算法的相關模型不斷成熟,還有支撐這些模型學習的基礎建設(CPU、GPU、FPGA、ASIC,以及記憶體技術、儲存技術、以及網路技術等的發展)不斷地發展,現在非結構化數據的分析也逐漸地走進主流。

而為什麼說是過去幾乎無法有效地被電腦裡用與分析的原因是,其實要落實非結構化數據的分析並非不可能,譬如在所有寄給客服的信件中設定邏輯,如果其中出現「不滿」、「失望」、「體驗差」等類型的關鍵字,即將這一信件歸類至需要主管了解狀況的類別。

又或著是在處理音訊、圖像、以及其他類型的文字時,普遍工程師使用的手段都是以邏輯、公式、判斷等方法來落實分析,譬如在處理圖像時,假設我們要判斷出圖像中是否有人,就是分析圖像檔案中的一些規則,是否有圈圈、圈圈上方是否有黑色、圈圈下方是否有類似脖子形狀的東西等手段,來做判斷,不過這一類型的分析準確度極低,故此對於絕大多數企業來說也不實用。

是一直到運算速度大幅提高,且成本降低之後,所謂的機器學習,也就是不斷地去通過經驗來訓練機器成長的人工智慧模式,才逐漸的讓非結構化數據的分析走進主流。

Table of Contents
數據生態小組

我們的數據生態系統小組,從數據獲取、架構、治理、應用等面向,支撐客戶清晰各國規範之限制,以及應用面向的發展與研究。

More From Us
人口高齡化
都市化
淨遷移
人口結構
數位行銷
生成式AI
LPWAN
LoRa
Connect With Authors
*Your message will be sent straight to the team/individual responsible for the article.

歡迎訂閱

歡迎訂閱我們在不同市場的機會見解,可以先參考我們近期發送的信件,也希望您可以積極地分享回饋給我們團隊!