非結構化數據的定義(Unstructured Data)為何?

最後更新於:October 17, 2022

定義

非結構化數據是什麼?

非結構化數據所指的是沒有結構的數據,像是文字、圖片、影片、音訊等。這一類型的數據並非一種行列式表格、沒有一種固定的規則與模式、沒有結構,故此也無法儲存於關聯式資料庫(Relationsal Database),不同於結構化數據

非結構化數據在過去是幾乎無法有效地被電腦利用或分析。那當然,這邊所說的是「過去」以及「幾乎無法」,這主要原因就是因為現在隨著機器學習、以及基於神經網路的深度學習演算法的相關模型不斷成熟,還有支撐這些模型學習的基礎建設(CPU、GPU、FPGA、ASIC,以及記憶體技術、儲存技術、以及網路技術等的發展)不斷地發展,現在非結構化數據的分析也逐漸地走進主流。

而為什麼說是過去幾乎無法有效地被電腦裡用與分析的原因是,其實要落實非結構化數據的分析並非不可能,譬如在所有寄給客服的信件中設定邏輯,如果其中出現「不滿」、「失望」、「體驗差」等類型的關鍵字,即將這一信件歸類至需要主管了解狀況的類別。

又或著是在處理音訊、圖像、以及其他類型的文字時,普遍工程師使用的手段都是以邏輯、公式、判斷等方法來落實分析,譬如在處理圖像時,假設我們要判斷出圖像中是否有人,就是分析圖像檔案中的一些規則,是否有圈圈、圈圈上方是否有黑色、圈圈下方是否有類似脖子形狀的東西等手段,來做判斷,不過這一類型的分析準確度極低,故此對於絕大多數企業來說也不實用。

是一直到運算速度大幅提高,且成本降低之後,所謂的機器學習,也就是不斷地去通過經驗來訓練機器成長的人工智慧模式,才逐漸的讓非結構化數據的分析走進主流。

About DOC

我們團隊追蹤各國經濟、政策、貿易,以及7個主要產業的變化與發展,支撐相關產業的大中華企業,在全球供應鏈中部署策略。而DOC系列的文章則是我們團隊所撰寫,盼能支撐所有夥伴可以有結構性的理解相關議題的重點與概念詮釋。

數據生態小組

我們的數據生態系統小組,從數據獲取、架構、治理、應用等面向,支撐客戶清晰各國規範之限制,以及應用面向的發展與研究。

More From Us
各國科技發展追蹤
我們針對60+個國家的科技發展進行追蹤,領域包含人工智慧、運算技術、虛擬與延展實境、宇航、生命科學、以及再生能源。
More Glossary Terms
生成式AI
LPWAN
LoRa
知識圖譜
電腦視覺
結構化數據
開放API
屬性存取控制

聯繫數據生態小組

Your Name
Email *
Your Message