DOCS

非結構化數據的定義(Unstructured Data)為何?

最後更新於: October 21, 2023

非結構化數據是什麼?

非結構化數據所指的是沒有結構的數據,像是文字、圖片、影片、音訊等。這一類型的數據並非一種行列式表格、沒有一種固定的規則與模式、沒有結構,故此也無法儲存於關聯式資料庫(Relationsal Database),不同於結構化數據

非結構化數據在過去是幾乎無法有效地被電腦利用或分析。那當然,這邊所說的是「過去」以及「幾乎無法」,這主要原因就是因為現在隨著機器學習、以及基於神經網路的深度學習演算法的相關模型不斷成熟,還有支撐這些模型學習的基礎建設(CPU、GPU、FPGA、ASIC,以及記憶體技術、儲存技術、以及網路技術等的發展)不斷地發展,現在非結構化數據的分析也逐漸地走進主流。

而為什麼說是過去幾乎無法有效地被電腦裡用與分析的原因是,其實要落實非結構化數據的分析並非不可能,譬如在所有寄給客服的信件中設定邏輯,如果其中出現「不滿」、「失望」、「體驗差」等類型的關鍵字,即將這一信件歸類至需要主管了解狀況的類別。

又或著是在處理音訊、圖像、以及其他類型的文字時,普遍工程師使用的手段都是以邏輯、公式、判斷等方法來落實分析,譬如在處理圖像時,假設我們要判斷出圖像中是否有人,就是分析圖像檔案中的一些規則,是否有圈圈、圈圈上方是否有黑色、圈圈下方是否有類似脖子形狀的東西等手段,來做判斷,不過這一類型的分析準確度極低,故此對於絕大多數企業來說也不實用。

是一直到運算速度大幅提高,且成本降低之後,所謂的機器學習,也就是不斷地去通過經驗來訓練機器成長的人工智慧模式,才逐漸的讓非結構化數據的分析走進主流。

參考資料
作者:專案小組

我們的專案小組結合了內部團隊、外部專家、合作夥伴,並協助客戶探勘市場機會、落實市場進入與成長。

Connect With Authors
*Your message will be sent straight to the team/individual responsible for the article.