非監督式學習(Unsupervised Learning)的定義為何?

最後更新於:September 10, 2022

定義

非監督式學習為何?

在解決許多實務上的問題時,乾淨又標記完整的數據並非如此容易取得,而研究團隊時常問出自己也不知答案方向的問題,也就是說,當不知如何分類數據,或是需要演算法去尋找同樣模式時,無監督式學習將可以提供很大的幫助。

非監督式學習接收未被標記的數據,並通過演算法根據常見的模式、特色、或是其他因素將數據分類。例如,可能團隊手上有一大組的小狗圖片,然而這些圖片都沒有標記出各個小狗是什麼種類,這時,團隊即可帶入無監督式學習的演算法來做分類,輸出則是演算法根據不同特色的小狗所做的分類。

其他常見的實務案例包括,顧客旅程分析(利用消費者在網頁上的顧顧客旅程做行為分析,並以此歸納出不同購買模式的消費者)、或是尋找異常值(銀行透過信用卡使用紀錄來判斷是否某筆交易為詐欺)。

常見的演算法及其商業應用

集群分析​​(K-means Clustering​​)

將數據分成不同的群組當中(k個群組),而演算法會自動將具備像似特性的數據歸類為一組。在數據的維度相似、且是連續性的數值時,k-means會是非常合適的選擇。

  • 分類消費者以優化行銷活動或是避免客戶流失
  • 判斷信用交易、保險金融等活動是否異常(詐欺)
  • 幫助歸類IT技術建設內不同的警訊

混合模型​​(Gaussian Mixture Model​​)

混合模型是一個可用來表示總體分佈中含有k個子分布的概率模型。也就是說,混合模型表示了數據在總體中的概率分佈,是個由k個子分佈所組成的混合分佈。 可以把它想成是k-menas的一般化,但在cluster的形狀以及大小中有更多的自由度。

  • 從語音數據中做特徵提取
  • 在影片檔案中,做多種物件的追蹤
  • 利用更不明顯的數據特徵,以區別客群,優化行銷活動

階層式分群​​(Hierarchical Clustering​​)

將資料在一個階層式的樹狀上,反覆的利用拆分以及聚合的方式建立出一個分類系統。階層式分群的優勢在於它使用上的簡單性以及能夠在小數據上操作,然而卻非常難處理大型的資料。

  • 更細微的區分客群或用戶
  • 通過社群媒體分析來判斷產品使用程度
AI

About DOC

我們團隊追蹤各國經濟、政策、貿易,以及7個主要產業的變化與發展,支撐相關產業的大中華企業,在全球供應鏈中部署策略。而DOC系列的文章則是我們團隊所撰寫,盼能支撐所有夥伴可以有結構性的理解相關議題的重點與概念詮釋。

數據生態小組

我們的數據生態系統小組,從數據獲取、架構、治理、應用等面向,支撐客戶清晰各國規範之限制,以及應用面向的發展與研究。

了解服務
More From Us
More Glossary Terms