非監督式學習(Unsupervised Learning)的定義為何?

最後更新於:September 10, 2022

歡迎來到OOSGA官網!我們團隊從幫客戶落實市場進入的實地經驗,以及合作機構的產業調研中彙整了來自各國人口統計、經貿、政策、經商、以及產業的資訊,並免費提供給業者,盼能讓更多朋友了解其他市場的發展,並且讓商業可以真正的無國界。
定義

非監督式學習為何?

在解決許多實務上的問題時,乾淨又標記完整的數據並非如此容易取得,而研究團隊時常問出自己也不知答案方向的問題,也就是說,當不知如何分類數據,或是需要演算法去尋找同樣模式時,無監督式學習將可以提供很大的幫助。

非監督式學習接收未被標記的數據,並通過演算法根據常見的模式、特色、或是其他因素將數據分類。例如,可能團隊手上有一大組的小狗圖片,然而這些圖片都沒有標記出各個小狗是什麼種類,這時,團隊即可帶入無監督式學習的演算法來做分類,輸出則是演算法根據不同特色的小狗所做的分類。

其他常見的實務案例包括,顧客旅程分析(利用消費者在網頁上的顧顧客旅程做行為分析,並以此歸納出不同購買模式的消費者)、或是尋找異常值(銀行透過信用卡使用紀錄來判斷是否某筆交易為詐欺)。

常見的演算法及其商業應用

集群分析​​(K-means Clustering​​)

將數據分成不同的群組當中(k個群組),而演算法會自動將具備像似特性的數據歸類為一組。在數據的維度相似、且是連續性的數值時,k-means會是非常合適的選擇。

  • 分類消費者以優化行銷活動或是避免客戶流失
  • 判斷信用交易、保險金融等活動是否異常(詐欺)
  • 幫助歸類IT技術建設內不同的警訊

混合模型​​(Gaussian Mixture Model​​)

混合模型是一個可用來表示總體分佈中含有k個子分布的概率模型。也就是說,混合模型表示了數據在總體中的概率分佈,是個由k個子分佈所組成的混合分佈。 可以把它想成是k-menas的一般化,但在cluster的形狀以及大小中有更多的自由度。

  • 從語音數據中做特徵提取
  • 在影片檔案中,做多種物件的追蹤
  • 利用更不明顯的數據特徵,以區別客群,優化行銷活動

階層式分群​​(Hierarchical Clustering​​)

將資料在一個階層式的樹狀上,反覆的利用拆分以及聚合的方式建立出一個分類系統。階層式分群的優勢在於它使用上的簡單性以及能夠在小數據上操作,然而卻非常難處理大型的資料。

  • 更細微的區分客群或用戶
  • 通過社群媒體分析來判斷產品使用程度
AI
Table of Contents
數據生態小組

我們的數據生態系統小組,從數據獲取、架構、治理、應用等面向,支撐客戶清晰各國規範之限制,以及應用面向的發展與研究。

More From Us
生成式AI
LoRa
知識圖譜
電腦視覺
開放API
屬性存取控制
角色存取控制
強制存取控制
Connect With Authors
*Your message will be sent straight to the team/individual responsible for the article.
Consider Subscribing
我們團隊定期定期提供訂閱者在主要國家中,市場面向、消費者面向、以及在政策與科技的大趨勢中所孕育出來的機會與洞見。歡迎參考我們團隊近期的訂閱信件內容