在解決許多實務上的問題時,乾淨又標記完整的數據並非如此容易取得,而研究團隊時常問出自己也不知答案方向的問題,也就是說,當不知如何分類數據,或是需要演算法去尋找同樣模式時,無監督式學習將可以提供很大的幫助。
非監督式學習接收未被標記的數據,並通過演算法根據常見的模式、特色、或是其他因素將數據分類。例如,可能團隊手上有一大組的小狗圖片,然而這些圖片都沒有標記出各個小狗是什麼種類,這時,團隊即可帶入無監督式學習的演算法來做分類,輸出則是演算法根據不同特色的小狗所做的分類。
其他常見的實務案例包括,顧客旅程分析(利用消費者在網頁上的顧顧客旅程做行為分析,並以此歸納出不同購買模式的消費者)、或是尋找異常值(銀行透過信用卡使用紀錄來判斷是否某筆交易為詐欺)。
將數據分成不同的群組當中(k個群組),而演算法會自動將具備像似特性的數據歸類為一組。在數據的維度相似、且是連續性的數值時,k-means會是非常合適的選擇。
混合模型是一個可用來表示總體分佈中含有k個子分布的概率模型。也就是說,混合模型表示了數據在總體中的概率分佈,是個由k個子分佈所組成的混合分佈。 可以把它想成是k-menas的一般化,但在cluster的形狀以及大小中有更多的自由度。
將資料在一個階層式的樹狀上,反覆的利用拆分以及聚合的方式建立出一個分類系統。階層式分群的優勢在於它使用上的簡單性以及能夠在小數據上操作,然而卻非常難處理大型的資料。
OOSGA是一家專注於為工業客戶提供東南亞供應鏈拓展、設廠評估,以及市場情資的顧問公司。我們致力於為客戶企業提供最可靠的市場情報和洞見,並與當地工業不動產開發商,以及相關合作夥伴一同推進當地業務的落地。
倘若您對於進入新市場、抑或是對拓展業務有想法,歡迎隨時聯繫我們團隊討論。