人工智慧 Artificial Intelligence

AI科技發展現況、技術解析、發展前景

主管摘要

人工智慧為何在近年得到龐大的關注與投資?

在過去的十年間,AI可以說是最受關注的科技發展,隨著運算速度的提升與成本的降低,人工智慧科技從研究階段走入了各個產業的發展當中,不論是學術機構、國際企業、還是來自各個領域的新創都在思考著如何將其落實至商業環境中,並以此創造龐大價值。

在這樣的一個趨勢之下,AI在2021年從併購、創投、以及IPO等媒介中獲得的投資總額就高達1765億美金。從中國、日本、美國、歐盟等主要市場中就有超過上萬家AI企業獲得投資,而大企業的動向更是頻繁,在電腦視覺、自動化、自然語言、以及決策支撐等領域投資大筆資金,盼能成為產業的領袖。

人工智慧2013-2021投資狀況

我們在這一份報告中,統合了AI技術在各個領域的應用現況、科技發展趨勢、所遇到的困難、以及在不同產業當中的應用實例,盼能支撐許多關注該技術的客戶會員能夠更好的掌握人工智慧的發展。

Table of Contents
概述

了解人工智慧

AI所指的即是通過程式的方式來做到人類需要應用到智慧才能夠完成的事情。

那AI發展的技術面向有許多,但整體來說,其就是通過讓工程師/數據科學家,不斷地以模擬的方式訓練模型,來讓其能通過經驗中學習。

所以不同於傳統的程式,傳統的程式是用一系列的指令以及規範來讓整個程式運作,例如一個計算機,他的Input如數字、以及加減乘除等的運算子,都是被規範好的,而這導致這個程式無法處理沒有被定義的新變數。所以若我們想要此程式處理其他問題,工程師就必須更新指令以處理新的變數。

生成式AI
生成式AI所指的是通過讓機器學習模型研究歷史數據...
知識圖譜
Knowledge Graph,中文譯為知識圖譜,象徵著一個由...
科技現況

人工智慧的發展孕育出哪些技術?

從人工通用智慧(AGI)、神經形態運算(Neuromorphic Computing)、與知識圖譜(Knowledge Graph)這一類仍然處在研究開發階段的技術,一直到像是自然語言處理、電腦視覺、以及機器學習等已經普及的概念與技術。AI不僅是一個正在被積極研究的領域,其許多發展領域更是逐漸的被導入到實際應用場域中,並且在各個產業中普及。

然而在這一龐大且複雜的AI技術產業中,各個技術都被許多國際機構評估為乘載著龐大潛能,然而同樣的,這些技術卻也有面臨像是科技整備程度不足、政府規範尚未確立、市場接受度、以及許多商業應用範疇等領域需要解決。

譬如以科技整備程度來說,自然語言處理(NLP)雖然因為Transformer技術的成熟而在自然語言理解、自然語言生成等領域出現了許多前沿的應用,但其中的技術仍然處於非常原始的階段,難以處理人類語言當中的許多邊緣案例,更不用說許多使用者較少的語言。

而以政府規範來說,像是負責任的AI,或是AI信任、AI TRiSM等領域的發展,更是沒有一個明確的機制與管理手段,去落實追蹤AI的道德是否在整個開發、使用、回饋週期有被落實導入。

人工智慧科技發展趨勢圖
1

電腦視覺

電腦視覺是一種通過不同技術的手段去賦能機器去處理、分析真實世界的圖像、影像,並將其轉換為機器自己能夠理解的技術。

例:監視器通過電腦視覺技術判斷來訪人員是否要做出異常行為。

潛在價值為何?

電腦視覺在幾乎每一個產業中都承載著龐大的價值,譬如在健康醫療產業中,CV(Computer Vision)就能夠通過X光、超音波圖等方式,分析出病人潛在的健康狀況,其準確度在許多領域更是超過醫生平均能做出的判斷。

在運輸產業中,CV能夠有效分析出當前交通狀況,並且在一定程度上支持駕駛決策,而如此技術也是自動駕駛的基石,也就是成為汽車的眼睛。同樣也在運輸產業中,CV更是能從衛星的角度落實追蹤城市裡每一個變化,並且根據當前的交通狀況,提供城市運營者相關建議,以有效疏通交通顛峰期間的阻塞狀況。

在零售產業中,以行銷與銷售為例,CV更是可以分析前往實體店面的客戶,當前的情緒為何,並以此回饋至整個顧客旅程與客戶體驗中,以優化未來的運營。

有哪些驅動因素?

在科技面向,電腦視覺隨著機器學習技術的突破、GPU運算能力增長與相應的成本降低、再加上許多數據技巧(數據生成、數據強化等),電腦視覺的技術就會更加成熟。

  • 新的神經元網路架構、演算法、以及模式的效能正在不斷地提高,其研發、運算、以及相關的每單元成本也在相應的降低,驅動電腦視覺技術成熟。譬如孕育出BERT、GPT-3等NLP語言模型的Transformer,也在這幾年走進了電腦視覺中,像是Google開源的Vision Transformer就是一個案例,而這一類型的新硬體架構以及其他層面的提升,正在引領整個電腦視覺發展。
  • GPU運算能力在過去的五年成長了將近9倍,而新的硬體結構也大幅的提高了運算AI訓練需求的能力,譬如2022年3月,NVIDEA發佈的HOPPER,就是著重在Transformer類型的AI訓練,其產品H100相對於2020年的A100更是出現六倍的增幅。

從資源與基礎建設面向,開源工具、教育資源、以及其他的整體基建整備程度的普及與成熟,也進一步的讓電腦視覺在數據的獲取、架構、治理、以及訓練上更佳有效。

  • IoT裝置的普及,讓各個領域中的圖像與影像數據出現指數型的成長,而這樣的數據成長也進一步的讓研究與開發人員獲大量且高品質的數據。
  • 運算資源以及服務的普及、運算成本的持續降低、再加上圍繞在邊緣運算的資源與工具的發展,也進一步的驅動了整個在邊緣落實電腦視覺的科技發展。
    聚焦在不同領域與應用範疇的服務與解決方案正在不斷的被推出,而其中不乏有許多開源碼工具支撐各個產業的電腦視覺應用。

有哪些阻礙?

雖然電腦視覺這一項技術,是整個人工智慧當中,科技整備僅次於已然普及的機器學習的科技應用,但是其依然存在在許多科技要素,不論是科技整備還是其他要素。

  • 在一些應用場景中,電腦視覺在一定程度上會遭遇個資安全與一些消費者隱私權的問題,進而導致相關技術的採納受限。譬如歐盟的個資保護法GDPR就時常被批評阻礙人工智慧的許多創新應用。是否能夠跨越這一段阻礙的重點就在於個資法是否會因此做一定程度的調整。
  • 再者,還有電腦視覺雖然已經走入主流應用,但是仍然對於許多企業來說,缺乏充分的ROI潛能,抑或是尚無法容易的轉換CV投資為充分的價值回饋,故也限制了其進一步普及市場的潛能。
  • 再者,系統整合仍然是一個挑戰,出於缺乏開放架構讓其能有效地讓電腦視覺整合至既有系統中,同時現在雖然越來越多的技術提供商推出自研的解決方案,但是對於各種不同的應用場景與邊緣案例來說,仍然相對較不完善,故此普及率不高。
  • 再者,雖然ImageNet、CIFAR-10等開放的數據庫都提供著龐大的背景資源,但是對於中型與小型企業,也就是無法投資相當成本去擴充個別資源的組織來說,其仍尚不充分。

2

自然語言處理

自然語言處理(Natural language processing)是一種透過複雜的數學模型及演算法來讓機器去認知、理解並運用我們的語言的技術。機器翻譯就是 NLP 應用的一種,我們將需要被翻譯的文本輸入進所謂的 NLP 系統,而背後的演算法以及模型就會處理辨識、理解、以及生成等流程,最後再輸出被翻譯好的目標語言資訊。

整個NLP的領域中,我們可以細分為自然語言理解(NLU, Natural Language Understanding)與自然語言生成(NLG, Natural Language Generation)。常見的NLU應用就包含情緒分析、文件識別與歸類自動化、自動推理(Automated Reasoning);常見的NLG應用包含自動文案生成、專業文件生成(通常適用於制式化程度較高的文件範疇)、聊天機器人的回覆等。

潛在價值為何?

基於文字是我們現在世界在溝通上最為主要的渠道,故此NLP乘載著潛能不論是在自動化許多勞力以降低相關營運成本,抑或是在支撐客戶互動等領域的應用以提高客戶體驗,NLP都承載著龐大的潛能。

許多已經走進主流的應用包含:任何產業中的在處理文字上的流程自動化,譬如像是律師在處理龐大的過往紀錄時,在一些應用場景中,就不需要人工的去稽查每一份檔案,而是可以讓電腦自行在不同的文件中找到關係。

抑或是在客戶服務領域中,分析每天上千上萬筆的來信資料,並自動的去判斷應該轉寄至哪一個部門去負責相關業務;甚至是通過Chatbot來自動化與客戶的互動過程。

在金融業中,NLP更是應用於將非結構化的數據轉換為結構化數據,並支撐其運營或決策。譬如在投資領域中,一份報告出爐時間往往遠優先於其進入到許多企業訂閱的資料庫的時間,而就是在這一時間差中,對於許多投資人士來說也是所謂的競爭優勢。

再者,NLP更是賦能了新的商業型態的體現,現在更是有許多新創通過聊天機器人來完成與病人之間的諮商。

有哪些驅動因素?

NLP當前的驅動因素主要是來自於其應用領域範疇中的發展,由於整體NLP在處理邊緣案例的能力尚不成熟,使其無法成為一個可依賴性較高的系統,故此產業正在積極發展各個領域中的應用,並通過減少處理邊緣案例的場景,來提高精準度。

從技術層面來看:

  • 基於許多深度學習的應用的出現,尤其是那些基於Transformer的大型語言模型(LLM, Large Language Model)如BERT(或是優化的DistilBERT、ALBERT)、GPT-3,這些技術相對於過去的方式不僅訓練速度更快、同時其成效也更好,故此在NLP的世界裡開啟了新的一波趨勢去賦能新的應用,以及提既有應用的效能。

從應用面來看,以NLP為基礎的服務在未來將會更為頻繁,而這些服務也將進一步的刺激企業投入並驅動技術發展:

  • 從Speech-to-text到翻譯,這一類型已然逐漸成熟的NLP應用,正在轉換為不同型態的服務提供給用戶,Google雲端的自動語音辨識、Adobe在編輯影片時的自動上字幕等。
  • 將數據、圖像、報告等轉換為更容易理解的形式也是NLP在當前的一個主流應用,譬如將整份報告抑或是圖片做keyword-tagging讓分類與查找更容易、將資料庫的數據做Data Explaination讓使用者更快獲得數據中的洞見。
  • 通過社群媒體、新聞、報告等媒介去分析語境背後的意思,並判斷出情緒、語意、以及對某一事件的態度等。
  • Query在各個場景中,將會更加應用NLP,而非只是單純的字詞查找。

有哪些阻礙?

人類的語言本身就非常複雜,一個成熟的NLP系統不僅需要將日常的工作以接近100分的方式完成,其還需要在一定程度上具有處理邊緣案例的能力。

舉例來說,在年輕人的交談中,就使用了很大比例的火星文、網路用語等,然而NLP模型的訓練數據中可能根本沒有這一些文本,而導致其無法有效的判斷出這些字詞。而另一個角度來看,倘若在訓練時納入這些字詞,在實際應用場景,機器更有可能原本正常的案例歸類進邊緣案例中。

例:在日本年輕人的網路用語中,wwww代表著笑的意思,而後來因為其形狀類似草,故此許多人也以 「草」這一字代表很好笑的意思。

故此,要能夠處理好這些語意,NLP在分析出所謂的語境(Context)就必須要再加強,而這也是當前NLP走進主流應用中的最大限制要素。

3

知識圖譜

Knowledge Graph,中文譯為知識圖譜,象徵著一個由不同實體所串聯在一起的網路,為一種機器可讀的資料結構。

整個知識圖譜主要由兩個元素所組成,一為實體(Entity),在圖普上以一個節點(Node)象徵,代表的是任何形式的個體,譬如人、企業、年份、或是一種概念。譬如像是口罩、衛生、2019、病毒,都可以為一個節點/實體。

潛在價值為何?

出於KG(Knowledge Graph)本身能夠很直覺的將不同來源的資料以關係式的方法結構化,當前知識圖譜的主要應用聚焦在Metadata或是Taxonomy這一類中的數據管理模式上,不過僅是這一特性,就能夠支撐整個組織在分享、搜尋、以及分析等活動的落實,並且孕育出無數個種應用。

在零售業中,知識圖譜可以應用在產品的資料庫當中,並以此為基準,去做相關產品在電商平台上的推薦機制。

在金融業中,KG也能將來自KYC、Due Diligence、投資評估、受保物件或受保人等數據中,以知識圖譜的方式儲存,並且在各種不同的使用案例中應用,最為常見的應用案例包含風險評估、法遵、異常行為偵測、投資組合商品推薦機制等。

 

有哪些驅動因素?

KG在近年來得到了非常多的討論,不過是否知識圖譜能夠進一步的普及成為許多資料庫的基礎,去支撐運營、機器學習、以及其他IT需求,將取決於以下的幾種動因要素:

  • KG在既有基礎上的突破,抑或是新的KG架構將會進一步優化該技術的指標,譬如像是速度、可依賴性、公式化、規模化等等。 譬如這兩年比較受討論的EEA, Embedding-based Entity Alignment 就因為其在速度上的突破而受到許多關注,雖然在與其他第三方資訊的串接上仍然有規模化的問題。
  • 隨著技術逐漸穩定,再加上全球各個領域都因為IoT等技術的蓬勃發展,而需要處理越來越複雜、且量越來越大的數據,在這樣的一個趨勢之下,KG這種直覺性且有非常好的可規模化的基礎的資料結構,也在各個領域受到關注與研究,甚至是領先企業的導入。
  • 基於機器學習等領域在處理非結構化數據的需求, 知識圖譜也提供了卓越的優勢在這一領域上,支撐機構處理文件、圖像、以及影像等數據類型,以及這當中之間的關聯性。
  • Web3技術的採納也進一步的讓去中心化的資料庫受到關注,而這進一步的驅動了去中心化的知識圖譜(DKG, Decentralized Knowledge Graph)的發展。

有哪些阻礙?

  • 雖然知識圖譜承載著許多商業價值,不過對於絕大多數的企業來說,相對於既有的資料庫管理方式其所提供的額外價值並不大,故此也讓這項技術雖然逐漸的被技術單位意識,但仍然無法在短期普及。
  • 相對於已經在IT領域上有數十年的歷史的關聯式資料庫,知識圖譜在IT領域上不到五年的發展使其仍有各個面向尚不成熟,企業不僅需要從頭到尾的去建立起系統整合的模組以支援各個不同IT系統的相容,其在架構、治理、以及維護上都需要相關的IT技術,故此對於大多數企業來說是一個極大的限制因素。

Big Questions

圍繞在人工智慧上,有哪些主題正廣受討論?

1

浮出水面的規範有哪些?

由於人工智慧在近年間獲得龐大的投資與成長,而其乘載著的潛能也讓許多人民乃至政府感到許多不確定性,不論是出於擔心成熟的AI系統會對許多既有的工作而帶來許多取代性的效應;抑或是AI會基於數據與演算法而對其使用者有歧視性的結果;甚至是對於是否會出現像是科幻電影中所展現出來的末世場景。

雖然在這一領域中,許多研究機構與企業也嘗試著通過提高AI的可解釋性來提高大眾對逾期的理解,其中還有提高AI風險管控、AI信任等領域的研究,但是現在AI在不論是美國、中國、歐盟、抑或是印度等國也都浮出了許多正在進行提案與審議的法規限制。未來究竟會以何種形式問世,就會是許多企業所聚焦的討論。

  • 歐盟:建立在已有的GDPR限制企業於收集、管理、應用、以及分享客戶數據的規範上,以及其他像是ETSI EN 303 645等類型聚焦在資安與網路安全的規範,歐盟於2021年提出了AI Act,聚焦在人工智慧上的規範設立。
  • 中國另也有相關的法規正在提出當中,其中像是中國全國範圍實施的人工智慧倫理指南,就是聚焦在AI應用曝險的層面,不過該規範主要是建議性質,全國範疇上有一個法規去規範AI。 然而在2022年九月通過的上海市促進人工智能產業發展條例,則是全國首個將人工智慧規範帶入法規範疇內的應用,聚焦於上海市的企業。

2

可解釋型AI發展重點是什麼?

隨著AI模式越加複雜,人類也就越來越無法理解AI,不僅是使用者,研究員更是如此。通過神經元網路訓練的AI(深度學習),在許多真實應用場景下,研究員根本無法得知為何AI會做某些動作。

倘若僅是讓AI下下圍棋到還好,但是在許多高風險環境中,譬如診斷癌症、支持基金投資者交易、企業風險決策等,讓AI具有解釋自己動作的背後邏輯不僅能提高使用者對於AI的信任,其更是能夠讓人類從中學習。

科技應用

人工智慧在不同產業中的影響為何?

人工智慧機乎可以說是在所有科技發展中蘊含最大潛能的技術,在像是傳統製造、農業、文書處理等勞力密集度較高的產業中,AI在自動化這一領域即乘載著龐大的潛能;在像是金融、消費品、零售等直面消費者的產業中,AI能夠精準的在複雜的顧客旅程與客戶體驗數據中找到模式,並落實更好的推薦、更精準的行銷、以及其他相關的客戶體驗活動。

而在邏輯思維要求極高的業務中,AI更是逐漸的能夠落實決策支持,讓決策者能夠參考AI所提出來的建議,發現不曾發現的線索;在風險管理及為重要的產業中,AI可以挖掘出龐大的數據,並從中找出許多安全漏洞與異常行為,提供給工程師去做進一步的優化。

不止於此,AI更是在模擬、設計、績效管理、甚至是藝術面向都有著龐大的價值潛能,隨著技術越來越成熟、資源越來越豐富、同時基礎建設越來越完善後,AI將能賦能每一個產業,為所有類型的業務帶來價值。

1

零售與消費品業

人工智慧可以解決零售與消費品所遇到的許多難題。像是如何更好處理供需匹配?如何更好的管理存貨?如何更好的預測需求?如何更好的落實定價?如何提高實體店面的客戶體驗?如何提供更為個人化的行銷與銷售?

這些問題不僅都是零售與消費品業著每日所面臨的挑戰,隨著供應鏈變得更加變動、顧客旅程變得更加複雜、以及競爭變得更加激烈,這些挑戰在未來也只會進一步的加劇。

  • 更精準的需求預測:AI在種類繁多、量非常大、變數較多的數據上的能力相對於傳統統計模型來得更為精準,故此在需求預測中,零售與消費品業者不單純僅使用歷年數據,更是可能會納入許多外部數據,譬如氣候、新聞、交通資訊等。 而在這樣的基礎之上,需求預測便能無時無刻都在更新,支撐業者能夠及時的調整相關的供應鏈活動部署。
  • 更為高效能的存貨管理:建立在一個數位化倉儲的基礎之上,AI能夠聚焦在有效的將不同的倉儲活動以更為協調的方式運營,並通過物流優化、存貨控制、以及績效管理等模式落實成本的降低、以及效率的提高。
  • 食安風險掌控:在食品消費品中,AI可以通過預測性模型以更精準的抓出潛在具有高風險的食品產品。
  • 更為精準的定價:AI在定價的應用中已然不是新鮮的應用,不過由於產品的複雜度、多渠道的發展、消費者觀感、以及實體零售的特性。在定價上,零售一直沒能有效規模化相應的部署,然而越來越多的行業龍頭開始在疫情後規模性的去嘗試AI定價,未來AI驅動的定價也將會是常態。
  • 更為相關的行銷與銷售:對於零售與消費品業者來說,消費者可能來自實體零售、電商、社群商務、外送、甚至是其他渠道,這也讓整體顧客旅程過於複雜而導致難以追蹤,然而AI在處理這ㄧ類型數據上就剛好是強項,故此有許多AI驅動的行銷與銷售手段,不論是單一渠道、還是跨渠道(CRM中的顧客分數等)都承載著許多應用。