生成式AI所指的是通過讓機器學習模型研究歷史數據的模式,並且先進的深度學習技術去創造出一個全新生成的成品,其可以是一段文字、一張圖像、一個音訊檔、抑或是一部影片。
同許多人工智慧技術一樣,生成式AI不僅是在研究領域中積極的科學家們探索新的訓練方式、神經網路設計、以及新的發展,同時也在商業領域中,廣受許多企業與新創們探索新的用例、優化許多商業既有之流程等。
在眾多用例當中,最為貼近我們生活的就包含許多假冒為名人的影像在YouTube等平台上出現;同時還有自2019年開始就出現在網路上的「ThisPersonDoesNotExist」網站,可以生成出全新的臉;再者,還有一些更為先進的應用,譬如文字生成(近期非常轟動的ChatGPT與InstructGPT即是建立在GPT 3.5之上所落實的開發,一出版即體現出整體自然語言處理與生成的技術成熟。)、音樂生成、圖像與影像生成等,雖然這些技術在處理許多邊緣案例仍然有許多進步空間,但不難看到生成式AI在各個產業當中蘊含的潛力。
當然也有一些聚焦在個別產業的應用,而這一類型的應用中,有許多已然創造出充分的商業價值,並且預計也將成為生成式AI價值最龐大的領域。譬如在藥物探索階段中,通過化學物質在吸收、分配、代謝、排泄、以及毒性等的活動特性中,由生成式AI根據要求與特徵,生成出模板讓研究人物測試(這一類型的應用也泛稱為3D形狀生成)。
生成式AI通常是依賴兩個主要的ML框架去運作,其中之一為GANs(Generative Adversarial Networks),也就是生成對抗網路,GANs也是生成式AI的第一波主流應用,其中前面所提到的生成不存在人類的網站,就是以GANs技術為背景。
簡單來說,GANs分別是由鑑別網路(Discriminating Network)與生成網路(Generative Network)構成,透過兩者相互對抗產生結果是運作的原理。
所以在圖像應用上的訓練方式,就是給予真實圖片,並且讓模型從圖像中採樣隨機的噪音向量(Noise Vectors),並以此為基礎生成,並在以真實與生成出來的圖片訓練出鑑別者(Discriminator),並讓兩者互相比較。
而近期在更加主流的應用則是以Transformer為基礎的技術的GPT(Generative Pre-trained Transformer),如字面上的意思,GPT指的是已經訓練好的模型,而這一模型是以Transformer為基礎。Transformer模型即是一種神經網路,藉由追蹤序列資料中的關係,學習上下文之間的脈絡及意義,就如同一個句子中的每一個字,也可以理解為一種具有自我注意力(Self Attention)機能的編碼/解碼的架構(Encoder-decoder Architecture)。
GPT相關的技術在近年間不斷的進化,從Google發佈的BERT、再到RoBERTa、GPT-2、T5、TuringNLG、以及最近在語言上稱霸整個領域,由Open AI發佈的GPT-3、以及近期轟動全球的GPT-3.5。
OOSGA是一家專注於為工業客戶提供東南亞供應鏈拓展、設廠評估,以及市場情資的顧問公司。我們致力於為客戶企業提供最可靠的市場情報和洞見,並與當地工業不動產開發商,以及相關合作夥伴一同推進當地業務的落地。
倘若您對於進入新市場、抑或是對拓展業務有想法,歡迎隨時聯繫我們團隊討論。
生成式AI許多產業都有龐大的應用層面,而應用場景橫跨運營、客戶體驗、以及產品與服務創新。譬如在汽車產業中,製造商即開始嘗試以生成式AI來設計汽車部件。
而在生命科學當中、化學、材料科學當中,生成式AI在3D建模的龐大潛能也讓其在探索階段(Discovery Phase)擁有龐大的應用。
而聚焦在創意、行銷、設計、以及客戶體驗中,生成式AI則是近乎所有大廠的競爭重點,從Meta的影片製作(Make-a-video)、到Google同樣的影片製作解決方案Phenaki;還有在圖像生成中,微軟也推出了Designer與Canva競爭,其中的功能即包含以文字敘述創造出專業的圖像設計。而在語言端,也有相關技術聚焦在各個領域的發展去自動化企業內運營、以及提高客戶體驗。