DOCS

生成式AI（Generative AI）為何？科技應用與案例有哪些？

最後更新於: April 23, 2024

生成式AI為何？

生成式AI所指的是通過讓機器學習模型研究歷史數據的模式，並且先進的深度學習技術去創造出一個全新生成的成品，其可以是一段文字、一張圖像、一個音訊檔、抑或是一部影片。

同許多人工智慧技術一樣，生成式AI不僅是在研究領域中積極的科學家們探索新的訓練方式、神經網路設計、以及新的發展，同時也在商業領域中，廣受許多企業與新創們探索新的用例、優化許多商業既有之流程等。

在眾多用例當中，最為貼近我們生活的就包含許多假冒為名人的影像在YouTube等平台上出現；同時還有自2019年開始就出現在網路上的「ThisPersonDoesNotExist」網站，可以生成出全新的臉；再者，還有一些更為先進的應用，譬如文字生成（近期非常轟動的ChatGPT與InstructGPT即是建立在GPT 3.5之上所落實的開發，一出版即體現出整體自然語言處理與生成的技術成熟。）、音樂生成、圖像與影像生成等，雖然這些技術在處理許多邊緣案例仍然有許多進步空間，但不難看到生成式AI在各個產業當中蘊含的潛力。

當然也有一些聚焦在個別產業的應用，而這一類型的應用中，有許多已然創造出充分的商業價值，並且預計也將成為生成式AI價值最龐大的領域。譬如在藥物探索階段中，通過化學物質在吸收、分配、代謝、排泄、以及毒性等的活動特性中，由生成式AI根據要求與特徵，生成出模板讓研究人物測試（這一類型的應用也泛稱為3D形狀生成）。

生成式AI如何運作？

生成式AI通常是依賴兩個主要的ML框架去運作，其中之一為GANs（Generative Adversarial Networks），也就是生成對抗網路，GANs也是生成式AI的第一波主流應用，其中前面所提到的生成不存在人類的網站，就是以GANs技術為背景。

簡單來說，GANs分別是由鑑別網路（Discriminating Network）與生成網路（Generative Network）構成，透過兩者相互對抗產生結果是運作的原理。

所以在圖像應用上的訓練方式，就是給予真實圖片，並且讓模型從圖像中採樣隨機的噪音向量（Noise Vectors），並以此為基礎生成，並在以真實與生成出來的圖片訓練出鑑別者（Discriminator），並讓兩者互相比較。

而近期在更加主流的應用則是以Transformer為基礎的技術的GPT（Generative Pre-trained Transformer），如字面上的意思，GPT指的是已經訓練好的模型，而這一模型是以Transformer為基礎。Transformer模型即是一種神經網路，藉由追蹤序列資料中的關係，學習上下文之間的脈絡及意義，就如同一個句子中的每一個字，也可以理解為一種具有自我注意力（Self Attention）機能的編碼/解碼的架構（Encoder-decoder Architecture）。

GPT相關的技術在近年間不斷的進化，從Google發佈的BERT、再到RoBERTa、GPT-2、T5、TuringNLG、以及最近在語言上稱霸整個領域，由Open AI發佈的GPT-3、以及近期轟動全球的GPT-3.5。

About Us

協助製造業者拓展東南亞市場

OOSGA是一家專注於為工業客戶提供東南亞供應鏈拓展、設廠評估，以及市場情資的顧問公司。我們致力於為客戶企業提供最可靠的市場情報和洞見，並與當地工業不動產開發商，以及相關合作夥伴一同推進當地業務的落地。

倘若您對於進入新市場、抑或是對拓展業務有想法，歡迎隨時聯繫我們團隊討論。

生成式AI科技Snapshot

生成式AI的潛在價值為何？

生成式AI許多產業都有龐大的應用層面，而應用場景橫跨運營、客戶體驗、以及產品與服務創新。譬如在汽車產業中，製造商即開始嘗試以生成式AI來設計汽車部件。

而在生��科學當中、化學、材料科學當中，生成式AI在3D建模的龐大潛能也讓其在探索階段（Discovery Phase）擁有龐大的應用。

而聚焦在創意、行銷、設計、以及客戶體驗中，生成式AI則是近乎所有大廠的競爭重點，從Meta的影片製作（Make-a-video）、到Google同樣的影片製作解決方案Phenaki；還有在圖像生成中，微軟也推出了Designer與Canva競爭，其中的功能即包含以文字敘述創造出專業的圖像設計。而在語言端，也有相關技術聚焦在各個領域的發展去自動化企業內運營、以及提高客戶體驗。

有哪些驅動因素？

以Transformer為基礎的技術不斷的取得更多突破，不論是在文字、圖像、化學物質、還是電腦程式碼（Github Copilot）的生成，而結合其他技術其更是能賦能更龐大的應用，譬如OpenAI所推出的DALL·E 2即是結合了CLIP以及改版的GPT-3，使其可以從文字敘述中生成圖像。
生成式對抗網路相關技術（GANs）、變分自動編碼器（VAE）、自我迴歸模型（Autoregressive model）、以及zero/one/few-shot學習方式等技術的突破，也讓訓練的成本大幅降低，並且提高了其生成的正確性。
許多雲端平台，包含AWS、Azure等也逐漸提供生成式AI的套件與開發框架，支援開發者能夠更加容易、且無痛的落實相關模型的訓練與部署。

參考資料

作者：專案小組

我們的專案小組結合了內部團隊、外部專家、合作夥伴，並協助客戶探勘市場機會、落實市場進入與成長。