文章資訊

AI如何表現出人類行為?淺談「機器學習」與「深度學習」

人類的智慧是經驗的累積,從一次次的成功與失敗當中學習、記取教訓,往後再遇到類似的事件,便能依據過往的記憶,做出最佳決策。
想讓電腦模擬人類的行為與決定,最常提到的技術便是「機器學習」與「深度學習」,兩者跟AI的關係可用以下同心圓表達:

         

簡言之,深度學習是機器學習的一部分,但兩項技術都屬人工智慧的範疇。

機器學習是透過大量數據及演算法訓練機器,使其具備自我學習的能力。電腦從幾千筆的資料中,透過統計分析找到資訊變動模式、歸納特徵,進而執行特定任務。如此一來,開發者不需針對不同情形重複寫程式,也可讓電腦學會準確判斷。舉例來說,社群媒體上的演算法,就是透過分析使用者平常瀏覽或按讚的圖片、文章、影片等許多資訊,然後依據用戶喜好推薦相符的內容。
 

由上可知,機器學習包含大量的演算法,如邏輯回歸法(Logistic Regression)、決策樹法(Decision Tree)、隨機森林法(Random Forest)、K平均算法(K-means Clustering)等,這些演算法可依「資料是否有標準答案」粗分為三大類:監督式學習(Supervised Learning)、非監督式學習(Unsupervised Learning)、半監督式學習(Semi-supervised Learning)。
 

監督式學習會給予電腦標籤化的資訊(概念類似標準答案),使其從中蒐集特徵資料、學習模型後做出預測。例如讓將5000張狗及貓的照片輸入電腦,最後再讓電腦分析另一張照片確認這是狗或貓。學習過程中,電腦不斷地修正以達到更精準的預測,直到其判斷誤差達到可接受的範圍。
 

非監督式學習則是指使用無標籤的資料訓練電腦的模型。在不提供標準答案的情況下,電腦自行在資料中找到潛在規則,例如輸入10000筆公司客戶的資訊,電腦會自動將年齡、性別等某些特徵相似的人分在同一群。半監督式學習則針對少部分資料進行標註,但通常標籤資料的數量遠低於無標籤資料。

        


機器學習的介紹告一段落,接下來談談深度學習。台大電機系李宏毅教授曾說過:「深度學習就是一個函數集,如此而已」。深度學習的演算法模型以類神經網路為架構,類神經網路是許多函數的集合,由大量進行簡單運算的神經元組成。當我們輸入一批數值,電腦會自行輸出另一批數值,再從這些數值中挑出一個,也就是機器運算出的最佳解。深度學習的應用則包含AlphaGo下圍棋、自動駕駛等,也逐漸與醫療服務結合,締造AI產業更高層次、更複雜的應用。