張仲豪的學習歷程檔案 - 111-1 人工智慧AI - 神經網路架構 |
|
|
神經網路架構神經元網絡 和其他機器學習方法一樣,神經網路已經被用於解決各種各樣的問題,例如機器視覺和語音辨識。這些問題都是很難被傳統基於規則的編程所解決的。
人工神經網路目前沒有一個統一的正式定義。不過,具有下列特點的統計模型可以被稱作是「神經化」的: 1. 具有一組可以被調節的權重(被學習演算法調節的數值參數) 2. 可以估計輸入資料的非線性函式關係
人工神經網路與生物神經網路的相似之處在於,它可以集體地、並列地計算函式的各個部分,而不需要描述每一個單元的特定任務。神經網路這個詞一般指統計學、認知心理學和人工智慧領域使用的模型,而控制中央神經系統的神經網路屬於理論神經科學和計算神經科學。 在神經網路的現代軟體實現中,由生物學啟發的方法已經有了很重大的延伸,現在主流的是基於統計學和訊號處理的更加實用的方法。在一些軟體系統中,神經網路或者神經網路的一部分(例如人工神經元)是大型系統中的一個部分。這些系統結合了適應性的和非適應性的元素。雖然這種系統使用的這種更加普遍的方法更適宜解決現實中的問題,但是這和傳統的連接主義人工智慧已經沒有什麼關聯了。不過它們還有一些共同點:非線性、分散式、並列化,局部性計算以及適應性。從歷史的角度講,神經網路模型的應用標誌著二十世紀八十年代後期從高度符號化的人工智慧(以用條件規則表達知識的專家系統為代表)向低符號化的機器學習(以用動力系統的參數列達知識為代表)的轉變。 典型的人工神經網路具有以下三個部分: 1. 結構: 結構指定了網路中的變數和它們的拓撲關係。例如,神經網路中的變數可以是神經元連接的權重和神經元的激勵值。2. 激勵函式: 大部分神經網路模型具有一個短時間尺度的動力學規則,來定義神經元如何根據其他神經元的活動來改變自己的激勵值。一般激勵函式依賴於網路中的權重。 3.學習規則: 學習規則指定了網路中的權重如何隨著時間推進而調整。這一般被看做是一種長時間尺度的動力學規則。一般情況下,學習規則依賴於神經元的激勵值。它也可能依賴於監督者提供的目標值和當前權重的值。例如,用於手寫辨識的一個神經網路,有一組輸入神經元。輸入神經元會被輸入圖像的資料所激發。在激勵值被加權並通過一個函式後,這些神經元的激勵值被傳遞到其他神經元。這個過程不斷重複,直到輸出神經元被激發。最後,輸出神經元的激勵值決定了辨識出來的是哪個字母。 人工神經網路的實用性 1. 計算能力 多層感知器是一個通用的函式逼近器,由Cybenko定理證明。然而,證明不依賴特定的神經元數量或權重。一個具有有理數權重值的特定遞迴結構(與全精度實數權重值相對應)由有限個神經元和標準的線性關係構成的神經網路相當於一個通用圖靈機。他們進一步表明,使用無理數權重值會產生一個超圖靈機。 2. 容量 人工神經網路模型有一個屬性,稱為「容量」,這大致相當於他們記住(而非正確分類)輸入資料的能力。它與網路的參數、和結構有關。Google在研究中使用打亂標籤的方法,來測試模型是否能否記住所有的輸出。雖然很明顯,這樣模型在測試集上的表現幾乎是隨機猜測,但是模型能夠記住所有訓練集的輸入資料,即記住他們被打亂後的標籤。而記住有限的樣本的資訊,需要的模型的參數數量存在下限。
在目標是建立一個普遍系統的應用程式中,過度訓練的問題出現了。這出現在迴旋或過度具體的系統中當網路的容量大大超過所需的自由參數。為了避免這個問題,有兩個方向:第一個是使用交叉驗證和類似的技術來檢查過度訓練的存在和選擇最佳參數如最小化泛化誤差。二是使用某種形式的正規化。這是一個在概率化框架里出現的概念,其中的正則化可以通過為簡單模型選擇一個較大的先驗概率模型進行;而且在統計學習理論中,其目的是最大限度地減少了兩個數量:「風險」和「結構風險」,相當於誤差在訓練集和由於過度擬合造成的預測誤差。 神經網路的功能與人腦有何相似之處 1. 輸入層:資料輸入系統的輸入口
比較複雜的人工神經網路可以有很多層,其中有一些是隱藏的。 人工神經網路的神經元工作原理 在人工神經網絡中,人工神經元接收的刺激為實數訊號形式,然後: 1. 每一個神經元的輸出都是由其輸入總和的非線性函數計算而得。 神經網路天生內建某種學習規則,會根據現在的輸入模式來修改神經連接的權重,就像成長中的孩子學會從動物舉例子中識。 談到神經網路,就不得不談深度學習。「深度深度學習互換互換互換互換不存在了: 1. 深度學習是促使人類智慧 (AI) 前進的先決條件。 為什麼深度學習對組織很重要 分區機器學習和其他類型的學習 機器學習 監督型學習 於機器加上標記,就標記一張答題紙,用於答題紙張以了解哪些電子郵件是垃圾郵件、哪些是合法郵件。這種方式稱為監督型學習。監督型學習的回歸或分類是透過線性回歸和K-近鄰演算法來完成。 非監理型學習
神經網路和模糊總編輯 一提,區分網路模糊邏輯也重要。模糊根據不精確或模棱兩可的資料資料做出具體決策下面,採用類人思維過程來解決問題。 神經網路的局限性 可能在使用者應注意一些具體問題,特別是與反向傳播神經網絡路徑和某些其他類型網絡路徑相關的問題。過程不可解 傳播終極黑盒子允許使用者隨時間對網絡進行度進行採集。在這些情況下,網絡本身會自主進行學習。 最後的輸出就是一條訓練完成的網絡,它是自治的,不提供超出其本身內部數據相關係的運算式或網絡係數,網絡的網絡就是關係。 訓練比較慢 反向訓練速度比網路更慢數千代。這是因為機器的中央處理單元必須計算可能非常麻痺,並且會在包含大量資料的超大型網路中引起問題。不過,當今天機器運行速度已經足夠快了,可以迴避這個問題。 神經網路的應用 神經網路很有用: 1. 用於理解關聯,或探索一組模型中的常規元素2. 資料量巨大或參量極度多種化的地方 3. 對變數之間的關係只有模糊理解時 4. 傳統方法在描述相關方面有所有不足時 神經網路實例 1. 神經網路對製造業檢測的衝擊 Ochiai 表示:「因神經網路促成的深度學習圖像分析功能,可以更容易讓公司將採用傳統機器視覺時相當複雜或棘手的檢測自動化。想一想大部分仍由人工進行的裝配檢測。或另一個範例:缺陷探測,這項技術將對製造廠商的自動化策略帶來助益。」 神經網路的測試功能辨識圖案的能力強大。但正如 Ochiai 所指出,加上標籤的資料需有非常優異的品質,神經網路才能成功訓練其模型。此外,它還需要大量參考圖像資料,使得情況更形複雜。
|
|