陳玟均的學習歷程檔案 - 111-1人工智慧 - 2. 神經網路架構 |
|
|
2. 神經網路架構什麼是神經網路?神經網路是人工智慧中的一種方法,指導電腦以受人腦啟發的方式來處理資料。這是一種機器學習程序,稱為深度學習,使用類似於人腦分層結構中的互連節點或神經元。它會建立一種可讓電腦用來從錯誤中學習並持續改善的適應型系統。因此,人工神經網路嘗試以更高準確度來解決複雜的問題,例如總結文件或識別面部。 為什麼神經網路很重要?神經網路可協助電腦在有限人類協助下做出智慧的決策。這是因為他們可以學習和建模非線性和複雜的輸入與輸出資料之間的關係。例如,他們可以執行下列任務。 進行概括和推論神經網路可以理解非結構化資料,並在沒有明確訓練的情況下進行一般性觀察。例如,他們可以識別兩個不同的輸入句子具有相似的含義:
神經網路會知道這兩個句子的意思是相同的。或者它可以大致識別 Baxter Road 是一個地方,而 Baxter Smith 是一個人名。 神經網路的作用是什麼?神經網路在許多產業都具有若干使用案例,例如:
我們在下面給出了神經網路的四個重要應用。 電腦視覺電腦視覺是電腦從影像和影片中擷取資訊和洞察的功能。藉助神經網路,電腦可以區分和識別與人類相似的影像。電腦視覺有多種應用,例如:
語音識別儘管語音模式、音調、語氣、語言和口音不同,神經網路仍然可以分析人類語音。Amazon Alexa 和自動轉錄軟體等虛擬助手使用語音識別來執行以下任務:
自然語言處理自然語言處理 (NLP) 是處理自然、人工建立文字的功能。神經網路可協助電腦從文字資料和文件中收集洞察和意義。NLP 具有若干使用案例,包括以下功能:
推薦引擎神經網路可以追蹤使用者活動,以開發個人化推薦。他們還可以分析所有使用者的行為,並探索特定使用者感興趣的新產品或服務。例如,總部位於費城的新創公司 Curalate 可協助品牌將社交媒體帖子轉化為銷售。品牌使用 Curalate 的智慧產品標記 (IPT) 服務,來自動收集和管理使用者產生的社交內容。IPT 使用神經網路,來自動尋找和推薦與使用者社交媒體活動相關的產品。消費者不必透過線上目錄,即可尋找社交媒體影像中的特定產品。而是可以使用 Curalate 的自動產品標記,來輕鬆購買產品。 神經網路的運作方式如何?人腦是神經網路架構背後的靈感來源。人類的腦細胞,稱為神經元,形成一個複雜、高度互聯的網路,並相互傳送電訊號以協助人類處理資訊。同樣,人工神經網路是由人工神經元組成,它們共同協作以解決問題。人工神經元即軟體模組,稱為節點,人工神經網路是軟體程式或演算法,其核心是使用運算系統來解決數學運算。 簡單的神經網路架構一個基本的神經網路透過三層來使人工神經元互連: 輸入層來自外界的資訊從輸入層進入人工神經網路。輸入節點對資料進行處理,對其進行分析或分類,並將其傳遞至下一層。 隱藏層隱藏層從輸入層或其他隱藏層取得輸入。人工神經網路可以有大量的隱藏層。每個隱藏層分析前一層的輸出,進一步處理,並將其傳遞給下一層。 輸出層輸出層給出人工神經網路所有資料處理的最終結果。它可以有一個或多個節點。例如,如果我們有一個二元 (是/否) 分類問題,輸出層將有一個輸出節點,其結果為 1 或 0。但是,如果我們有一個多類別分類問題,則輸出層可能包含多個輸出節點。 深度神經網路架構深度神經網路或深度學習網路具有數百萬個連結在一起的人工神經元隱藏層。其中的數字稱為權重,表示一個節點與另一個節點之間的連線。如果一個節點激發另一個節點,則權重為正數,如果一個節點抑制另一個節點,則權重為負數。節點權重值越高,對其他節點的影響越大。
神經網路有哪些類型?人工神經網路可以根據資料從輸入節點流向輸出節點的方式進行分類。以下是一些範例: 前饋神經網路前饋神經網路從輸入節點到輸出節點,在一個方向上處理資料。一層中的每個節點會連線至下一層中的每個節點。回饋網路使用反饋程序,隨時間推移改善預測。 反向傳播演算法人工神經網路透過使用糾正回饋迴圈來不斷學習,以改善其預測分析。簡單來說,您可以認為資料透過神經網路中的許多不同路徑,從輸入節點流向輸出節點。只有一條路徑是正確的,即將輸入節點映射至正確的輸出節點。為了找到這條路徑,神經網路使用一個回饋迴圈,其運作方式如下:
卷積神經網路卷積神經網路中的隱藏層會執行特定的數學函數,例如彙總或篩選,稱為卷積。它們對於影像分類非常有用,因為可以從影像中擷取對影像識別和分類有用的相關特徵。新表單更容易處理,而不會遺失對做出良好預測至關重要的特徵。每個隱藏層會擷取和處理不同的影像特徵,如邊緣、顏色和深度。 如何訓練神經網路?神經網路訓練是指導神經網路執行任務的程序。神經網路透過最初處理若干大型標記或未標記的資料集來進行學習。透過使用這些範例,它們可以更準確地處理未知輸入。 監督學習在監督學習中,資料科學家為人工神經網路提供標記資料集,提前提供正確答案。例如,面部識別中的深度學習網路訓練最初會處理數十萬張人類面部影像,其中包含與種族、國家/地區或情感相關的各種術語來描述每張影像。 神經網路緩慢地從這些資料集中建置知識,智慧提前提供正確的答案。網路經過訓練後,開始猜測其之前從未處理過的人類面部影像的種族起源或情感。 什麼是神經網路背景下的深度學習?人工智慧是電腦科學領域,研究讓機器能夠執行需要人類智慧的任務的方法。機器學習是一種人工智慧技術,讓電腦能夠存取非常大型的資料集,並指導其這些資料中進行學習。機器學習軟體在現有資料中發現模式,並將這些模式套用至新資料,以做出明智決策。深度學習是機器學習的子集,其使用深度學習網路來處理資料。 機器學習與深度學習傳統的機器學習方法需要人工輸入,才能使機器學習軟體充分發揮作用。資料科學家會手動確定軟體必須分析的相關特徵集。這限制了軟體的能力,使得建立和管理變得乏味。 另一方面,在深度學習中,資料科學家只向軟體提供原始資料。深度學習網路自行推導出特徵,並更獨立地學習。它能夠分析文字文件等非結構化資料集,確定優先考慮哪些資料屬性,並解決更複雜的問題。 例如,如果您正在訓練機器學習軟體以正確識別寵物的影像,則需採取以下步驟:
|
|