神經網絡幾經沉浮 未來将迎更大發展

發表時間:2019-09-24 15:21

在近幾年的人工智能浪潮中,湧現了衆多優秀的技術:視頻監控設備的人臉識别功能,智能手機上的語音識别或谷歌最新的自動翻譯 ,都源于一種稱為“深度學習”的技術。現在,人工智能成為了非常熱門的話題,而實際上目前人工智能發展的衆多貢獻都有賴于其下屬的深度學習,以及神經網絡領域的發展成果。

  實際上,深度學習是人工智能實現方法的新名稱,這種方法已經存在了70多年。神經網絡于1944年由Warren McCullough和Walter Pitts(芝加哥大學的兩位研究人員,也被認為是認知科學的創始成員)首次提出後伴随人工智能的發展幾經沉浮:

  人工智能最早一次的興起是1956-1974,以命題邏輯、謂詞邏輯等知識表達、啟發式搜索算法為代表,當時已經有關于如何下棋的研究展開。

  1980 年代初又興起了第二次熱潮,主要圍繞專家系統、知識工程、醫療診斷等領域。随後,人工智能跌入了近30 年的寒冬。

  第三次熱潮就是最近兩年興起的深度學習推動的,主要表現是人臉識别、語音識别、自然語言處理等技術的成熟。

  至于神經網絡,直到1969年,神經網絡都是神經科學和計算機科學的一個主要研究領域。其後,它随同人工智能的寒冬經曆了一段被冷落的時期。在20世紀80年代神經網絡方面的研究再次興起,并由于圖形芯片處理能力的提高,大規模的提升和應用在2010年後大爆發。

  神經網絡簡要原理

  神經網絡是一種進行機器學習的方法,計算機通過分析訓練樣例來學習執行某些任務。通常,這些例子是事先标記的。例如,物體識别系統可以饋送數千個汽車,房屋,咖啡杯等不同類别的标記圖像,并且它将在圖像中找到始終與特定标簽相關聯的視覺圖案。

  神經網絡模仿人腦而構建,由數千甚至數百萬個密集互連的簡單處理節點組成。現今的大多數神經網絡被組織成節點層,它們是“前饋”網絡,意味着數據隻在一個方向上穿過它們。單個節點可能連接到其下面的層中的幾個節點,從中接收數據,以及它上面的層中的幾個節點,它們向其發送數據。

  對于每個傳入連接,節點将分配一個稱為“權重”的數字。當網絡處于活動狀态時,節點在其每個連接上接收不同的數據項(不同的數字),并将其乘以相關權重。

  然後它将得到的乘積,加在一起,産生一個結果數字。如果該數字低于傳輸阈值,則節點不将數據傳遞給下一層。如果數量超過傳輸阈值,則節點“觸發”,意味着沿其所有傳出連接發送數字 - 加權輸入的總和。
  當訓練神經網絡時,其所有權重和阈值最初都設置為随機值。訓練數據被饋送到底層 - 輸入層 - 它通過後續層,以複雜的方式相乘并加在一起,轉換傳輸到輸出層。在訓練期間,系統不斷調整權重和阈值,直到具有相同标簽的訓練數據始終産生類似的輸出。

  神經網絡的發展

  McCullough和Pitts在1944年描述的神經網絡具有阈值和權重,但它們沒有排列成層,研究人員沒有指定任何訓練機制。McCullough和Pitts所展示的是,神經網絡原則上可以計算數字計算機可以執行的任何功能,關注重點是人腦可以被認為是一種計算設備的概念。

  康奈爾大學心理學家弗蘭克羅森布拉特于1957年展示了第一個可訓練的神經網絡Perceptron。Perceptron的設計與現代神經網絡的設計非常相似,隻是它隻有一層可調節重量和阈值,夾在輸入之間和輸出圖層。

  而現代GPU使20世紀60年代的單層網絡和20世紀80年代的2到3層網絡成為當今的10層,15層甚至50層網絡。這也是“深度學習”中的“深層”所指的意思——網絡層的深度。

  神經網絡後續展望

  2010年後神經網絡的複興 - 深度學習革命 – 首先來自計算機遊戲行業。視頻遊戲的複雜圖像和快節奏需要能夠跟上的硬件,結果是圖形處理單元(GPU)快速發展,它在單個芯片上包含數千個相對簡單的處理核心。不久人們就意識到GPU的架構與神經網絡的架構非常相似。

  同時,為了更高效的研究和利用神經網絡,更多硬件方案湧現了出來, Intel收購Altera,谷歌自研TPU,業界還在尋找更高效的方法,也在側面印證神經網絡的火爆程度。

  現在,神經網絡更是計算機領域和神經科學領域的寶貴工具。用于調整權重和阈值的特定網絡布局或規則已經再現了人類神經解剖學和認知學裡觀察到的特征,表明它幫助獲取了關于大腦如何處理信息的機制。

  但是,神經網絡有些令人不滿意的不足:足夠的訓練會改變神經網絡的設置,使其可以對數據進行分類,但其中的過程過于複雜,查看單個連接的權重無法解釋其原理;物體識别器看重的圖像特征是什麼,以及它是如何将它們拼湊成汽車,房屋和咖啡杯的獨特視覺特征的也尚不明确;類似這些問題都導緻神經網絡作用的機制具有一定的不透明性和不可解釋性。

  在這些問題得到解決後,神經網絡的作用機制将進一步可控。同時,神經網絡作為神經科學和計算科學領域的工具,将在人工智能大時代,得到更好的發展。