摘要:近10 年來(lái),人工智能技術(shù)得到了科技與工業(yè)界的極大的重視,預(yù)示著人類文明將進(jìn)入智能時(shí)代。但是,作為智能時(shí)代基礎(chǔ)的“智能科學(xué)”還遠(yuǎn)未成型。本文從電磁物理信息感知技術(shù)的獨(dú)特視角,討論智能科學(xué)如何發(fā)展的一些見(jiàn)解,指出人類智能與外在世界互為對(duì)偶問(wèn)題、相互不可分割的根本屬性,因此按人工智能所應(yīng)對(duì)的對(duì)象及關(guān)聯(lián)學(xué)科分為數(shù)學(xué)、物理、心理、意識(shí)4 個(gè)階段。其中第1 階段解決智能形成的通用學(xué)習(xí)算法的數(shù)學(xué)理論,第2 階段發(fā)展應(yīng)對(duì)物理世界的物理智能。以此為基礎(chǔ),第3 階段發(fā)展應(yīng)對(duì)智能涉及社會(huì)群體的高階智能,第4 階段研究自由意識(shí)的本質(zhì)和人工智能能否形成意識(shí)的超智能問(wèn)題。結(jié)合筆者電磁信息感知專業(yè)領(lǐng)域,提出向物理智能發(fā)展的微波視覺(jué)新概念、相關(guān)內(nèi)涵以及關(guān)鍵技術(shù)的建議,以筆者團(tuán)隊(duì)在這一方向的前期工作為例,討論了以物理智能為基礎(chǔ)的智能科學(xué)的研究與發(fā)展。
著名的摩爾定律成功預(yù)測(cè)了集成電路的指數(shù)次增長(zhǎng)規(guī)律,實(shí)際上人類文明和科技的發(fā)展也大致遵循指數(shù)次增長(zhǎng)的規(guī)律。如果把人類社會(huì)發(fā)展史繪制成一條曲線,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為文明和科技水平,那么它就是一條指數(shù)增長(zhǎng)曲線。站在今天回望歷史,不難發(fā)現(xiàn)人類每一次科技革命到來(lái)的時(shí)間間隔在指數(shù)次遞減。例如40年前的個(gè)人計(jì)算機(jī)技術(shù)、100年前的相對(duì)論和量子力學(xué)、500年前的近代科學(xué)起源,又比如兩次工業(yè)革命、農(nóng)業(yè)革命、信息產(chǎn)業(yè)革命等,無(wú)不驗(yàn)證著這一規(guī)律。
有人說(shuō)人工智能是下一次工業(yè)革命,亦或許是人類文明的智能時(shí)代。科技是人類文明的核心之一,文明的進(jìn)步經(jīng)歷了資源、能量、信息、智能的4個(gè)階段(圖1)。冷兵器時(shí)代人類文明依賴于自然資源的優(yōu)勢(shì),熱兵器時(shí)代的制勝點(diǎn)在于核武器等大規(guī)模殺傷性武器,進(jìn)入信息時(shí)代后體現(xiàn)在信息獲取能力上,發(fā)達(dá)國(guó)家依靠偵察、隱身、賽博等信息技術(shù)實(shí)現(xiàn)對(duì)其他國(guó)家的信息不對(duì)稱性優(yōu)勢(shì),可以預(yù)見(jiàn)未來(lái)決勝的是人工智能水平的高低。
信息時(shí)代的關(guān)鍵是全面多類精準(zhǔn)信息快速獲取和反獲取的能力,包括軍事科技的偵察、隱身、對(duì)抗等技術(shù)。在大數(shù)據(jù)獲取能力達(dá)到一定的高度,必須由大數(shù)據(jù)的物理信息進(jìn)一步進(jìn)入到其物理世界背后的意識(shí)世界中,發(fā)展人工智能與超人工智能,實(shí)現(xiàn)對(duì)抗式的智能感知、處理、推演、決策技術(shù),在未來(lái)智能科技時(shí)代占據(jù)領(lǐng)先優(yōu)勢(shì)。
圖1 人類文明發(fā)展的新階段
Fig. 1 New era of human civilization development
10 多年前神經(jīng)網(wǎng)絡(luò)研究先驅(qū)Hinton[1]在《Science》上發(fā)表的一篇論文在人工智能領(lǐng)域引發(fā)了深度學(xué)習(xí)熱潮。谷歌子公司DeepMind開(kāi)發(fā)的AlphaGo[2]以4∶1戰(zhàn)勝了韓國(guó)圍棋九段棋手李世乭,讓人工智能得到了廣泛的關(guān)注。人工智能在過(guò)去10年取得的重大進(jìn)展,主要得益于深度學(xué)習(xí)技術(shù),一種在強(qiáng)大的計(jì)算能力、海量的數(shù)據(jù)支持和改進(jìn)的算法3個(gè)條件下成功實(shí)現(xiàn)突破的人工智能技術(shù)。
短短10年間,深度學(xué)習(xí)引發(fā)了人工智能在各行各業(yè)的研究應(yīng)用熱潮。在信息、生物、材料、化學(xué)等領(lǐng)域均開(kāi)展了深度學(xué)習(xí)的人工智能應(yīng)用研究。在工業(yè)界與政府部門(mén),也紛紛推出重磅計(jì)劃,為人工智能單設(shè)計(jì)劃條目。深度學(xué)習(xí)技術(shù)在各領(lǐng)域均找到了應(yīng)用,從而引起越來(lái)越多的關(guān)注。
然而,深度學(xué)習(xí)技術(shù)背后的理論積累難以支撐爆炸式增長(zhǎng)的技術(shù)發(fā)展和應(yīng)用需求。深度神經(jīng)網(wǎng)絡(luò)背后的理論基本上還是30多年前的人工神經(jīng)網(wǎng)絡(luò)理論,僅在深度表征和訓(xùn)練算法方面有局部突破。智能時(shí)代的來(lái)臨亟需一門(mén)智能科學(xué)支撐。它與腦科學(xué)、認(rèn)知科學(xué)等相關(guān)的諸多人腦功能學(xué)科相關(guān)聯(lián),又直接面對(duì)物理世界與社會(huì)科學(xué)界的應(yīng)用需求。智能科學(xué)的舉步維艱與人工智能技術(shù)應(yīng)用的火爆現(xiàn)象的反差令人回想起前幾次人工智能曾有過(guò)的寒冬。這種嚴(yán)峻的趨勢(shì)也令多位著名學(xué)者進(jìn)行深刻的思考。
本文簡(jiǎn)單討論智能科學(xué)這一新學(xué)科方向,按人工智能所應(yīng)對(duì)的對(duì)象及關(guān)聯(lián)學(xué)科分為數(shù)學(xué)、物理、心理和意識(shí)4個(gè)階段,并在物理智能的范疇下結(jié)合筆者前期研究提出信息感知的微波視覺(jué)新概念、相關(guān)內(nèi)涵及關(guān)鍵技術(shù)。
1 智能科學(xué)
1.1 深度學(xué)習(xí)
深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)是人工智能的一個(gè)主要分支。深度學(xué)習(xí)的主要技術(shù)即深度神經(jīng)網(wǎng)絡(luò),它是人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域新興的研究方向。人工神經(jīng)網(wǎng)絡(luò)通過(guò)將腦科學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、信息處理學(xué)、心理學(xué)等多個(gè)研究領(lǐng)域相互交叉結(jié)合,以建立一個(gè)可以模擬人腦智能的模型。雖然人腦智能研究?jī)H有不到100年的發(fā)展歷史,但已經(jīng)在機(jī)器視覺(jué)、人臉識(shí)別、語(yǔ)音識(shí)別、智能搜索和遺傳編程等領(lǐng)域得到了長(zhǎng)足的發(fā)展,取得了廣泛的十分有意義的應(yīng)用。
人工神經(jīng)網(wǎng)絡(luò)研究起源于20世紀(jì)50年代,最早的人工神經(jīng)網(wǎng)絡(luò)模型只是對(duì)一個(gè)神經(jīng)元接受刺激的響應(yīng)進(jìn)行簡(jiǎn)單的模擬。然而由于理論的缺乏和計(jì)算機(jī)技術(shù)的限制,人工神經(jīng)網(wǎng)絡(luò)并沒(méi)能得到有效的發(fā)展。直到20世紀(jì)80年代,基于后向傳播(BP)機(jī)制的神經(jīng)網(wǎng)絡(luò)得到快速發(fā)展。但是由于訓(xùn)練困難等問(wèn)題,仍然局限于3層的神經(jīng)網(wǎng)絡(luò),可以解決的問(wèn)題很有限。之后,機(jī)器學(xué)習(xí)的主流方法大都是淺層結(jié)構(gòu)算法(如支撐矢量機(jī)),少有人關(guān)注包含3層結(jié)構(gòu)以上的深層算法。
2006年,Hinton[1]提出通過(guò)“貪婪學(xué)習(xí)”的思路,實(shí)現(xiàn)對(duì)多層自編碼器的訓(xùn)練,重新引發(fā)了神經(jīng)網(wǎng)絡(luò)領(lǐng)域?qū)τ谏顚泳W(wǎng)絡(luò)的研究興趣。2012年,Hinton團(tuán)隊(duì)[9]將深度卷積網(wǎng)絡(luò)用于ImageNet圖像分類挑戰(zhàn)賽上,取得遠(yuǎn)高于以往淺層算法的成績(jī),引起機(jī)器學(xué)習(xí)領(lǐng)域的關(guān)注。從此機(jī)器學(xué)習(xí)主流開(kāi)始往多層自動(dòng)學(xué)習(xí)算法偏移,超過(guò)3 層結(jié)構(gòu)以上的機(jī)器學(xué)習(xí)算法被稱為深度學(xué)習(xí)。2016年,谷歌子公司DeepMind將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于強(qiáng)化學(xué)習(xí)上,開(kāi)發(fā)了AlphaGo計(jì)算機(jī)圍棋程序,4∶1擊敗了韓國(guó)圍棋九段棋手李世乭,從而引發(fā)了各界人士的關(guān)注。各行各業(yè)對(duì)于人工智能的興趣開(kāi)始爆炸式增長(zhǎng)。特別是在工業(yè)界,深度學(xué)習(xí)已被廣泛的應(yīng)用在各領(lǐng)域,如計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、機(jī)器翻譯、搜索引擎、自動(dòng)駕駛、機(jī)器人等。
事實(shí)上,深度學(xué)習(xí)目前最成功的算法應(yīng)該是深度卷積網(wǎng)絡(luò)對(duì)于圖像、視頻類空域信息的處理,以及深度循環(huán)網(wǎng)絡(luò)對(duì)于語(yǔ)音、文字類時(shí)間序列信息的處理[4]。例如深度強(qiáng)化學(xué)習(xí)的一些應(yīng)用,均是得益于這2個(gè)核心神經(jīng)網(wǎng)絡(luò)算法對(duì)于原始輸入數(shù)據(jù)的處理。而卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)這兩種網(wǎng)絡(luò)結(jié)構(gòu)早在20世紀(jì)90年代就被提出。可見(jiàn)深度神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)的核心在于“深度”,即用深層結(jié)構(gòu)表征原始數(shù)據(jù)。
深度學(xué)習(xí)的核心思想是層次化的特征提取結(jié)構(gòu)(圖2),例如深度卷積網(wǎng)絡(luò)仿照哺乳動(dòng)物視覺(jué)神經(jīng)系統(tǒng),利用層次化特征提取的信息處理模式。先對(duì)輸入信息進(jìn)行低級(jí)特征提取,在高層將低級(jí)特征組合成更高級(jí)的特征信息,經(jīng)過(guò)多層特征傳遞,得到足夠高級(jí)的特征信息,再計(jì)算最終的輸出。通過(guò)訓(xùn)練,從海量數(shù)據(jù)中自動(dòng)提取所關(guān)心的特征,將數(shù)據(jù)標(biāo)簽映射擬合到一個(gè)高度非線性函數(shù)中。所以,深度神經(jīng)網(wǎng)絡(luò)的本質(zhì)可以看作是一個(gè)多層嵌套的非線性擬合函數(shù),它巧妙地通過(guò)隨機(jī)梯度下降算法將網(wǎng)絡(luò)訓(xùn)練到合適的擬合精度。然而,“深度”的概念也不是最新才提出的,用超過(guò)3層的多層神經(jīng)網(wǎng)絡(luò)來(lái)擬合的方法也早就被嘗試過(guò)。因此學(xué)界普遍認(rèn)為深度學(xué)習(xí)爆發(fā)與3個(gè)偶然因素有關(guān):計(jì)算能力的指數(shù)次增長(zhǎng)、數(shù)據(jù)量的爆炸式增長(zhǎng)和神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)。這3個(gè)條件的成熟使得神經(jīng)網(wǎng)絡(luò)邁入了深度學(xué)習(xí)的階段,因而能解決更接近實(shí)際應(yīng)用的復(fù)雜問(wèn)題。從這個(gè)角度看,深度學(xué)習(xí)的出現(xiàn)對(duì)于智能科學(xué)而言僅僅是量變,還沒(méi)有達(dá)到質(zhì)變。
圖2 深度學(xué)習(xí)的主要思想:層次化可組合的特征表征框架
Fig. 2 Key idea of deep learning: hierarchical compositional framework of feature representation
回顧歷史可以發(fā)現(xiàn),21世紀(jì)初出現(xiàn)的計(jì)算能力的增長(zhǎng)和數(shù)據(jù)量的增長(zhǎng)使得訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)成為可能,而算法的改進(jìn)一直到近幾年來(lái)才出現(xiàn)的。從2006年Hinton提出的多層自編碼網(wǎng)絡(luò)直到2012年的深度卷積網(wǎng)絡(luò)之間并沒(méi)有出現(xiàn)很成功的應(yīng)用,而從2012年之后,視覺(jué)計(jì)算的最成功應(yīng)用均采用深度卷積網(wǎng)絡(luò),說(shuō)明深度神經(jīng)網(wǎng)絡(luò)的核心算法改進(jìn)發(fā)生在2006—2012年。
2006年,Hinton提出的“貪婪算法”訓(xùn)練多層自編碼器引領(lǐng)了一批專家去研究深度神經(jīng)網(wǎng)絡(luò),包括LeCun和Bengio等。深度神經(jīng)網(wǎng)絡(luò)之所以取得巨大成功,筆者認(rèn)為其最核心算法改進(jìn)在于采用了一類簡(jiǎn)化的激活函數(shù),即規(guī)則化線性單元(rectified linear unit,ReLU)。由圖3可知,ReLU本質(zhì)上是分段線性函數(shù)y=max(0,x)。類似ReLU的激活函數(shù)事實(shí)上早在1975年即被提出[5],但是在1980年代被Sigmoid等具有良好非線性、連續(xù)可導(dǎo)、梯度計(jì)算復(fù)雜度低等優(yōu)點(diǎn)的激活函數(shù)全面取代。一直到2009年,LeCun團(tuán)隊(duì)[6]在研究深度神經(jīng)網(wǎng)絡(luò)時(shí),發(fā)現(xiàn)采用類ReLU的分段線性激活函數(shù)是實(shí)現(xiàn)對(duì)深度網(wǎng)絡(luò)端到端訓(xùn)練的關(guān)鍵因素。2011年,Bengio團(tuán)隊(duì)[7-8]研究得到結(jié)論:深度神經(jīng)網(wǎng)絡(luò)最適合用ReLU作為激活函數(shù),給出的理由包括ReLU與人腦神經(jīng)元的相似性,因?yàn)樯窠?jīng)元對(duì)某些輸入完全沒(méi)有反應(yīng),而對(duì)一些輸入的反應(yīng)呈單調(diào)關(guān)系,每一時(shí)刻處在激活狀態(tài)的神經(jīng)元總是稀疏的。這些工作為2012年Hinton團(tuán)隊(duì)[3]首次采用深度卷積網(wǎng)絡(luò)贏得ImageNet 挑戰(zhàn)賽奠定了理論基礎(chǔ)。
圖3 2種激活函數(shù)(Sigmoid,ReLU)及其單層、多層梯度比較
Fig. 3 Two types of activation function (Sigmoid, ReLU) and their single-layer, multi-layer gradients
關(guān)于ReLU優(yōu)點(diǎn),圖3給出一種簡(jiǎn)單的解釋,即其梯度在多層網(wǎng)絡(luò)后向傳播時(shí)能保持穩(wěn)定,不像Sigmoid的梯度在累乘后容易達(dá)到飽和。關(guān)于ReLU的理論研究在2012年后還在繼續(xù),例如2015年LeCun團(tuán)隊(duì)[9]證明了深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中的局部最小值均為較優(yōu)解,且很容易被隨機(jī)梯度下降算法找到,由此在理論上,它解釋了深度神經(jīng)網(wǎng)絡(luò)取得巨大成功的一個(gè)主要原因。
可以看出,深度神經(jīng)網(wǎng)絡(luò)的本質(zhì)是采用很多層嵌套的非線性函數(shù)來(lái)擬合海量的數(shù)據(jù),監(jiān)督學(xué)習(xí)即擬合高維數(shù)據(jù)空間中的一個(gè)曲面,而非監(jiān)督學(xué)習(xí)如生成網(wǎng)絡(luò)則擬合一種分布。至目前為止,真正解決實(shí)際應(yīng)用問(wèn)題的深度學(xué)習(xí)技術(shù),無(wú)論在網(wǎng)絡(luò)結(jié)構(gòu)上有各種各樣的創(chuàng)新,或者在訓(xùn)練優(yōu)化算法上有各種各樣的設(shè)計(jì),都逃脫不了一個(gè)模式,即用海量的訓(xùn)練數(shù)據(jù)擬合一個(gè)包含海量未知數(shù)的復(fù)雜多層網(wǎng)絡(luò)。
因此,筆者完全贊同圖靈獎(jiǎng)獲得者Judea Pearl的觀點(diǎn):無(wú)論深度學(xué)習(xí)技術(shù)取得多大成功,各種相關(guān)研究多么五花八門(mén),我們還沒(méi)有突破其曲線/曲面擬合的本質(zhì)[10]。不少學(xué)者已經(jīng)開(kāi)始反思深度學(xué)習(xí)面臨的困境,由于其背后基礎(chǔ)理論積累不足,深度學(xué)習(xí)技術(shù)很快就陷入一個(gè)瓶頸期。現(xiàn)在的深度學(xué)習(xí)相關(guān)技術(shù)過(guò)于簡(jiǎn)單,以致可以完全被計(jì)算機(jī)掌握,由于各種工具箱的出現(xiàn)使得絕大多數(shù)人可以輕易掌握深度神經(jīng)網(wǎng)絡(luò)應(yīng)用技能,絕大多數(shù)人掌握這些技能后便快速陷入調(diào)參數(shù)、調(diào)結(jié)構(gòu)的瓶頸。顯然,這本身就是一份機(jī)械的工作,可以被人工智能取代。果然,谷歌公司于2018年初推出的AutoML工具即扮演了調(diào)參的角色,使得一大部分應(yīng)用深度神經(jīng)網(wǎng)絡(luò)的人被深度神經(jīng)網(wǎng)絡(luò)取代。谷歌公司最新開(kāi)發(fā)的AlphaGo Zero新版圍棋程序也證明了靠機(jī)械的搜索來(lái)獲得較優(yōu)解決方案的工作也可以被取代。可以預(yù)見(jiàn),更多的在研究網(wǎng)絡(luò)結(jié)構(gòu)和優(yōu)化算法的科研人員也將被取代。深度學(xué)習(xí)技術(shù)的出現(xiàn),預(yù)示著缺乏創(chuàng)造力的機(jī)械工作將會(huì)被取代。
因此,深度學(xué)習(xí)出現(xiàn)的意義首先是很好地利用了數(shù)據(jù)資源優(yōu)勢(shì),實(shí)現(xiàn)超強(qiáng)擬合能力,解決各個(gè)領(lǐng)域的實(shí)際應(yīng)用問(wèn)題。其次它引發(fā)了人們對(duì)于人工智能技術(shù)的廣泛關(guān)注,引領(lǐng)了一個(gè)大力研究智能科技的時(shí)代。然而,深度學(xué)習(xí)的超強(qiáng)擬合能力導(dǎo)致人們的期望過(guò)高,如果智能科學(xué)的基礎(chǔ)理論遲遲沒(méi)有突破,很快深度學(xué)習(xí)或人工智能就會(huì)跟不上人們對(duì)它的期望。
1.2 智能科學(xué)的誕生
人工智能深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用必將要求智能科學(xué)的誕生。智能科學(xué)應(yīng)是一門(mén)區(qū)別于自然科學(xué)和社會(huì)科學(xué)的嶄新學(xué)科。它的誕生不僅僅與深度學(xué)習(xí)技術(shù)爆發(fā)有關(guān),而且與腦科學(xué)、認(rèn)知科學(xué)、理論神經(jīng)科學(xué)、數(shù)據(jù)科學(xué)的發(fā)展密切相關(guān),智能科學(xué)甚至還與一般自然科學(xué)和社會(huì)科學(xué)相關(guān),這些學(xué)科是智能科學(xué)的前奏和基石。
智能科學(xué)是人工智能背后的基礎(chǔ)科學(xué),人工智能是建立于智能科學(xué)之上的一門(mén)應(yīng)用學(xué)科。首先需要關(guān)心的是人工智能需要什么樣的科學(xué)支撐。社會(huì)學(xué)家將廣義人工智能分為3類:弱人工智能和強(qiáng)人工智能和超人工智能。弱人工智能是指擅長(zhǎng)某一方面的人工智能,現(xiàn)階段發(fā)展的人工智能就是弱人工智能。強(qiáng)人工智能指的是與人類比肩的人工智能,人類能做的事情它都能做。超人工智能就是科幻世界中經(jīng)常出現(xiàn)的智力超越人類的人造機(jī)器。人工智能的目標(biāo)可以歸納為4點(diǎn)——像人一樣行動(dòng)、像人一樣思考、合理地思考、合理地行動(dòng)。如果要使機(jī)器能像人一樣思考的話,必須先弄清楚人類是如何思考的。這本身就是一件復(fù)雜而有趣的工作。有3種辦法可以完成這項(xiàng)任務(wù):通過(guò)內(nèi)省——反思人類的思維方式;通過(guò)心理實(shí)驗(yàn)——觀察被測(cè)對(duì)象,然后總結(jié);以及通過(guò)腦成像——觀察大腦的活動(dòng)規(guī)律。然而,直到今天,人類對(duì)于自己大腦的運(yùn)作原理以及人類思維等的認(rèn)識(shí)仍然不足,認(rèn)知科學(xué)還有諸多問(wèn)題有待解決。
當(dāng)前深度網(wǎng)絡(luò)的巨大應(yīng)用成功僅僅發(fā)源于人們對(duì)于視覺(jué)神經(jīng)網(wǎng)絡(luò)的理解和仿生。大腦和智能作為至今人類還沒(méi)有研究透徹的領(lǐng)域,不斷引起了科技界,乃至工業(yè)界和政府部門(mén)的重視。系統(tǒng)的腦科學(xué)研究主要分為自底向上的生物學(xué)研究和自頂向下的理論神經(jīng)科學(xué)或認(rèn)知科學(xué)研究,神經(jīng)生物學(xué)通過(guò)生物觀測(cè)實(shí)驗(yàn)手段從微觀層面開(kāi)始,不斷向上積累基礎(chǔ)知識(shí),試圖理解整個(gè)大腦的工作機(jī)制,例如通過(guò)神經(jīng)元細(xì)胞切片的觀察,一直到宏觀尺度的大腦活動(dòng)功能核磁共振(fMRI)成像等,神經(jīng)生物學(xué)研究目前無(wú)法徹底理解大腦工作機(jī)制,主要局限于對(duì)活體大腦實(shí)時(shí)活動(dòng)的微觀觀察手段的缺乏,近年來(lái)發(fā)展的熒光標(biāo)記高分辨率光學(xué)成像技術(shù)將是該領(lǐng)域下一個(gè)突破口。理論神經(jīng)科學(xué)或認(rèn)知科學(xué)研究通過(guò)對(duì)人類宏觀行為的理解建立數(shù)學(xué)理論模型以圖仿制大腦智能。理論神經(jīng)科學(xué)仿照牛頓物理學(xué)首先從數(shù)學(xué)上對(duì)大腦工作機(jī)制進(jìn)行建模,通過(guò)假設(shè)的基本規(guī)律來(lái)逐步解釋更復(fù)雜的大腦工作機(jī)制,與生物學(xué)手段比起來(lái),理論神經(jīng)科學(xué)的研究一直停滯不前。實(shí)驗(yàn)觀測(cè)和理論建模必須有效結(jié)合,才能得到可靠的進(jìn)展。例如通過(guò)觀測(cè)發(fā)現(xiàn)的脈沖時(shí)間相關(guān)可塑性(SDTP)機(jī)制被認(rèn)為是記憶和學(xué)習(xí)的神經(jīng)化學(xué)基礎(chǔ),對(duì)于神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建具有重要推動(dòng)作用。除了系統(tǒng)的腦科學(xué)研究,目前提及最多的是更接近應(yīng)用層面的類腦人工智能算法(即深度學(xué)習(xí))及其實(shí)現(xiàn)(即神經(jīng)網(wǎng)絡(luò)芯片),以及機(jī)器人外圍技術(shù)(如機(jī)械骨架、仿生材料)。當(dāng)前類腦人工智能算法與真正意義上的神經(jīng)生物學(xué)的結(jié)合不夠緊密,這將是下一代人工智能發(fā)展的方向之一。而機(jī)器人外圍技術(shù)由于其在工業(yè)生產(chǎn)、家庭護(hù)理、國(guó)家安全等領(lǐng)域的重要應(yīng)用得到重視,在人工智能技術(shù)的推動(dòng)下,機(jī)器人可以實(shí)現(xiàn)的功能已快速接近以前只有在科幻世界中才出現(xiàn)的場(chǎng)景。
美國(guó)、歐盟、中國(guó)均已經(jīng)或即將推出各自的大腦研究計(jì)劃和人工智能戰(zhàn)略,在神經(jīng)生物學(xué)、類腦人工智能技術(shù)等方面開(kāi)展研究。解開(kāi)大腦的奧秘是開(kāi)啟未來(lái)智能世界的關(guān)鍵,是未來(lái)科技發(fā)展的戰(zhàn)略制高點(diǎn),誰(shuí)掌握人工智能,誰(shuí)將成為未來(lái)核心技術(shù)的掌控者。
人工智能及其相關(guān)技術(shù)日新月異,每周都有相關(guān)突破性進(jìn)展報(bào)道。但是如前論述,深度學(xué)習(xí)本質(zhì)即為超強(qiáng)函數(shù)擬合,其技術(shù)紅利可能將很快被用盡。顯然,目前的人工智能依舊處于弱人工智能范疇,走向強(qiáng)人工智能和超人工智能的道路依舊一團(tuán)迷霧。在這個(gè)過(guò)程中,需要先解開(kāi)大腦思維的奧秘,發(fā)展系統(tǒng)的智能科學(xué)。就像看到鳥(niǎo)的展翅飛翔,有了人類飛行的萌芽,但要發(fā)明飛機(jī),則要發(fā)展現(xiàn)代航空力學(xué)與航空工業(yè)。
多名學(xué)者針對(duì)深度學(xué)習(xí)的火爆現(xiàn)象進(jìn)行了冷靜思考,并提出智能科學(xué)的研究建議。深度學(xué)習(xí)的引領(lǐng)人物也不停在反思,Hinton等[11]在深度學(xué)習(xí)進(jìn)入火熱的現(xiàn)象后,一直在思考,最近提出要推翻后向傳播梯度下降的算法,認(rèn)為人腦不是靠梯度下降學(xué)習(xí),提出“膠囊網(wǎng)絡(luò)”的新概念。LeCun[12]針對(duì)機(jī)器學(xué)習(xí)的發(fā)展也提出無(wú)監(jiān)督學(xué)習(xí)與預(yù)測(cè)學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)大方向。
此外,深度學(xué)習(xí)也受到來(lái)自機(jī)器學(xué)習(xí)其他領(lǐng)域?qū)W者的質(zhì)疑,比如谷歌公司的Rahimi[13]在第31屆神經(jīng)信息處理系統(tǒng)大會(huì)(NIPS 2017)上公開(kāi)將當(dāng)前深度學(xué)習(xí)的研究比喻為“煉金術(shù)”,其本意就是批評(píng)當(dāng)前大量的深度學(xué)習(xí)研究?jī)H僅浮于網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的不斷調(diào)整嘗試上,而沒(méi)有試圖建立一門(mén)基于嚴(yán)謹(jǐn)、周密、可驗(yàn)證的理論之上的科學(xué)。
正如人人會(huì)做的釀酒術(shù),并不能容易產(chǎn)生近代化學(xué)一樣。LeCun認(rèn)為:工程總是先于理論,就像望遠(yuǎn)鏡先于光學(xué)、蒸汽機(jī)先于熱動(dòng)力學(xué)、計(jì)算機(jī)先于計(jì)算科學(xué)等。對(duì)于此,麻省理工學(xué)院Poggio[14]則認(rèn)為當(dāng)前深度學(xué)習(xí)太依賴于數(shù)據(jù),應(yīng)該回歸到理解人類智能上來(lái),即腦科學(xué)和神經(jīng)科學(xué),比如首先解釋人腦智能是如何產(chǎn)生的這樣的根本科學(xué)問(wèn)題。
2011 年圖靈獎(jiǎng)獲得者、貝葉斯網(wǎng)絡(luò)的先驅(qū)JudeaPearl[10]最近發(fā)表論文闡述了機(jī)器學(xué)習(xí)理論的可能發(fā)展方向,認(rèn)為當(dāng)前深度學(xué)習(xí)的本質(zhì)即函數(shù)擬合,其所關(guān)聯(lián)的數(shù)據(jù)科學(xué)也只跟數(shù)據(jù)有關(guān)并沒(méi)有科學(xué)。Pearl認(rèn)為強(qiáng)人工智能的正確途徑是引入因果關(guān)系,他將其分為關(guān)聯(lián)(association)、交互(intervention)和想象(counterfactu?al)3個(gè)層面(圖4[10])。當(dāng)前深度學(xué)習(xí)僅停留在關(guān)聯(lián)的層面,在交互的層面需要引入互動(dòng)并觀察其因果關(guān)系,而在想象層面則需要具備邏輯推理能力。最后,他提出應(yīng)采用他本人發(fā)明的用于描述因果關(guān)系的貝葉斯網(wǎng)絡(luò)等數(shù)學(xué)工具來(lái)研究下一步的強(qiáng)人工智能。
圖4 Pearl的3層因果關(guān)系
Fig. 4 Pearl's three layers of casual relationship
加州大學(xué)洛杉磯分校朱崧純[15]對(duì)人工智能從現(xiàn)狀、任務(wù)到構(gòu)架與統(tǒng)一進(jìn)行了系統(tǒng)的闡述。他將人工智能學(xué)科分為6個(gè)方向:計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解與交流、認(rèn)知與推理和機(jī)器人學(xué)、博弈與倫理和機(jī)器學(xué)習(xí)。他對(duì)于人工智能的一個(gè)觀點(diǎn)也是與數(shù)據(jù)依賴性有關(guān),認(rèn)為人工智能不應(yīng)該依賴大量數(shù)據(jù),更應(yīng)該關(guān)注人腦內(nèi)在因素。認(rèn)為智能科學(xué)是牛頓與達(dá)爾文理論體系的統(tǒng)一,提出應(yīng)該把面向應(yīng)用的人工智能變成智能科學(xué)。他提出一個(gè)很好的觀點(diǎn):“物理學(xué)把生物的意志排除在研究之外,而這正好是智能科學(xué)要研究的對(duì)象。智能科學(xué)要研究的是一個(gè)物理與生物混合的復(fù)雜系統(tǒng)。智能作為一種現(xiàn)象,就表現(xiàn)在個(gè)體與自然、社會(huì)群體的相互作用和行為過(guò)程中。我個(gè)人相信這些行為和現(xiàn)象必然有統(tǒng)一的力、相互作用、基本元素描述。”這是筆者所了解到的對(duì)智能科學(xué)最深邃的見(jiàn)解之一。
1.3 智能科學(xué)與物理智能
智能科學(xué)是智能時(shí)代所必須的支撐基礎(chǔ)科學(xué),它的內(nèi)涵遠(yuǎn)不止當(dāng)前的深度學(xué)習(xí)技術(shù)。智能科學(xué)應(yīng)以人腦為支點(diǎn),研究人與自然世界、人與人類社會(huì)的多體問(wèn)題。但智能科學(xué)不能是孤立的研究人腦的科學(xué)。人腦是進(jìn)化和后天學(xué)習(xí)的產(chǎn)物,生物進(jìn)化給予人類一套可塑的神經(jīng)組織,通過(guò)人與世界和社會(huì)的交互才形成了人類智能。人腦本身的結(jié)構(gòu)組成和工作機(jī)制離不開(kāi)外界對(duì)它的影響。可以想象一個(gè)初生的嬰兒若一直孤獨(dú)地生存在太空中,不與任何物質(zhì)或信息交互,則不可能具備人類智能。所以說(shuō),人類智能是外在世界對(duì)人腦施加作用后所產(chǎn)生的反作用,外在世界與人腦智能是一雙對(duì)偶問(wèn)題。現(xiàn)有科學(xué)已經(jīng)對(duì)外在世界建立較為成熟的理論體系。
因此智能科學(xué)應(yīng)是一門(mén)以人腦為中心,研究人腦與自然世界相互作用、人腦與人腦相互作用,人腦與人類社會(huì)相互作用的學(xué)科。它不僅依賴于一套能描述人腦原理的數(shù)學(xué)理論,還需結(jié)合用于描述自然世界單體問(wèn)題的自然科學(xué)和用于描述人類社會(huì)單體問(wèn)題的社會(huì)科學(xué)。
按這一觀點(diǎn)將人工智能分為下面4個(gè)階段。
第1個(gè)階段研究對(duì)象為人類智能的大腦原生組織結(jié)構(gòu),即自然進(jìn)化賜予人類的可塑神經(jīng)網(wǎng)絡(luò),借助于腦科學(xué)與計(jì)算神經(jīng)科學(xué)等,發(fā)展一套可以建模大腦原生組織結(jié)構(gòu)的數(shù)學(xué)工具,可以稱之為數(shù)學(xué)智能。這一階段的目的是用數(shù)學(xué)和計(jì)算工具描述和模擬初生嬰兒大腦的通用組織結(jié)構(gòu)和通用學(xué)習(xí)算法。
第2個(gè)階段研究對(duì)象為外在物理世界加到人腦的“外力”導(dǎo)致在人腦中產(chǎn)生的“應(yīng)力”,即人腦與物理世界交互后學(xué)會(huì)的適應(yīng)物理世界并在其中生存的能力,可以稱之為物理智能。物理智能即能適應(yīng)客觀世界的人工智能,如機(jī)器人。構(gòu)造物理智能必須依賴數(shù)學(xué)智能和物理學(xué)。人類建立起來(lái)的強(qiáng)大的物理學(xué)理論體系有助于構(gòu)造強(qiáng)于人類的物理智能,即比人類更適應(yīng)物理世界的智能體,本文第2節(jié)討論的微波視覺(jué)即屬于這一范疇。物理智能可以推廣到廣義的自然智能,即研究能夠適應(yīng)各種自然科學(xué)現(xiàn)象的人工智能。
第3個(gè)階段研究對(duì)象為他人或社會(huì)對(duì)于人腦的“外力”與所產(chǎn)生的“應(yīng)力”,即人腦如何學(xué)會(huì)與他人相處、如何在人類社會(huì)中適應(yīng)和生存的能力,可以稱之為心理智能,或廣義的社會(huì)智能。這個(gè)階段研究智能與智能之間的高階相互作用,也可稱為高階智能;則物理智能屬于一階智能,因?yàn)槠溲芯糠懂犞簧婕皢蝹€(gè)智能體。
每個(gè)階段還應(yīng)該研究對(duì)應(yīng)的人腦原生的驅(qū)動(dòng)力,如生理需求、心理需求等,這些需求是驅(qū)動(dòng)通用人工智能算法進(jìn)行正確學(xué)習(xí)的必要源動(dòng)力。
第4個(gè)階段研究對(duì)象為意識(shí)的本質(zhì),意識(shí)如何形成是一個(gè)根本科學(xué)問(wèn)題,人工智能是否能產(chǎn)生意識(shí)更是一個(gè)哲學(xué)問(wèn)題,這一根本問(wèn)題的研究有助于解答人類一直尋求的答案:人是從哪里來(lái)的。有一點(diǎn)可以肯定是:沒(méi)有自我意識(shí)的人工智能不可能超越人類。
這種分類方法(圖5)體現(xiàn)了智能在進(jìn)化生長(zhǎng)過(guò)程不同階段中所應(yīng)對(duì)的對(duì)象不同。當(dāng)前智能科學(xué)相關(guān)的研究往往不特別區(qū)分這些階段,而這個(gè)分階段的生長(zhǎng)過(guò)程卻定義了智能本質(zhì)。人類智能就是循序漸進(jìn)的從先適應(yīng)客觀世界的物理智能,發(fā)展到適應(yīng)人類社會(huì)的心理智能。人工智能的發(fā)展也應(yīng)遵循這一規(guī)律。先建立一種通用的人工智能算法,能夠建模人類大腦的基本機(jī)能,如學(xué)習(xí)、記憶等。這種算法與物理世界交互即可產(chǎn)生物理智能,例如機(jī)器人能夠應(yīng)對(duì)牛頓力學(xué)。不同階段的研究可以并行進(jìn)行,如在數(shù)學(xué)智能沒(méi)有完全研究成熟之前可以進(jìn)行相應(yīng)的物理智能研究。例如基于現(xiàn)階段的深度神經(jīng)網(wǎng)絡(luò)理論,可以結(jié)合計(jì)算物理進(jìn)行基于深度學(xué)習(xí)的物理智能研究。數(shù)學(xué)智能與物理智能可以相互補(bǔ)充、相互促進(jìn)。人工智能來(lái)源于人類智能但完全有可能在某些方面超越人類,就像人類學(xué)鳥(niǎo)飛發(fā)明飛機(jī),而飛機(jī)卻超越鳥(niǎo)類,當(dāng)然也超越了不會(huì)飛的人類的能力;顯然,已經(jīng)建立的物理學(xué)理論體系可以幫助人們發(fā)明在某一方面超越人類的物理智能。
圖5 未來(lái)智能科學(xué)體系
Fig. 5 Architecture of future intelligent science
通過(guò)2個(gè)途徑,人們可能構(gòu)建超越人類的物理智能:1)借助物理學(xué)對(duì)于物理世界的嚴(yán)謹(jǐn)理論表述,我們可以將物理原理設(shè)計(jì)在人工智能中,使其具備比人類更強(qiáng)的適應(yīng)或戰(zhàn)勝物理世界的能力;2)采用計(jì)算物理模擬器來(lái)訓(xùn)練通用人工智能算法,使其具備人類不可能擁有的超能力。第1點(diǎn)類似于在人工智能大腦內(nèi)部用計(jì)算物理引擎構(gòu)建1個(gè)模型來(lái)幫助預(yù)測(cè)外部世界。關(guān)于第2點(diǎn),谷歌AlphaGo Zero算法的成功給人們一定的信心,通過(guò)在圍棋模擬器上學(xué)習(xí)3天即超過(guò)人類3000年的集體智慧,說(shuō)明模擬器訓(xùn)練是一種可行的途徑。
因此,計(jì)算物理模擬器是物理智能的關(guān)鍵。采用模擬器構(gòu)建物理智能的途徑利用了人類發(fā)展史上的2次革命成果:1)科學(xué)革命建立了人類對(duì)于物理世界規(guī)律精確表述的理論和技術(shù)創(chuàng)新;2)信息革命建立了人類利用計(jì)算機(jī)對(duì)物理世界規(guī)律進(jìn)行計(jì)算仿真的能力。這相當(dāng)于將人類千年的智慧匯集到一個(gè)人工智能大腦中。物理智能將超越人類智能,因?yàn)槲锢韺W(xué)描述的現(xiàn)象超越人類感官范疇。例如,物理學(xué)涵蓋的尺度范圍和速度范圍遠(yuǎn)超過(guò)人類能適應(yīng)的范圍,電磁波涵蓋的頻譜遠(yuǎn)超過(guò)人類能感知的光譜范圍(圖6)。
圖6 物理智能在適應(yīng)物理世界的能力上將超越人類智能
Fig. 6 Physical intelligence will excel over human being in adapting to the physical world
作為物理智能一個(gè)典型的例子,通過(guò)力學(xué)模型構(gòu)建的人工智能可以完美地控制機(jī)器人的運(yùn)動(dòng)。另一個(gè)例子就是“微波視覺(jué)”,一種基于計(jì)算電磁學(xué)引擎的物理智能,像人類處理光信息一樣處理微波信息。
2 微波視覺(jué)
2.1 內(nèi)涵
人的視覺(jué)能看見(jiàn)光,但看不見(jiàn)微波。若有外星人的眼睛能看見(jiàn)微波,那他就有“微波眼睛”,他的視覺(jué)神經(jīng)中樞必與人類視覺(jué)不同,可稱為“微波視覺(jué)”。第二次世界大戰(zhàn)期間發(fā)明的雷達(dá)等技術(shù)已使人類感受到微波的信息,是否也能發(fā)展基于人工智能的信息感知與理解的“微波視覺(jué)”?
在陽(yáng)光下歷經(jīng)億年進(jìn)化,人類形成與生俱來(lái)的適應(yīng)光學(xué)信息的大腦,初生嬰兒的大腦再通過(guò)其與光學(xué)世界交互進(jìn)行學(xué)習(xí),最終形成能感知世界、認(rèn)識(shí)自我的人類視覺(jué)。人類視覺(jué)能高效理解光學(xué)信息、實(shí)現(xiàn)自主定位導(dǎo)航,同時(shí)還是產(chǎn)生自我意識(shí)的關(guān)鍵因素。
深度學(xué)習(xí)前沿技術(shù)AlphaGo Zero給予人們啟發(fā),智能算法與虛擬圍棋世界的交互和學(xué)習(xí)可以獲得超越人類的智能。早期AlphaGo版本采用人類棋譜進(jìn)行學(xué)習(xí)與訓(xùn)練,AlphaGo Zero版本則完全通過(guò)在圍棋游戲模擬器里面相互對(duì)弈,然后相互學(xué)習(xí)優(yōu)化,經(jīng)過(guò)3天的學(xué)習(xí)就達(dá)到了人類冠軍的水平。AlphaGo Zero達(dá)到這一成績(jī)的核心前提條件在于模擬器精確的模擬了圍棋游戲世界的規(guī)則,也就是說(shuō)如果有一個(gè)能精確模擬物理世界的模擬器,相信人們也能用現(xiàn)有深度學(xué)習(xí)技術(shù)訓(xùn)練出實(shí)用的人工智能。
顯然,物理智能的其中一種途徑(或者說(shuō)當(dāng)前可行的途徑)就是用精確高效的計(jì)算物理模擬器訓(xùn)練基于深度學(xué)習(xí)的人工智能,而這樣的思想已經(jīng)在國(guó)際上得以推行。例如在自動(dòng)駕駛領(lǐng)域的絕大多數(shù)企業(yè)都在使用虛擬現(xiàn)實(shí)模擬器和真實(shí)采集的數(shù)據(jù)一起訓(xùn)練自動(dòng)駕駛算法。2017 年底,美國(guó)美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)啟動(dòng)“進(jìn)攻性蜂群使能戰(zhàn)術(shù)”OFFSET研究項(xiàng)目,旨在研發(fā)能自動(dòng)控制上百架無(wú)人機(jī)進(jìn)行協(xié)同作戰(zhàn)的人工智能技術(shù)。該項(xiàng)目的主要技術(shù)途徑即依賴虛擬現(xiàn)實(shí)飛行模擬器AirSim訓(xùn)練這一人工智能技術(shù)。
基于現(xiàn)有深度學(xué)習(xí)技術(shù),可以發(fā)展適應(yīng)電磁信息的認(rèn)知智能算法,并用超算模擬電磁世界,通過(guò)與電磁模擬器的交互進(jìn)行演化學(xué)習(xí),實(shí)現(xiàn)人造微波視覺(jué)。研究微波視覺(jué)能自動(dòng)解譯雷達(dá)圖像、復(fù)雜電磁環(huán)境等微波信息,實(shí)現(xiàn)微波視覺(jué)自主定位導(dǎo)航,為探索意識(shí)本質(zhì)提供基礎(chǔ)。
圖7闡述了微波視覺(jué)的主要構(gòu)思,光視覺(jué)是人在光世界中進(jìn)化和學(xué)習(xí)獲得,而我們提出通過(guò)模擬電磁(微)波世界,實(shí)現(xiàn)相類似光視覺(jué)但又截然不同電磁信息感知認(rèn)知的微波視覺(jué)。主要技術(shù)途徑是借鑒Alpha?Go/OFFSET、基于電磁學(xué)理論,構(gòu)建微波世界模擬器,用于演化和訓(xùn)練微波視覺(jué)。
圖7 微波視覺(jué)的概念與內(nèi)涵
Fig. 7 Microwave vision
借鑒人腦的光視覺(jué)發(fā)展人工智能的微波視覺(jué),人腦產(chǎn)生光視覺(jué)的3個(gè)必要條件是:外在光學(xué)世界的存在;自然進(jìn)化產(chǎn)生的光視覺(jué)神經(jīng)網(wǎng)絡(luò);人與光世界交互學(xué)習(xí)演化的能力。因此發(fā)展微波視覺(jué)需要研究對(duì)應(yīng)3個(gè)問(wèn)題:高性能電磁物理模擬器、處理電磁信息的微波視覺(jué)神經(jīng)網(wǎng)絡(luò)、智能體與電磁模擬器的交互學(xué)習(xí)機(jī)制,這3個(gè)問(wèn)題分別構(gòu)成了微波視覺(jué)的電磁物理基礎(chǔ)、神經(jīng)生物基礎(chǔ)和認(rèn)知學(xué)習(xí)基礎(chǔ),稱之為微波視覺(jué)三要素。
1)微波視覺(jué)的電磁物理基礎(chǔ)——準(zhǔn)實(shí)時(shí)高逼真的電磁物理模擬器。
首先解決微波視覺(jué)的虛擬訓(xùn)練環(huán)境問(wèn)題,為微波視覺(jué)的進(jìn)化和學(xué)習(xí)提供虛擬環(huán)境。這一問(wèn)題的關(guān)鍵體現(xiàn)在既要實(shí)現(xiàn)高逼真度的模擬效果,又要在資源約束條件下滿足準(zhǔn)實(shí)時(shí)交互的要求,這是采用虛擬環(huán)境訓(xùn)練人工智能的可行性條件。若采用精確幾何物理建模和現(xiàn)有計(jì)算電磁學(xué)方法,其模型精細(xì)度難以在有限人力條件下做到高逼真要求,算法復(fù)雜度無(wú)法達(dá)到準(zhǔn)實(shí)時(shí)要求。突破這一瓶頸的思路是將觀測(cè)大數(shù)據(jù)同化到計(jì)算物理模型中,研究數(shù)據(jù)驅(qū)動(dòng)的電磁模擬器,通過(guò)大數(shù)據(jù)挖掘提取半經(jīng)驗(yàn)底層散射模型,進(jìn)一步發(fā)展混合多尺度計(jì)算電磁學(xué)方法,實(shí)現(xiàn)既能提高仿真逼真度、又能降低算法復(fù)雜度、滿足準(zhǔn)實(shí)時(shí)交互的需求。
2)微波視覺(jué)的神經(jīng)生物基礎(chǔ)——處理電磁信息的微波視覺(jué)神經(jīng)網(wǎng)絡(luò)。
人類進(jìn)化的視覺(jué)神經(jīng)網(wǎng)絡(luò)適應(yīng)于光信息處理,需要設(shè)計(jì)專門(mén)表征處理電磁信息的微波視覺(jué)神經(jīng)網(wǎng)絡(luò)。以視覺(jué)神經(jīng)網(wǎng)絡(luò)底層組織、環(huán)路和網(wǎng)絡(luò)結(jié)構(gòu)為啟發(fā),對(duì)比光信息與微波信息,仿照設(shè)計(jì)構(gòu)建電磁信息神經(jīng)網(wǎng)絡(luò),體現(xiàn)從以粒子效應(yīng)為主到波場(chǎng)效應(yīng)為主的物理屬性轉(zhuǎn)變。解決神經(jīng)元如何表征電磁信息的時(shí)、頻、相、極化等多維度特征,神經(jīng)信息傳遞機(jī)制如何體現(xiàn)電磁波相干散射與傳播規(guī)律,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如何契合電磁散射逆問(wèn)題求解模式等微波視覺(jué)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)問(wèn)題。設(shè)計(jì)用于結(jié)構(gòu)化表征的深度生成網(wǎng)絡(luò)和用于反演的深度鑒別網(wǎng)絡(luò)等基本組件。
3)認(rèn)知學(xué)習(xí)基礎(chǔ)——智能體與電磁模擬器交互學(xué)習(xí)機(jī)制。
光視覺(jué)是人腦視覺(jué)神經(jīng)網(wǎng)絡(luò)與外在光世界交互學(xué)習(xí)演化的產(chǎn)物,基于交互的學(xué)習(xí)機(jī)制是突破通用人工智能須解決的根本問(wèn)題。盡管腦科學(xué)這方面研究相對(duì)滯后,現(xiàn)階段的微波視覺(jué)研究可參考已知人類光視覺(jué)的學(xué)習(xí)機(jī)制和運(yùn)作機(jī)制,如視覺(jué)注意、視覺(jué)印象、視角關(guān)聯(lián)、預(yù)測(cè)推斷等,受它們啟發(fā)研究如何建立具備注意、記憶、關(guān)聯(lián)、預(yù)測(cè)等功能的微波視覺(jué)強(qiáng)化學(xué)習(xí)架構(gòu)。借鑒視覺(jué)神經(jīng)認(rèn)知機(jī)制,探求如何設(shè)計(jì)交互式迭代學(xué)習(xí)算法,按訓(xùn)練和測(cè)試2個(gè)階段分別研究不同交互機(jī)制,在訓(xùn)練階段的交互以采樣為目的,測(cè)試階段的交互以實(shí)時(shí)預(yù)測(cè)反演為目的。
“微波視覺(jué)”與人類長(zhǎng)期依靠的“光視覺(jué)”不同,它的產(chǎn)生將顛覆傳統(tǒng)的雷達(dá)信號(hào)處理與以光視覺(jué)為基礎(chǔ)的圖像處理技術(shù),將使目前似乎看不見(jiàn)摸不著的微波監(jiān)測(cè)成為“微波視覺(jué)”中看得清理解透的新的技術(shù)形態(tài),如自主定位導(dǎo)航、電子偵查對(duì)抗等電磁波技術(shù)。微波視覺(jué)將實(shí)現(xiàn)天地海目標(biāo)雷達(dá)回波圖像在線自動(dòng)解譯,改變目前地面站人工判讀業(yè)務(wù)形態(tài);實(shí)現(xiàn)雷達(dá)回波直接重構(gòu)目標(biāo)與場(chǎng)景的可視化表征,顛覆傳統(tǒng)電磁信號(hào)處理、雷達(dá)回波圖像解譯的思維與方法;實(shí)現(xiàn)直接對(duì)散射輻射場(chǎng)的視覺(jué)語(yǔ)義概念生成、推理、決策和交互,改變現(xiàn)有雷達(dá)、偵查、干擾對(duì)抗的技術(shù)形態(tài);實(shí)現(xiàn)基于微波視覺(jué)的智能自主定位導(dǎo)航,補(bǔ)充傳統(tǒng)視覺(jué)導(dǎo)航技術(shù)。
微波視覺(jué)將是從基本理論到多種關(guān)鍵技術(shù)再到廣泛應(yīng)用的體系化研究,面臨多個(gè)維度的挑戰(zhàn)。理論上需解決微波視覺(jué)的根本科學(xué)問(wèn)題,包括如何理解智能與物理世界交互的機(jī)制,如何實(shí)現(xiàn)高效電磁模擬器,如何使用模擬器構(gòu)建微波視覺(jué)。在技術(shù)上需解決技術(shù)難題包括大規(guī)模場(chǎng)景與目標(biāo)的快速計(jì)算仿真、無(wú)限解空間的搜索與學(xué)習(xí)、視覺(jué)的交互學(xué)習(xí)算法以及而向應(yīng)用的各種方法等。
2.2 前期研究
復(fù)旦大學(xué)電磁波信息科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室長(zhǎng)期從事電磁散射機(jī)制、微波遙感圖像解譯和參數(shù)反演等研究,前期在微波視覺(jué)相關(guān)領(lǐng)域特別是合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像快速仿真、智能解譯和目標(biāo)識(shí)別方面做了相關(guān)研究工作。
合成孔徑雷達(dá)能夠全天時(shí)、全天候、高分辨率成像,因此適用于目標(biāo)的偵察、監(jiān)視和識(shí)別,同時(shí)也已經(jīng)被廣泛應(yīng)用于地球科學(xué)、天氣變化與環(huán)境系統(tǒng)監(jiān)測(cè)、海洋資源利用、行星探測(cè)、戰(zhàn)場(chǎng)偵察等領(lǐng)域,是空間遙感的前沿技術(shù)。由于其微波波段成像和相位相干處理的特性,SAR圖像與光學(xué)圖像表現(xiàn)不同,難以直觀解讀。事實(shí)上,SAR圖像包含了豐富的目標(biāo)信息,例如幾何形狀、材質(zhì)、結(jié)構(gòu)等。SAR圖像解譯和信息獲取是在軌雷達(dá)衛(wèi)星實(shí)現(xiàn)成功應(yīng)用的最后決定性的一步。
遙感大數(shù)據(jù)時(shí)代下的SAR圖像解譯是一個(gè)極大的科學(xué)應(yīng)用挑戰(zhàn)。大數(shù)據(jù)時(shí)代的智能方法如計(jì)算機(jī)視覺(jué)技術(shù)目前已經(jīng)取得很大的成功,但是需要發(fā)展先進(jìn)的SAR微波雷達(dá)智能信息獲取方法。每天都有海量的數(shù)據(jù)從太空返回而等待處理,需要強(qiáng)大的解譯和信息獲取方法。
微波視覺(jué)的物理基礎(chǔ)在于準(zhǔn)實(shí)時(shí)高逼真的電磁物理模擬平臺(tái),復(fù)旦大學(xué)電磁波信息科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室開(kāi)發(fā)的POLSAR EYES仿真平臺(tái)(圖8)采用雙向解析射線追蹤算法,并在通用圖形處理器上大規(guī)模并行實(shí)現(xiàn),可實(shí)現(xiàn)準(zhǔn)實(shí)時(shí)的大規(guī)模地物場(chǎng)景與目標(biāo)的SAR成像仿真,包括上百平方公里的地形起伏、覆蓋地物如植被等以及人工目標(biāo)如建筑物、船只等。
(a)射線追蹤仿真引擎(b)大規(guī)模地物目標(biāo)虛擬場(chǎng)景
(c)準(zhǔn)實(shí)時(shí)仿真的極化SAR圖像(d)真實(shí)機(jī)載極化SAR圖像
圖8 POLSAR EYES準(zhǔn)實(shí)時(shí)大規(guī)模地物場(chǎng)景與地物的SAR仿真
Fig. 8 POLSAR EYES: Near-real time SAR simulation platform for large-scale terrain scene and targets
SAR圖像中自動(dòng)目標(biāo)識(shí)別是一個(gè)關(guān)鍵應(yīng)用,也是最適合利用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)的。采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)10類地面車輛SAR數(shù)據(jù)集進(jìn)行分類,取得較好效果(圖9)[16]。針對(duì)SAR圖像數(shù)據(jù)比較少、對(duì)觀測(cè)條件敏感等特點(diǎn),直接用SAR數(shù)據(jù)訓(xùn)練CNN很容易出現(xiàn)過(guò)擬合的問(wèn)題。因?yàn)镃NN自由參數(shù)太多,但訓(xùn)練樣本不充足,這就導(dǎo)致了嚴(yán)重的過(guò)擬合。CNN中絕大部分的可訓(xùn)練參數(shù)都包含在全連接層,通過(guò)用卷積層取代全連接層,而不是大量地減少網(wǎng)絡(luò)的層數(shù),減少需要訓(xùn)練的參數(shù)。盡管這種改變降低了網(wǎng)絡(luò)的表示能力,但是也大大減小了過(guò)擬合。在標(biāo)準(zhǔn)測(cè)試集(觀測(cè)條件、目標(biāo)配置幾乎不變)上取得99%的分類精度,而在擴(kuò)展測(cè)試集(觀測(cè)條件、目標(biāo)配置發(fā)生變化)上分類精度有一定下降但仍比傳統(tǒng)方法具有優(yōu)勢(shì)。由此可以明顯看到現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)過(guò)度依賴訓(xùn)練數(shù)據(jù)的缺陷。
(a) (b)
圖9 全卷積網(wǎng)絡(luò)(a)及其在MSTAR數(shù)據(jù)集訓(xùn)練得到的卷積核和特征圖(b)
Fig. 9 (a) AConvNet; (b) Convolutional kernel and feature maps trained on MSTAR dataset
將CNN用于多極化SAR地物分類中,發(fā)現(xiàn)可以取得比傳統(tǒng)方法更好的效果[17]。對(duì)于地物分類而言,其應(yīng)用模式與圖像分割非常類似,因此可以按像素選擇局域窗口進(jìn)行訓(xùn)練和測(cè)試,訓(xùn)練樣本數(shù)量遠(yuǎn)大于目標(biāo)識(shí)別的情形,但要求訓(xùn)練樣本與測(cè)試樣本的觀測(cè)條件和地物類型保持一致。同時(shí)也測(cè)試了CNN地表分類器的通用性,圖10顯示了2個(gè)不同地點(diǎn)不同時(shí)間采集的極化SAR圖像經(jīng)過(guò)同一分類器得到的結(jié)果性能一致,說(shuō)明了CNN地表分類器具有較好的泛化性能。
(a)光學(xué)影像
(b)ALOS2圖像
(c)分類結(jié)果圖
圖10 用CNN分類的ALOS極化SAR圖像及其分類結(jié)果和對(duì)比光學(xué)影像
Fig. 10 Classification of ALOS POLSAR image with CNN
對(duì)于多通道相干的SAR圖像,如極化SAR或干涉SAR,其通道間相干相位差帶有重要信息。因此針對(duì)帶相位信息的SAR圖像,將CNN推廣到了復(fù)數(shù)域,稱為復(fù)數(shù)卷積網(wǎng)絡(luò)(complex-valued-CNN,CV-CNN)[18]。為了區(qū)分,實(shí)數(shù)神經(jīng)網(wǎng)絡(luò)可稱為real-valued CNN(RVCNN)。特別是如極化SAR和干涉SAR,均包含了不同通道之間的相位差,該相位信息不再是完全隨機(jī)的,往往隱含了散射地物的位置、形狀、散射機(jī)制的信息,這些信息對(duì)地物分類和識(shí)別至關(guān)重要。CV-CNN不僅將復(fù)數(shù)數(shù)據(jù)作為輸入,同時(shí)對(duì)各層傳遞了相位信息,也即每層的神經(jīng)元信息和權(quán)重均由復(fù)數(shù)表示,神經(jīng)元操作以及學(xué)習(xí)算法均推廣至復(fù)數(shù)域。對(duì)比實(shí)驗(yàn)結(jié)果表明,在相同未知數(shù)規(guī)模下,采用復(fù)數(shù)輸入按復(fù)數(shù)計(jì)算的CV-CNN和將實(shí)部虛部作為2個(gè)獨(dú)立實(shí)數(shù)輸入的RVCNN相比,CV-CNN 能有效提高網(wǎng)絡(luò)性能,對(duì)于極化SAR地表分類中,其錯(cuò)誤率可以降低2/3以上(圖11)[18]。
(a)
(b)
圖11 CV-CNN架構(gòu)(a)及用于等效對(duì)比實(shí)驗(yàn)的CV-CNN和RV-CNN(b)
Fig. 11 CV-CNN architecture (a) and the comparison between CV-CNN and RV-CNN with similar degrees of freedom(b)采用神經(jīng)網(wǎng)絡(luò)的方法還可以由單極化或雙極化SAR圖像重構(gòu)全極化SAR圖像(圖12)。采用多尺度卷積網(wǎng)絡(luò)提取單極化SAR圖像上的空域特征,通過(guò)訓(xùn)練將其轉(zhuǎn)化到極化特征,然后重構(gòu)出對(duì)應(yīng)的多極化SAR圖像,稱為對(duì)灰度雷達(dá)圖像填上顏色[19]。該方法首先利用預(yù)訓(xùn)練的CNN從單極化灰度雷達(dá)圖像中提取多尺度空域特征矢量,然后訓(xùn)練一個(gè)全連接深度網(wǎng)絡(luò)將空域特征空間映射到極化域特征空間,由此得到每個(gè)像素的極化散射矩陣。
圖12 從單極化SAR圖像中重構(gòu)全極化散射矩陣的深度網(wǎng)絡(luò)架構(gòu)
Fig. 12 Deep neural networks used to reconstruct full polarimetric scattering matrix from single-pol SAR imageSAR圖像中的相干斑抑制是理解SAR圖像的基本處理步驟。筆者還提出了基于卷積網(wǎng)絡(luò)的SAR相干斑濾波網(wǎng)絡(luò)[20]。如圖13所示,將SAR圖像鄰域窗口輸入CNN訓(xùn)練其預(yù)測(cè)當(dāng)前像素的真實(shí)散射系數(shù)的分布,而訓(xùn)練該網(wǎng)絡(luò)所需要的真實(shí)散射系數(shù)分布的真值標(biāo)簽難以獲得,因此基于相干斑乘積模型,設(shè)計(jì)了可以非監(jiān)督訓(xùn)練的目標(biāo)函數(shù),即將預(yù)測(cè)散射系數(shù)的對(duì)數(shù)分布與理想相干斑的對(duì)數(shù)分布進(jìn)行卷積再使其等于輸入SAR圖像塊像素值的對(duì)數(shù)分布。該網(wǎng)絡(luò)架構(gòu)對(duì)于仿真和真實(shí)SAR圖像進(jìn)行測(cè)試均得到理想效果。
圖13 用于SAR圖像相干斑抑制的深度卷積網(wǎng)絡(luò)架構(gòu)
Fig. 13 Deep convolutional neural network for SAR speckle reduction
用于訓(xùn)練樣本的SAR圖像往往并不充分,筆者提出基于生成網(wǎng)絡(luò)的零樣本學(xué)習(xí)方法,采用生成網(wǎng)絡(luò)來(lái)層次化表征SAR圖像特征,由此構(gòu)建連續(xù)的可解釋的特征空間,通過(guò)將SAR圖像映射到該特征空間來(lái)實(shí)現(xiàn)對(duì)于未知樣本的解譯[21]。圖14(a)為深度生成網(wǎng)絡(luò)架構(gòu),由構(gòu)造網(wǎng)絡(luò)、生成網(wǎng)絡(luò)和解譯網(wǎng)絡(luò)3部分組成,分別進(jìn)行從已知目標(biāo)標(biāo)簽到特征空間的映射、從特征空間到圖像空間的生成,以及從未知目標(biāo)圖像空間到特征空間的映射;圖14(b)給出的即是對(duì)MSTAR中7類已知目標(biāo)經(jīng)過(guò)生成網(wǎng)絡(luò)學(xué)習(xí)后構(gòu)造的二維特征空間及其中的目標(biāo)分布。
(a)
(b)
圖14 用于零樣本學(xué)習(xí)SAR目標(biāo)特征空間的深度生成網(wǎng)絡(luò)架構(gòu)
Fig. 14 Deep generative neural network for zero-shot learning of SAR target feature space
基于SAR目標(biāo)重構(gòu)傳統(tǒng)的方法,將被觀察目標(biāo)重構(gòu)成人類可以直接理解的表征,即三維幾何形狀和一些可識(shí)別的特點(diǎn),重構(gòu)的幾何結(jié)構(gòu)應(yīng)保留目標(biāo)識(shí)別用到的關(guān)鍵特征。相對(duì)于SAR自動(dòng)目標(biāo)識(shí)別的,SAR目標(biāo)重構(gòu)的2個(gè)關(guān)鍵優(yōu)勢(shì)在于:不僅局限對(duì)已知目標(biāo)庫(kù)的識(shí)別,應(yīng)對(duì)所有目標(biāo)都適用;因此也不需要對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。這樣的方法必須直接從物理模型中提煉出來(lái),因?yàn)橹挥形锢硪?guī)律才具有普適性。提出一個(gè)分層框架實(shí)現(xiàn)SAR目標(biāo)重構(gòu)[22],如圖15所示,該框架由2層組成:基礎(chǔ)層,首先提取和識(shí)別原始散射機(jī)制,包括模型參數(shù)的估計(jì);高級(jí)層,組合孤立散射體而進(jìn)一步重構(gòu)得到完整幾何結(jié)構(gòu)。
圖15 SAR目標(biāo)重構(gòu)框架
Fig. 15 Framework for SAR target reconstruction
如何利用人工智能技術(shù)進(jìn)一步發(fā)展SAR圖像智能解譯是亟需研究的課題。圖16給出一種數(shù)據(jù)驅(qū)動(dòng)和模型約束下的SAR智能解譯框架[23],深度學(xué)習(xí)技術(shù)本身必須由海量數(shù)據(jù)驅(qū)動(dòng),但是往往人們忽視了模型的作用,也就是將先驗(yàn)知識(shí)融合到智能算法中。特別是針對(duì)SAR圖像這樣的電磁波散射物理過(guò)程的產(chǎn)物,需要融合電磁散射理論和機(jī)器學(xué)習(xí)理論,將物理規(guī)律等先驗(yàn)知識(shí)體現(xiàn)在智能解譯算法中。這一目的可由模型、數(shù)據(jù)和算法三者協(xié)作達(dá)成:模型可以產(chǎn)生模擬數(shù)據(jù),實(shí)測(cè)數(shù)據(jù)可以同化模型中,同時(shí)模型可以直接對(duì)機(jī)器學(xué)習(xí)算法進(jìn)行正則化約束。這一思路即是物理智能/微波視覺(jué)的一個(gè)例子。
圖16 數(shù)據(jù)驅(qū)動(dòng)-模型約束下的SAR智能解譯
Fig. 16 SAR intelligent interpretation with data drivenmodel constraint
3 結(jié)論
深度學(xué)習(xí)引發(fā)人類社會(huì)進(jìn)入智能時(shí)代,智能時(shí)代迫切需要智能科學(xué),然而完整的智能科學(xué)體系還不明朗。筆者認(rèn)為智能科學(xué)是與自然科學(xué)和社會(huì)科學(xué)并列的大領(lǐng)域,并不局限于研究人類智能的腦科學(xué)。由于智能形成的因素和存在的必要條件,智能科學(xué)的范疇?wèi)?yīng)該與自然科學(xué)與社會(huì)科學(xué)是對(duì)偶問(wèn)題,因此三者應(yīng)該相結(jié)合進(jìn)行交叉研究。例如物理智能是一類典型的智能科學(xué)研究,即建立人工智能能適應(yīng)甚至戰(zhàn)勝物理世界。
物理智能是一個(gè)重要的智能科學(xué)研究領(lǐng)域,通過(guò)物理學(xué)與智能科學(xué)交叉研究能應(yīng)對(duì)物理世界的人工智能。物理智能應(yīng)與現(xiàn)有物理學(xué)緊密結(jié)合進(jìn)行研究,特別是某些超越人類感官范疇、能力范圍的領(lǐng)域,依賴于人類已建立的描述物理世界的精確理論體系,物理智能將超越人類感官范疇、超越人腦計(jì)算能力,其中微波視覺(jué)技術(shù)即旨在研發(fā)處理微波頻段電磁信息的人工智能技術(shù)。物理智能的研究應(yīng)該與智能科學(xué)的進(jìn)展同時(shí)開(kāi)展,例如在現(xiàn)階段就可以利用虛擬世界模擬器來(lái)訓(xùn)練深度學(xué)習(xí)技術(shù),從而實(shí)現(xiàn)如自動(dòng)駕駛、智能蜂群或微波視覺(jué)的實(shí)用技術(shù)。
參考文獻(xiàn)(References)
[1] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.[2] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. Nature, 2016, 529(7587): 484-489.
[3] Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks[J]. Advances in Neural Information Processing Systems, 2012, 25(2): 1097-1105.
[4] LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[5] Fukushima K. Cognitron: A self-organizing multilayered neural network[J]. Biological Cybernetics, 1975, 20(3-4): 121-136.
[6] Jarrett K, Kavukcuoglu K, Ranzato M, et al. What is the best multi-stage architecture for object recognition?[C]//IEEE, Inter?national Conference on Computer Vision. Piscataway NJ: IEEE, 2010: 2146-2153.
[7] Glorot X, Bengio Y. Understanding the difficulty of training deep feedforward neural networks[J]. Journal of Machine Learning Research, 2010, 9: 249-256.
[8] Glorot X, Bordes A, Bengio Y. Deep sparse rectifier neural networks[J]. Journal of Machine Learning Research, 2012, 15: 315-323.
[9] Choromanska A, Henaff M, Mathieu M, et al. The loss surface of multilayer networks[J]. Arxiv.org, 2014, arXiv:1412.0233
[10] Pearl J. Theoretical impediments to machine learning with seven sparks from the causal revolution[J/OL]. [2018- 03- 20].
http://www.cse-lab.ethz.ch/wp-content/uploads/2014/09/Judea_Pearl_GREAT.pdf.
[11] Sabour S, Frosst N, Hinton G E. Dynamic routing between capsules[J/OL]. [2018- 03- 20]. http://papers.nips.cc/paper/6975-dynamic-routing-between-capsules.pdf.
[12] LeCun Y. Predictive learning[EB/OL]. [2018-03-20]. https://www.youtube.com/watch?v=Qi1Yry33TQE.
[13] Ali Rahimi's talk at NIPS [EB/OL]. [2018-03-20]. https://www.youtube.com/watch?v=Ount2Y4qxQo.
[14] 周翔. Tomaso Poggio: 深度學(xué)習(xí)需要從煉金術(shù)走向化學(xué)[EB/OL]. (2018- 01- 28) [2018- 03- 20]. http://www.sohu.com/a/219443091_697750. Zhou Xiang. Tomaso Poggio: Deep learning from alchemy to chemistry[EB/OL]. (2018-01-28)[2018-03-20]. http://www.sohu.com/a/219443091_697750.
[15] 朱崧純. 淺談人工智能: 現(xiàn)狀、任務(wù)、構(gòu)架與統(tǒng)一[EB/OL].
(2017- 11- 02) [2018- 03- 20]. https://mp.weixin.qq.com/s/-wSYLu-XvOrsST8_KEUa-Q.
[16] Chen S, Wang H, Xu F, et al. Target classification using the deep convolutional networks for SAR images[J]. IEEE Transactions on Geoscience & Remote Sensing, 2016, 54(8): 4806-4817.
[17] Zhou Y, Wang H, Xu F, et al. Polarimetric SAR image classification using deep convolutional neural networks[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 13(12): 1935-1939.
[18] Zhang Z, Wang H, Xu F, et al. Complex-valued convolutional neural network and its application in polarimetric SAR image classification[J]. IEEE Transactions on Geoscience & Remote Sensing, 2017, 55(12): 7177-7188.
[19] Song Q, Xu F, Jin Y Q. Radar image colorization: Converting single-polarization to fully polarimetric using deep neural networks[J]. arXiv.org, 2017, arXiv:1707.07225.
[20] YueD, Xu F, Jin Y Q. Deep despeckling neural network for SAR images[J]. International Journal of Remote Sensing, 2018, in press.
[21] Song Q, Xu F. Zero-shot learning of SAR target feature space with deep generative neural networks[J]. IEEE Geoscience & Remote Sensing Letters, 2017, 14(12): 2245-2249.
[22] Xu F, Jin Y Q, Moreira A. A preliminary study on SAR advanced information retrieval and scene reconstruction[J]. IEEE Geoscience & Remote Sensing Letters, 2016, 13(10): 1443-1447.
[23] 徐豐, 王海鵬, 金亞秋. 深度學(xué)習(xí)在SAR目標(biāo)識(shí)別與地物分類中的應(yīng)用[J]. 雷達(dá)學(xué)報(bào), 2017, 6(2): 136-148.
Xu Feng, Wang Haipeng, Jin Yaqiu. Deep learning as applied in sar target recognition and terrain classification[J]. Journal of Radars, 2017, 6(2): 136-148.
作者: 徐豐1,2,金亞秋1,2
1. 復(fù)旦大學(xué)電磁大數(shù)據(jù)與遙感智能研究所,上海200433 2. 復(fù)旦大學(xué)電磁波信息科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室
來(lái)源:科技導(dǎo)報(bào)