人工智能(AI)技術(shù)作為未來最有想象空間的技術(shù),近來獲得了極大的關(guān)注。國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》,彰顯了從國家層面推動(dòng)AI戰(zhàn)略的決心和信心。這種信心來自于過去5年中國科研力量在AI領(lǐng)域的快速發(fā)展和取得的卓越成就。

人工智能
這一波AI熱潮由2012年的ILSVRC(ImageNet大規(guī)模視覺識別挑戰(zhàn)賽)開始在學(xué)術(shù)界興起,到今年5月谷歌的AI圍棋程序AlphaGo以3∶0完勝世界排名第一的柯潔,從而讓萬眾矚目。在這5年間,中國的學(xué)術(shù)界和企業(yè)及時(shí)地把握住了技術(shù)發(fā)展的趨勢,利用中國特有的產(chǎn)業(yè)優(yōu)勢迅速提升技術(shù)研發(fā)水平,目前在算法和應(yīng)用方面已經(jīng)站在世界前列。在核心芯片研發(fā)方面也反應(yīng)迅速,奠定了良好的產(chǎn)業(yè)化基礎(chǔ)。對于AI領(lǐng)域來說,算法和芯片都是應(yīng)用的基礎(chǔ),而充足的人才是保證技術(shù)升級可以真正推動(dòng)產(chǎn)業(yè)升級的決定性因素。本文分別從算法、芯片、應(yīng)用、人才等四方面回顧5年來我們?nèi)〉玫某晒?,分析機(jī)會和差距,最后對未來提出展望。
提算法水平
這次AI熱潮歸功于深度學(xué)習(xí)算法(一種使用多層神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法)。深度學(xué)習(xí)的鼻祖杰夫·辛頓在2012年NIPS上發(fā)表文章,報(bào)道了通過訓(xùn)練大型的深度卷積神經(jīng)網(wǎng)絡(luò)把ILSVRC2010訓(xùn)練集中的130萬張圖像分為了1000個(gè)不同的類別,并且大幅降低了誤差率。隨后,深度神經(jīng)網(wǎng)絡(luò)日益流行,并出現(xiàn)了多種優(yōu)秀變體,比如AlexNet、GoogLeNet、VGG Net、ResNet。2016年發(fā)表的ResNet就是由微軟亞洲研究院的中國團(tuán)隊(duì)發(fā)明的。
深度神經(jīng)網(wǎng)絡(luò)的特點(diǎn)是需要大量的標(biāo)注數(shù)據(jù)來訓(xùn)練模型。因?yàn)槟P头浅4螅?xùn)練過程也需要大量的計(jì)算資源。因此,學(xué)術(shù)界和企業(yè)界結(jié)合是最優(yōu)的研發(fā)方式。擁有優(yōu)質(zhì)數(shù)據(jù)來源的企業(yè)吸引了很多優(yōu)秀研究人員加入或者進(jìn)行合作,例如百度、騰訊、科大訊飛、??低暤?。百度和科大訊飛率先進(jìn)行深度學(xué)習(xí)方面的研發(fā),分別實(shí)施了“百度大腦”和“訊飛超腦”計(jì)劃,快速提高深度學(xué)習(xí)的算法能力,在多個(gè)領(lǐng)域達(dá)到國際先進(jìn)水平。百度于2016年開源了PaddlePaddle深度學(xué)習(xí)平臺,是國際上繼Google、Facebook、IBM后第一家將人工智能技術(shù)開源的中國公司??拼笥嶏w在感知智能、認(rèn)知智能以及兩者的深度結(jié)合等領(lǐng)域均達(dá)到國際領(lǐng)先水平,如國際最高水平的語音合成比賽Blizzard Challenge(暴風(fēng)雪競賽)七項(xiàng)指標(biāo)全部全球第一和參加第四屆CHiME Challenge國際多通道語音分離和識別大賽獲取全部三項(xiàng)賽事的第一名。這表明科大訊飛在中文語音識別系統(tǒng)保持絕對領(lǐng)先的同時(shí),其英語語音識別系統(tǒng)同樣達(dá)到國際領(lǐng)先水平。此外,AI領(lǐng)域的明星創(chuàng)業(yè)公司,如曠視科技、商湯科技、云知聲、思必馳等,聚焦在深度學(xué)習(xí)最擅長的視覺識別和語音識別領(lǐng)域,推動(dòng)中國相關(guān)領(lǐng)域的技術(shù)水平達(dá)到國際一流。
中國學(xué)者在發(fā)表AI學(xué)術(shù)論文、申請專利和參加國際競賽方面成果斐然。Elsevier的SCOPUS數(shù)據(jù)庫中的數(shù)據(jù)顯示,2011~2015年,中國學(xué)者在AI領(lǐng)域出版的論文數(shù)量排名世界第一,創(chuàng)下了超過4.1萬個(gè)出版物的記錄(美國第二,約為2.55萬篇;日本第三,約為1.17萬篇)。自2016年以來的論文發(fā)表數(shù)量仍繼續(xù)上升,并且華人學(xué)者在頂級國際學(xué)術(shù)會議中擔(dān)任重要角色的比率也越來越高。中國研究人員發(fā)起的專利申請,近年來也上漲了兩倍。在近3年的ILSVRC視覺識別競賽中,中國團(tuán)隊(duì)獲得冠軍的比率也越來越高。在2017年度ILSVRC競賽上,來自中國大學(xué)和企業(yè)的AI團(tuán)隊(duì)將各項(xiàng)比賽第一名全部包攬,而且參賽的27個(gè)隊(duì)伍,其中超過一半來自中國。這些成就表明我國在AI算法研究方面有巨大潛力,影響力擴(kuò)大到全球。
目前的差距在于,雖然論文數(shù)量和專項(xiàng)比賽已位居前列,但AI基礎(chǔ)科研的整體影響力還不夠,在加權(quán)引文影響力上只排名34位。發(fā)表超過500篇論文的獨(dú)立科研機(jī)構(gòu),中國也只有中科院自動(dòng)化研究所上榜。目前具有全球影響力的人工智能學(xué)者也大都聚集在北美。彌補(bǔ)這個(gè)差距需要中國研究人員的集體努力。現(xiàn)在已經(jīng)呈現(xiàn)出很好的趨勢,例如中國機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物南京大學(xué)的周志華教授當(dāng)選為AAAI2019大會的程序委員會主席。從量變到質(zhì)變,中國研究人員在國際AI研究領(lǐng)域的影響力在未來5年會大大提升。
增芯片實(shí)力
AI產(chǎn)業(yè)的規(guī)?;l(fā)展離不開芯片的支持,而且這更加迫切。因?yàn)樯疃葘W(xué)習(xí)對計(jì)算力和內(nèi)存容量、速度的要求都很高,芯片業(yè)界近年來一直在用最新的架構(gòu)和高密度、高并行、可擴(kuò)展的計(jì)算和存儲能力來支持人工智能的研究。國際巨頭如英特爾、英偉達(dá)、谷歌都推出了各自的芯片產(chǎn)品。可喜的是,在高端芯片設(shè)計(jì)這個(gè)中國傳統(tǒng)弱項(xiàng)上,中國研究人員在AI領(lǐng)域提前布局,深入探索專用芯片(ASIC)、現(xiàn)場可編程芯片(FPGA)和類腦計(jì)算芯片,已經(jīng)取得了令人矚目的成績。
依托于中國科學(xué)院計(jì)算所的寒武紀(jì)科技公司在深度學(xué)習(xí)流行之初,為解決深度學(xué)習(xí)發(fā)展瓶頸的速度和能效問題,敏銳地確立了為其設(shè)計(jì)專用的加速指令集和芯片架構(gòu)的研究點(diǎn),2016年3月,他們提出的深度學(xué)習(xí)處理器指令集DianNaoYu被計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域頂級國際會議ISCA2016所接收,其評分排名為所有近300篇投稿的第一名。同年11月,他們的深度學(xué)習(xí)處理器架構(gòu)概述論文“DianNao Family: Energy-Efficient Hardware Accelerators for Machine Learning”(DianNao系列:高能效機(jī)器學(xué)習(xí)硬件)刊發(fā)于《國際計(jì)算機(jī)學(xué)會通訊》(Communications of the ACM)的研究焦點(diǎn)欄目。這是中國大陸的研究工作首次入選該欄目。目前,寒武紀(jì)的深度學(xué)習(xí)專用芯片已經(jīng)進(jìn)入產(chǎn)業(yè)化階段,有望加速智能手機(jī)、安防監(jiān)控、可穿戴設(shè)備、無人機(jī)和智能駕駛等各類終端設(shè)備。
異軍突起的還有深鑒科技和地平線機(jī)器人這兩家初創(chuàng)公司。他們分別在FPGA芯片和專用芯片領(lǐng)域深度整合算法和硬件設(shè)計(jì)來對深度學(xué)習(xí)和其他人工智能算法進(jìn)行加速。2015年年底,浙江大學(xué)與杭州電子科技大學(xué)合作研制成功國內(nèi)首款類腦芯片“達(dá)爾文”,大小為5×5平方毫米,是一款采用標(biāo)準(zhǔn)CMOS工藝實(shí)現(xiàn)的基于脈沖神經(jīng)網(wǎng)絡(luò)的類腦硬件協(xié)處理器(類腦芯片)。今年5月,由中國科學(xué)技術(shù)大學(xué)承建的全國首個(gè)類腦智能技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室在合肥成立,該實(shí)驗(yàn)室將通過研究腦認(rèn)知與神經(jīng)計(jì)算、類腦多模態(tài)感知與信息處理,實(shí)現(xiàn)類腦神經(jīng)芯片與系統(tǒng)、類腦計(jì)算系統(tǒng)和量子人工智能的三大突破,最終形成類腦智能產(chǎn)業(yè)。
擴(kuò)應(yīng)用領(lǐng)域
AI算法的突破和核心芯片研發(fā)的推進(jìn),為產(chǎn)業(yè)應(yīng)用打下了堅(jiān)實(shí)的基礎(chǔ)。在新技術(shù)的大規(guī)模產(chǎn)業(yè)應(yīng)用方面,中國在互聯(lián)網(wǎng)時(shí)代已經(jīng)與世界同步,在移動(dòng)互聯(lián)網(wǎng)時(shí)代更是居于世界領(lǐng)先地位。通過前面5年大力推動(dòng)“互聯(lián)網(wǎng)+”,已經(jīng)將生產(chǎn)、交易、物流、金融、消費(fèi)、社交等諸多領(lǐng)域活動(dòng)的大量數(shù)據(jù)融入數(shù)字化網(wǎng)絡(luò),并且中國的無線通信覆蓋率和智能城市建設(shè)為數(shù)據(jù)的采集、傳輸、處理、增值提供了世界領(lǐng)先的基礎(chǔ)設(shè)施支持。未來5年將進(jìn)入AI應(yīng)用爆發(fā)的階段。目前,不論是傳統(tǒng)企業(yè)還是新興企業(yè)都在積極進(jìn)入這一領(lǐng)域,通過采用AI技術(shù)來提升效率和創(chuàng)造全新的客戶價(jià)值。
海康威視是傳統(tǒng)企業(yè)利用AI轉(zhuǎn)型的典范。海康威視是視頻監(jiān)控廠商,得益于中國全面建設(shè)平安城市的契機(jī)和自身研發(fā)實(shí)力的不斷增強(qiáng),今年的市場份額已躍升為全球第一。他們將視覺識別算法能力作為公司的核心競爭力,早在3年前就開始重兵投入深度學(xué)習(xí)研發(fā),目前不僅在ILSVRC視覺識別競賽中拔得頭籌,更把先進(jìn)的AI算法部署在解決方案中。同時(shí),??低暦e極與國際領(lǐng)先的芯片公司(如英特爾)合作,把最先進(jìn)的嵌入式AI芯片應(yīng)用在系統(tǒng)中,大幅提升智能視覺監(jiān)控的響應(yīng)度和網(wǎng)絡(luò)使用效率。
新興行業(yè)有更多應(yīng)用AI的機(jī)會。例如電商在限時(shí)促銷期間,因?yàn)榫蘖拷灰淄瑫r(shí)發(fā)生,無法通過人工審核大量提交的圖片,必須使用AI來輔助。去年“雙11”時(shí),京東和英特爾合作利用加速的AI算法將審核效率提高了4倍。在互聯(lián)網(wǎng)金融領(lǐng)域,螞蟻金服通過分析大量交易數(shù)據(jù),智能地為客戶推薦和定制金融服務(wù)。初創(chuàng)公司第四范式與銀行業(yè)合作,采用超高維的機(jī)器學(xué)習(xí)建模技術(shù),全面精細(xì)地刻畫用戶信用卡交易行為,為每筆交易評估風(fēng)險(xiǎn)分值,避免交易欺詐。
追人才差距
AI未來發(fā)展的關(guān)鍵是人才和數(shù)據(jù)。中國有豐富的數(shù)據(jù)資源,但我們的數(shù)據(jù)科學(xué)家和AI人才還遠(yuǎn)遠(yuǎn)不夠。近年來,一流大學(xué)和研究所,包括外企在華研究院(如英特爾、微軟、IBM等),都在加大AI人才培養(yǎng)的力度。目前,根據(jù)領(lǐng)英最新發(fā)布的全球AI人才地圖,全球AI人才超190萬人,其中美國的人才約占全球總量的半壁江山,超過85萬人,而中國的AI人才約5萬多人,具備研究生以上學(xué)歷的超過60%,排名全球第7。另外,我國的AI人才很多是近5年培養(yǎng)起來的,從業(yè)10年以上的不到四成,而美國有七成以上是10年以上的AI老手。未來5年,我國需要快速彌補(bǔ)這個(gè)差距。由于僅在美國就有近7萬名華人AI人才,超過目前中國AI人才的總量,所以走出去是快速彌補(bǔ)人才差距的捷徑。中國企業(yè)(如百度、騰訊、海康威視等)已經(jīng)積極在海外建立研究院,延攬全球AI人才。除了通過科研領(lǐng)域培養(yǎng)基礎(chǔ)層的AI人才,還需要在產(chǎn)業(yè)實(shí)踐中培養(yǎng)大量的應(yīng)用層人才,才能促進(jìn)規(guī)?;漠a(chǎn)業(yè)升級。近來英特爾等大企業(yè)提出的“AI民主化”戰(zhàn)略就是要降低AI技術(shù)的使用難度,讓使用AI和大數(shù)據(jù)分析技術(shù)就像Web編程一樣方便。
展望未來
由數(shù)據(jù)、計(jì)算力和算法三方合力推動(dòng)的這波AI浪潮大有可為,未來的10年、20年都將是AI大放光彩的時(shí)代。過去5年是起跑階段,政府、學(xué)術(shù)界和產(chǎn)業(yè)界統(tǒng)一了合力推動(dòng)AI產(chǎn)業(yè)的思想,在算法、芯片、應(yīng)用和人才方面都提升巨大,為實(shí)現(xiàn)中國在2030年成為世界主要人工智能創(chuàng)新中心打下了堅(jiān)實(shí)的基礎(chǔ)。未來5年是AI產(chǎn)業(yè)化的關(guān)鍵階段,重點(diǎn)是共享資源、培養(yǎng)人才來對接規(guī)?;漠a(chǎn)業(yè)應(yīng)用。在算法和芯片領(lǐng)域一方面提升自主研發(fā)創(chuàng)新能力,實(shí)現(xiàn)理論和方法的突破;另一方面充分利用國際技術(shù)合作來促進(jìn)AI應(yīng)用的落地。這是時(shí)代賦予中國的機(jī)遇,我們可以通過頂層設(shè)計(jì)將AI與智慧城市、5G、無人駕駛、物聯(lián)網(wǎng)等有機(jī)結(jié)合,在建造數(shù)字化智能時(shí)代上領(lǐng)跑全球。我們期待著人工智能在中國綻放。
