5月21日,在音樂、科技與藝術相結合的MTA天漠音樂節(jié)(36氪聯(lián)合主辦)上,微軟亞洲院的研究員張霖濤,分享了關于計算機系統(tǒng)跟人工智能之間的關系、機會和挑戰(zhàn)的看法,以下為張霖濤演講摘錄:
人工智能代表著我們的未來,不光媒體關注,各個大公司(谷歌、百度、亞馬遜、蘋果、微軟)也在不斷地強調(diào)其重要性、不斷地在做投資。甚至在國家的層面上,李克強總理也非常重視人工智能的發(fā)展。但怎么才可以推動人工智能?

從科學/技術的角度來說,我們覺得人工智能主要有三個非常重要的數(shù)據(jù)點——大數(shù)據(jù)、新算法、大系統(tǒng)。
在互聯(lián)網(wǎng)時代,數(shù)據(jù)為王。前一陣子有一個新聞說,現(xiàn)在挖掘數(shù)據(jù)比挖石油還要賺錢。算法也是一個非常重要的元素。大家最近看到的都是在講深度神經(jīng)網(wǎng)絡、深度學習。最近10年來深度學習的進展、深度學習驅(qū)動的算法進步,也是被大家熟知的。很多科普性的文章也不斷發(fā)表在各種媒體上。
在這里我想講一下系統(tǒng),系統(tǒng)實際上是連接數(shù)據(jù)、連接算法的紐帶,使得我們可以支撐上面的人工智能的應用和開發(fā),讓它們體現(xiàn)價值。
什么叫系統(tǒng)?系統(tǒng)相當于一個基石,我們可以叫作地基(在建筑上)。什么樣的基地是好的地基?不妨礙我們建一個好的大廈,這就是好的地基。地基雖然看不見,但是是非常重要的。在人工智能這方面需要有什么樣的基礎性的工作?需要面向開發(fā)者者、面向真正的后端的人,而不是面向用戶,從我的角度來說,有三個要素:
Experience:作為人工智能程序的開發(fā)者、使用者,它需要開發(fā)模型、算法的用戶體驗,需要很快增加生產(chǎn)率的工具。
Language:如果要有人工智能的一些想法、算法,我們怎么把它表達出來?用什么樣的語言、用什么樣的模式來表達?有些朋友會比較熟悉,現(xiàn)在叫深度學習的框架,各個公司也在這方面進行了重點的投資,也希望這些框架可以使得更多的人應用。這些框架一方面是表達的方向、語言,另一方面是也是下面的各種技術優(yōu)化、技術的支撐等。
Fabric:這些算法,或者是這些語言運行的環(huán)境。用什么樣的東西來運行機器,還有硬件、集群管理、資源管理、資源調(diào)度、網(wǎng)絡、存儲等。
跟大家分享一下我們在這方面的一些工作,以及我們對這方面的一些投資,和我本人對這方面的一些看法。從上往下講。
第一件事,用戶體驗:我們所謂的用戶實際上是面向開發(fā)者。在人工智能方面,大概是2星期以前,微軟剛剛發(fā)布了一個工具Visual Studio,當你開發(fā)一個項目的時候,可以在Studio里做各種編程、優(yōu)化,包括工作流程的管理等工作。我們最近剛剛發(fā)表了Visual Studio for AI,實際上也是一個插件,主要是針對深度學習的時候,可以有一個更好的用戶體驗。
Visual Studio在訓練神經(jīng)網(wǎng)絡時,能夠在本機做斷點,能夠做語法,能夠跟蹤,這都是程序開發(fā)員必要有的一些體驗。它可以在本地的機器上運行深度學習網(wǎng)絡的訓練,也可以把它調(diào)成一個參數(shù)(在一些大的集群上)。這樣就可以調(diào)參數(shù),運行任務。這個任務的結果也很快的就可以顯示出來,這樣就可以看到每個任務、機器的運行狀態(tài)。
有了這個開發(fā)環(huán)境之后在什么地方開發(fā)?我想重點談談框架。微軟在這方面有一個非常重大的投資,就是我們的認知工具箱(Microsoft Cognnitive Toolkit現(xiàn)在改名為“認識工具箱”了)。
它有各種各樣的模式,相對于其他的開元訓練環(huán)境有著非常多的優(yōu)點。當你有了這個工具以后,你要把它運行在某種環(huán)境上,這部分實際上是競爭非常激烈的一個環(huán)境。
在這方面我們也可以談談微軟在這方面的投資。微軟有一個很重大的投資,就是FPGA的工作,這叫可編程門陣列,我們已經(jīng)把這個大規(guī)模的運用在數(shù)據(jù)中心中。這個工作叫Accelerators,我認為是在去年最有創(chuàng)意的一個產(chǎn)品。我們可以一鍵式的加速。
這個現(xiàn)在在微軟是內(nèi)部使用,暫時還沒有對外。微軟有一個共有云的產(chǎn)品,叫Azure,現(xiàn)在在中國已經(jīng)落地了,它支持各種各樣云計算的平臺,和云計算的服務。在去年12月,我們宣布了含有GPU的虛擬機已經(jīng)上線了,支持特斯拉的GPU。
在Azure上我們提供了各種各樣大小不等的虛擬機,虛擬機可以根據(jù)用戶的需求不斷的進行調(diào)配。我們有比較小的虛擬機,也有比較大的,有數(shù)百G內(nèi)存,4塊顯卡,一個非常強的GPU,可以用來訓練很大的神經(jīng)網(wǎng)絡。
以上這三個支柱點——當我們有了數(shù)據(jù)、有了算法、有了系統(tǒng)之后,我們就可以往前推動AI的發(fā)展。
微軟在AI方面有一個比較重要的產(chǎn)品叫微軟認知服務,微軟認知服務和微軟內(nèi)部的科學家和工程師一起,把微軟的算法、數(shù)據(jù)、硬件一起包裝成一個API,能夠給用戶、給外面的開發(fā)者,直接調(diào)用微軟的研發(fā),為自己的產(chǎn)品做服務。比如How-old這個APP,只需要幾步就可以了解人的年紀。
微軟為了推動人工智能系統(tǒng)的研究,加速人工智能的發(fā)展,最近剛剛在中國成立了一個系統(tǒng)研究中心,主要的目的是為了推動系統(tǒng)的開發(fā)。希望可以幫助整個人工智能的產(chǎn)業(yè)、整個人工智能的社區(qū),能夠讓他們一起推進,讓他們一起利用我們的研究和工作的成果。