1.語音識別--形象來講是這是一個最近幾年已經(jīng)被深度學(xué)習(xí)攻克的領(lǐng)域,只要花足夠的錢,那識別精確度可以達(dá)到99%。在語音識別這種領(lǐng)域,最后幾個點精度的提升很可能比前面達(dá)成90%精度還要費勁,但最后這幾個點的精度往往正是跨越能用和不能用的關(guān)鍵。沒有深度學(xué)習(xí)之前,人們已經(jīng)嘗試攻克語音識別很多年,一般來講1952年貝爾實驗室研究的第一個能識別10個英文數(shù)字發(fā)音的語音識別系統(tǒng)被認(rèn)為是語音識別的起點,這樣算起來人類已經(jīng)在這事上努力了60多年。在上個世紀(jì)70年代搞定了小詞匯量的語音識別,在80年代搞定了大詞匯量的語音識別,然后精度就卡在那里了,大概在85%左右徘徊,一卡就接近30年。微軟、IBM當(dāng)年都曾經(jīng)嘗試把這技術(shù)應(yīng)用起來,但顯然沒什么后果,好多人甚至不記得他們干過著件事情。深度學(xué)習(xí)導(dǎo)入語音識別后,使事情有了根本性的變化,現(xiàn)在只要有足夠的數(shù)據(jù)進(jìn)行訓(xùn)練,大多的公司自己都可以訓(xùn)練出足夠精確的語音識別模型。這技術(shù)基本上要貨品化了,越來越可以認(rèn)為這是一種不要特別多的投入就可以搞定的技術(shù)。
2.圖像識別--圖像識別比語音識別要麻煩一些,因為語音識別的對象總是各種有限的語言。但圖像里人臉和貓的識別落到具體實現(xiàn)上還不能用一個模型來處理。當(dāng)前的狀態(tài)是如果選定一個點比如人臉識別,砸入幾十個PhD,幾百塊GPU,那花個一到兩年,如果還能找到落地點不斷獲得數(shù)據(jù),那就可以做到非常高的精度(99%以上),但這種精度眼下還沒辦法一下子就覆蓋到其它領(lǐng)域,只能一個點一個點來搞定。像人臉這種領(lǐng)域因為有切實的落地場景(銀行等),所以一下子就發(fā)展起來了,其它的領(lǐng)域要想都達(dá)到同樣的水平,那還需要一點時間。
3.語義理解--和語音識別與圖像識別不一樣,語義理解處在一種基本沒搞定的狀態(tài)。很多時候我們看演示的時候能看到一個機(jī)器人或智能型產(chǎn)品與人進(jìn)行流暢的交流。達(dá)成這狀況有兩種可能,一種是作弊,后面放了個人,屬于人工的人工智能;一種是對話被限定在特定的場景下,比如汽車?yán)锎螂娫挘尩貓D導(dǎo)航等。語義理解的難度與所要處理的概念數(shù)有關(guān),當(dāng)要處理的概念數(shù)在幾千個以下的時候,那針對特定場景按照基于規(guī)則的方式還是可能搞定,做的比較流暢的。但一旦這個范圍擴(kuò)大到整個社會生活,那最多也就是GoogleNow和Siri那個樣子。與這點密切相關(guān)的應(yīng)用一個是各種智能語音助手在對話時的智能程度,一個則是翻譯。
在這些里程碑被陸續(xù)達(dá)成的過程中,世界也會改變它的樣子,恰如汽車的出現(xiàn)帶來了馬路和交通規(guī)則一樣。而要想理解這種影響的范圍,那就要考察人類與人工智能的分工邊界。
人類與人工智能的分工邊界
如果有一天我們想種什么植物,那只要對著身邊的智能助手說一聲;我們想生產(chǎn)什么東西,只要選定好樣式和材料工廠就可以按需生產(chǎn);我們想吃什么,機(jī)器人都可以幫我們做好;我們想出門的時候,自動駕駛汽車就會等在門口;想看病的時候,身體的各種參數(shù)就會和過往的病例自動對比分析。那人類到底還應(yīng)該做點什么?
由這點可以引出曠日持久的各種爭論,比如軟件在吞噬世界、人工智能在吞噬世界、機(jī)器人在吞噬世界等等,但這并沒價值,其關(guān)鍵在于既然有些崗位注定被消滅,那就要知道究竟究竟什么樣的工作會是人類的保留地。當(dāng)然這里用工作可能不太準(zhǔn)確,古代富家翁也種花,但這和花農(nóng)種花其實有著本質(zhì)的區(qū)別。
要想弄清上面說的這問題,其實需要回到此前提到的問題:到底什么是人工智能?如果說人工智能就是抽調(diào)了欲望和激情的超人,那顯然凡是不依賴這兩者的事情上人類都不再有工作的價值。很不幸的是我們今天所看到的絕大部分工作其實都更多的依賴于理智、感知和體力,而非欲望和激情,當(dāng)信息足夠充分后都是很容易就會被人工智能所取代。
種地這事在發(fā)達(dá)國家現(xiàn)在已經(jīng)足夠機(jī)械化,人工智能發(fā)達(dá)之后只要在地形的識別上做到足夠精確,技術(shù)成本又足夠低,那播種、收割、打農(nóng)藥等根本不可能難的住人工智能,比較容易就可以實現(xiàn)徹底的自動化。一旦自動駕駛得以徹底實現(xiàn),那類似的技術(shù)應(yīng)不應(yīng)用到農(nóng)業(yè)領(lǐng)域唯一的關(guān)鍵點就是經(jīng)濟(jì)上劃不劃算,而不是能不能搞定。這也是正在發(fā)生的事情,總部在加利福尼亞圣迭戈的VisionRobotics研發(fā)了一種章魚模樣的采橘子的機(jī)器人,這機(jī)器人使用3D視覺傳感器建立橘子樹的模型,然后存儲每個水果的位置,接下來就用來指導(dǎo)8個機(jī)械手臂采橘子。此外、用于修建葡萄藤的、在大棚里工作的機(jī)器人也都在向人類狂奔而來。
建筑方面也是同樣的情形,更為激進(jìn)的是已經(jīng)有創(chuàng)業(yè)公司在做這件事情,它們一邊利用無人機(jī)隨時監(jiān)控地形和進(jìn)度,一邊自動控制挖土機(jī)進(jìn)行施工。蓋摩天大廈這事暫時還無法用機(jī)器人來搞定,一是機(jī)器人本身的靈活性還不好,一是高空作業(yè)還是需要面對比較復(fù)雜的操作環(huán)境,但這不是一個人工智能搞不定的領(lǐng)域,只是需要更長一點的時間。
制造業(yè)里用機(jī)器人替代工人近乎成為一種浪潮,但當(dāng)前的浪潮其實不過是剛剛開始,當(dāng)前的很多機(jī)器人并不具有太多的智能,一旦制造型機(jī)器人的智能得到足夠的提升,那我們更可能會面對工廠里空無一人的情形。一家叫RethinkRobotics的美國公司做了一款叫Baxter的機(jī)器人,目標(biāo)就是解決過去的機(jī)器手過于死板的問題,任何人都可以訓(xùn)練這種機(jī)器人做范圍很寬泛的工作,當(dāng)然當(dāng)前它工作的精度還不如傳統(tǒng)的機(jī)械手。而被Google收購又要賣出的波士頓動力已經(jīng)做出了踹一腳不會摔倒,即使意外摔倒的也能自己爬起來的機(jī)器人。
如果問在10年之內(nèi)究竟什么時候這些機(jī)器人能徹底取代工人、能徹底取代物流倉儲過程中的搬運工人,眼下其實是很難回答,但如果把眼光放長一點,問在20~30年后這些機(jī)器人會不會取代相關(guān)的崗位,那答案顯然是肯定的。與此相類似的還有送餐、安保、零售、教師、廚師等這些往往吸納非常多人的領(lǐng)域,看穿現(xiàn)象后我們會發(fā)現(xiàn)這些崗位在人工智能面前,其抵抗力脆薄如紙。這里面有一個非常關(guān)鍵的點往往被大家忽略,我們上面所有說的事情其實是應(yīng)用的場合,而它們其實依賴于共通的幾個技術(shù)比如計算機(jī)視覺等,一旦這些技術(shù)取得突破,那各種機(jī)器人一定會雨后春筍一樣出現(xiàn)。這就好比手機(jī)大發(fā)展后,故事機(jī)、Pad、智能電視、智能投影儀等都能很快的出現(xiàn)一樣,因為他們依賴于很多共通的技術(shù)。也正因此前面才提到各種技術(shù)上的里程碑才非常關(guān)鍵,因為它可以代表著共通技術(shù)何時可以走向商用。
至于愛情、親情這些領(lǐng)域顯然會是人類的保留地,即使一個機(jī)器人能很好的照顧年邁的老人,能輔導(dǎo)小孩接受教育,但顯然這不可能取代子女的陪伴,父母的實時關(guān)懷,因為這些事情關(guān)乎心靈。與此相類似,現(xiàn)在從各個地方冒出來的網(wǎng)紅反倒是安全,因為網(wǎng)紅也更多的基于情感。
但關(guān)乎想象力和創(chuàng)意的領(lǐng)域結(jié)果會有點出乎意料,人工智能在可見范圍內(nèi)看不到具有想象力和創(chuàng)造力的可能性,這兩者更多的基于欲望和激情,但它確實可以模擬這兩者。很多我們以為深度依賴想象力和創(chuàng)造力的領(lǐng)域比如寫小說、寫詩、創(chuàng)作音樂、下圍棋等,其對想象力和思考的依賴其實并沒想的那么高?;蛘呶覀兛梢赃@么說,大多的小說并非是《戰(zhàn)爭與和平》那種層次,而是可以從大量的小說素材中拼接出來。人工智能不太可能在現(xiàn)有領(lǐng)域之外開辟一種新的流派,但達(dá)到起點上的大部分小說所體現(xiàn)出來的創(chuàng)造力和想象力并不是太難的事情。2012年7月,倫敦交響樂團(tuán)演奏了一曲《通向深淵》(Transits-IntoanAbyss)。有評論家認(rèn)為它“充滿藝術(shù)感并且讓人愉悅”。但關(guān)鍵是這曲子不是人造的,而是由一個名為“伊阿摩斯”的人工智能算法在計算機(jī)集群上跑出來的。這程序已經(jīng)創(chuàng)作了幾百萬首古典風(fēng)格的作品(《機(jī)器人時代》)。我個人仍然不相信人工智能作詩的話能夠達(dá)到李白的水平,因為它真的沒想象力和創(chuàng)造力,但關(guān)鍵是縱觀中國歷史又有幾個人有李白的水平,大多的人包括乾隆皇帝做的也不過是歪詩而已,這種水平人工智能是完全可以超越的。(我此前因為這點理解不清錯判了AlphaGo與李世石比賽的勝負(fù))
這樣一來,人類的保留地就真的不多了,關(guān)乎心靈的領(lǐng)域之外,就只有那些高端的依賴于想象力和創(chuàng)造力的領(lǐng)域,后者只屬于極少的大師級人物,大戰(zhàn)略家、大藝術(shù)家、大哲學(xué)家和大科學(xué)家不可能被人工智能取代,普通人的創(chuàng)造力和想象力估計匹敵不過人工智能用數(shù)據(jù)偽裝出來的水平。