在圖靈測(cè)試中,人與機(jī)器交流方式就是自然語言理解和生成的過程,或者更準(zhǔn)確的說,人與機(jī)器交互的方式都是自然語言實(shí)現(xiàn)的流程。這是人與機(jī)器交流的第一步,只有讓機(jī)器先懂得人的看法,后面才會(huì)涉及大數(shù)據(jù)、云計(jì)算之類技術(shù)。從這個(gè)角度來說,即使有機(jī)器(計(jì)算機(jī))通過圖靈測(cè)試,倘若沒有自然語言處理以及其他相關(guān)技術(shù)的快速跟進(jìn),人類在接下來很長(zhǎng)一段時(shí)間內(nèi)還無法實(shí)現(xiàn)所謂的人工智能。

上周六,在英國(guó)皇家學(xué)會(huì)舉辦的圖靈測(cè)試中,一臺(tái)由俄羅斯工程師設(shè)計(jì)的機(jī)器(更準(zhǔn)確的說是軟件)成功通過測(cè)試,成為有史以來第一臺(tái)通過圖靈測(cè)試的機(jī)器。很多科技媒體高呼人工智能即將進(jìn)入新時(shí)代,顯然,他們太樂觀了。
什么是圖靈測(cè)試?
圖靈測(cè)試一詞來源于計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)——阿蘭圖靈寫于1965年的一篇論文《計(jì)算機(jī)器與智能》( ComputingMachinery and Intelligence),圖靈認(rèn)為:機(jī)器能否思考的重要標(biāo)準(zhǔn)就是是否可以模仿一個(gè)真正的人。于是圖靈設(shè)計(jì)了一套測(cè)試規(guī)則:
“如果一個(gè)人A使用測(cè)試對(duì)象皆理解的語言去詢問兩個(gè)他不能看見的對(duì)象任意一串問題。對(duì)象為:一個(gè)是正常思維的人B、一個(gè)是機(jī)器C。”
圖靈測(cè)試會(huì)有多個(gè)像A一樣的測(cè)試者去輪番“轟炸”測(cè)試對(duì)象,圖靈設(shè)定了30%的下限——即如果有30%的測(cè)試者認(rèn)為無法分辨和他交流的到底是機(jī)器還是人,則該機(jī)器通過圖靈測(cè)試。
在本次由英國(guó)皇家學(xué)會(huì)的測(cè)試中,共有5個(gè)參賽者。獲勝者——“尤金”被33%的測(cè)試者認(rèn)定為“人類”,且大多數(shù)的測(cè)試者相信它是一個(gè)“13歲的烏克蘭男孩”。一位該機(jī)器(軟件)的開發(fā)者弗拉基米爾·維西羅夫表示:“我們的主要設(shè)計(jì)理念是,它可以聲稱它什么都知道,但由于受年齡限制,實(shí)際上它并不是什么都知道,這是完全合理的。”
這條消息再次引發(fā)人類對(duì)于機(jī)器的恐懼,但機(jī)器通過圖靈測(cè)試真的能宣布人功智能時(shí)代即將到來嗎?
我看未必,至少短時(shí)間內(nèi)不會(huì)。
自然語言制約機(jī)器的進(jìn)步
參加圖靈測(cè)試的計(jì)算機(jī)涉及到多個(gè)技術(shù),其中就包括自然語言,自然語言包括自然語言生成系統(tǒng)和自然語言理解系統(tǒng),前者是把計(jì)算機(jī)數(shù)據(jù)轉(zhuǎn)化為自然語言,后者則是把自然語言轉(zhuǎn)化為計(jì)算機(jī)程序更易于處理的形式。總之一句話,自然語言是人類與機(jī)器交流的重要媒介。
在圖靈測(cè)試中,人與機(jī)器交流方式就是自然語言理解和生成的過程,或者更準(zhǔn)確的說,人與機(jī)器交互的方式都是自然語言實(shí)現(xiàn)的流程。這是人與機(jī)器交流的第一步,只有讓機(jī)器先懂得人的看法,后面才會(huì)涉及大數(shù)據(jù)、云計(jì)算之類技術(shù)。而就在此次測(cè)試“成功通過之前”,Google產(chǎn)品經(jīng)理Dave Orr坦言:自然語言還有待發(fā)展,目前只是處在“可以使用”的階段,很多互聯(lián)網(wǎng)公司都開始用自然語言開發(fā)一些看起來很酷的產(chǎn)品,比如siri、Google now,但如果你非要說機(jī)器可以“理解”你的意思,那的確有點(diǎn)勉為其難。
機(jī)器對(duì)語言的理解到底有多笨?有個(gè)經(jīng)典案例說讓機(jī)器分辨下面兩句話:“我們把香蕉給猴子,因?yàn)樗鼈凁I了”和“我們把香蕉給猴子,因?yàn)樗鼈兪焱噶?rdquo;。這兩句話的結(jié)構(gòu)是一樣的,雖然語義有所差別,正常人理解起來也沒有太大問題。但機(jī)器就理解不了,兩個(gè)“它們”就足夠讓機(jī)器們陷入“沉思”,也給不出正確的結(jié)果。
Dave Orr舉了另外一個(gè)例子證明機(jī)器無法真正理解人類語言:“讓機(jī)器試著用幾句話總結(jié)一篇文章的要義”,至少到目前為止,還沒有那個(gè)機(jī)器可以做到這一點(diǎn)。而本次通過圖靈測(cè)試的機(jī)器(軟件)則是歷經(jīng)十余年年的“精心培育”,也因此不具備大規(guī)模復(fù)制的能力。
從這個(gè)角度來說,即使有機(jī)器(計(jì)算機(jī))通過圖靈測(cè)試,倘若沒有自然語言處理以及其他相關(guān)技術(shù)的快速跟進(jìn),人類在接下來很長(zhǎng)一段時(shí)間內(nèi)還無法實(shí)現(xiàn)所謂的人工智能。