亚洲色无码国产精品网站可下载,亚洲h成年动漫在线观看网站,亚洲av中文无码乱人伦在线观看,亚洲国产一成人久久精品,亚洲av成人精品网站在线播放

數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?

   2020-09-01 中國(guó)機(jī)器人網(wǎng)中國(guó)鑄造網(wǎng)2370
核心提示:當(dāng)我向別人介紹我是數(shù)據(jù)科學(xué)家時(shí),我常常被問(wèn)到數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)有什么區(qū)別或者這是否意味著你在從事人工
 當(dāng)我向別人介紹我是數(shù)據(jù)科學(xué)家時(shí),我常常被問(wèn)到“數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)有什么區(qū)別”或者“這是否意味著你在從事人工智能工作?”類似問(wèn)題我已經(jīng)回答過(guò)很多次,答案可以總結(jié)成“三原則”:
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
這些領(lǐng)域確實(shí)有很多重合,而且各自都有各自的說(shuō)法,選擇哪一個(gè)看起來(lái)更像是一個(gè)市場(chǎng)問(wèn)題。但是他們不可互換:這個(gè)領(lǐng)域的大部分專業(yè)人士,對(duì)如何把特定的工作分成數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,都有自己的一套直覺(jué),盡管它很難用語(yǔ)言描述出來(lái)。
所以在這篇文章中,我提出了一個(gè)關(guān)于相當(dāng)簡(jiǎn)化的定義:
數(shù)據(jù)科學(xué)產(chǎn)生見(jiàn)解
機(jī)器學(xué)習(xí)做出預(yù)測(cè)
人工智能創(chuàng)造行為
需要明確的是,這不是一個(gè)充分的定義:不是所有符合定義的都屬于這個(gè)領(lǐng)域。(算命師做決策,但我們永遠(yuǎn)不會(huì)說(shuō)他們?cè)谧鰴C(jī)器學(xué)習(xí)?。┩瑯右?,這也不是決定一個(gè)人的角色或者工作頭銜的好方法(“我是一個(gè)數(shù)據(jù)科學(xué)家嗎?”),這是一個(gè)關(guān)注點(diǎn)和經(jīng)驗(yàn)的問(wèn)題。(任何工作都可以這樣描述:寫作是我工作的一部分,但我不是一個(gè)專業(yè)的作家)。
但我認(rèn)為這個(gè)定義是一種有效的方式,它可以來(lái)幫助你區(qū)別這三種類型的工作,這樣談?wù)撈饋?lái)時(shí)不會(huì)讓人覺(jué)得很傻。值得注意的是,我在討論成為一個(gè)描述主義者而不是規(guī)范主義者的方法:我感興趣的是這個(gè)領(lǐng)域的人如何使用這些術(shù)語(yǔ)而非術(shù)語(yǔ)本身。
數(shù)據(jù)科學(xué)產(chǎn)生見(jiàn)解
數(shù)據(jù)科學(xué)和其它兩個(gè)領(lǐng)域有所區(qū)別,是因?yàn)樗哪繕?biāo)是基于人類:能夠獲得洞察力和理解。Jeff Leek對(duì)數(shù)據(jù)科學(xué)可以實(shí)現(xiàn)的洞察類型有很好的定義,包括:描述性(“普通客戶有70%的更新機(jī)會(huì)”),探索性(“不同的銷售人員有不同的更新率”)和因果關(guān)系(“一個(gè)隨機(jī)實(shí)驗(yàn)表明分配給Alice的客戶比分配給Bob的客戶更有可能更新)。
不是所有產(chǎn)生洞察力的科學(xué)都是數(shù)據(jù)科學(xué)(數(shù)據(jù)科學(xué)的經(jīng)典定義是統(tǒng)計(jì)學(xué)、軟件工程和領(lǐng)域?qū)I(yè)知識(shí)的組合)。 但是我們可以用這個(gè)定義來(lái)區(qū)分ML和AI。 主要區(qū)別在于,數(shù)據(jù)科學(xué)中總有人工介入:有人正在理解、洞察,看到數(shù)字,或者從結(jié)論中受益。 “我們的象棋游戲算法使用數(shù)據(jù)科學(xué)來(lái)決定下一步棋”或者“Google地圖使用數(shù)據(jù)科學(xué)來(lái)推薦駕駛方向”是毫無(wú)意義的。
數(shù)據(jù)科學(xué)的定義因此強(qiáng)調(diào):
統(tǒng)計(jì)推斷
數(shù)據(jù)可視化
實(shí)驗(yàn)設(shè)計(jì)
領(lǐng)域知識(shí)
交流
數(shù)據(jù)科學(xué)家可能會(huì)使用簡(jiǎn)單的工具:他們可以報(bào)告百分比并根據(jù)SQL查詢制作線圖;也可以使用非常復(fù)雜的方法:他們可能會(huì)使用分布式數(shù)據(jù)存儲(chǔ)來(lái)分析數(shù)萬(wàn)億條記錄,開(kāi)發(fā)尖端的統(tǒng)計(jì)技術(shù)并構(gòu)建交互式可視化。 無(wú)論他們使用什么,目標(biāo)都是為了更好地理解他們的數(shù)據(jù)。
機(jī)器學(xué)習(xí)做出預(yù)測(cè)
我認(rèn)為機(jī)器學(xué)習(xí)是關(guān)于預(yù)測(cè)的領(lǐng)域:“給定具有特定特征的實(shí)例X,預(yù)測(cè)Y”。 這些預(yù)測(cè)可能是關(guān)于未來(lái)的(“預(yù)測(cè)這個(gè)病人是否會(huì)得敗血癥”),但它們也可能是對(duì)于計(jì)算機(jī)不明顯的特性(“預(yù)測(cè)這個(gè)圖像是否有鳥)”。 幾乎所有的Kaggle比賽都可以被認(rèn)定為機(jī)器學(xué)習(xí)問(wèn)題:他們提供一些訓(xùn)練數(shù)據(jù),然后查看參賽者是否可以對(duì)新例子做出準(zhǔn)確的預(yù)測(cè)。
數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)之間有很多重疊。 例如,邏輯回歸可以用來(lái)獲取關(guān)于關(guān)系的見(jiàn)解(“用戶越富有,他們購(gòu)買我們產(chǎn)品的可能性越大,所以我們應(yīng)該改變我們的營(yíng)銷策略”)并做出預(yù)測(cè)(“這個(gè)用戶有53 %購(gòu)買我們產(chǎn)品的可能性,所以我們應(yīng)該向他推薦我們的產(chǎn)品“)。
像隨機(jī)森林這樣的模型可解釋性稍差,而且更適合“機(jī)器學(xué)習(xí)”的描述,深度學(xué)習(xí)等方法是眾所周知的難解釋。 如果你的目標(biāo)是獲得見(jiàn)解而不是做出預(yù)測(cè),這可能會(huì)阻礙你。 因此,我們可以想象一個(gè)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的“譜”,其中可解釋模型傾向于數(shù)據(jù)科學(xué),更多“黑盒子”模型則傾向于機(jī)器學(xué)習(xí)這一邊[source](https://xkcd.com/1838/)
大多數(shù)從業(yè)者可以在這兩個(gè)任務(wù)之間非常舒適地來(lái)回切換。我在工作中同時(shí)使用到機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué):我可以通過(guò)機(jī)器學(xué)習(xí)的方法,在Stack Overflow的業(yè)務(wù)資料上匹配一個(gè)模型來(lái)判定哪些用戶更有可能是在尋找一份工作,然后用數(shù)據(jù)科學(xué)來(lái)構(gòu)筑結(jié)論和可視化結(jié)果來(lái)驗(yàn)證為什么這個(gè)模型有效。這是非常重要的方法來(lái)發(fā)現(xiàn)你模型中的缺點(diǎn)以及解決算法偏見(jiàn)。這也是數(shù)據(jù)科學(xué)經(jīng)常將機(jī)器學(xué)習(xí)發(fā)展為一個(gè)產(chǎn)品的原因。
人工智能創(chuàng)造行為
人工智能是目前為止這三個(gè)類中最古老和最廣為承認(rèn)的,但結(jié)果也是最具挑戰(zhàn)性來(lái)定義的。由于尋求資金和關(guān)注的學(xué)者、記者和創(chuàng)業(yè)者,人工智能也得到了大肆宣傳。
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
因?yàn)檫@也意味著一些本應(yīng)該被稱為人工智能的工作卻并不是按照這樣進(jìn)行描述的,這也引起了我的強(qiáng)烈反對(duì)。一些學(xué)者也在抱怨人工智能的作用:“人工智能是我們現(xiàn)在還無(wú)法做到的”。所以什么工作可以讓我們合理地描述人工智能?
一個(gè)定義“人工智能”的通用思路是一種自發(fā)代理行為執(zhí)行或者推薦行為行為 (e.g. Poole, Mackworth and Goebel 1998, Russell and Norvig 2003)。我認(rèn)為也屬于人工智能的系統(tǒng)包括:
人機(jī)博弈算法 (Deep Blue, AlphaGo)
機(jī)器人學(xué)和控制理論 (運(yùn)動(dòng)規(guī)劃, 兩足機(jī)器人的步行行為)
優(yōu)化選擇 (谷歌地圖路徑選擇)
自然語(yǔ)言處理 (機(jī)器人2)
強(qiáng)化學(xué)習(xí)
此外,人工智能與其他領(lǐng)域也有很多交疊。深度學(xué)習(xí)因?yàn)闄M跨機(jī)器學(xué)習(xí)和人工智能兩個(gè)領(lǐng)域,所以特別有趣。典型應(yīng)用例子就是訓(xùn)練數(shù)據(jù)然后作出預(yù)測(cè),這已經(jīng)在人人機(jī)博弈算法中表現(xiàn)出巨大的成功,比如Alphago(與更早之前的人機(jī)博弈系統(tǒng),如深藍(lán)相比,Alphago更聚焦于探索和優(yōu)化未知的解決方案空間)。
但這之間也有區(qū)別。如果我分析一些銷售數(shù)據(jù),會(huì)發(fā)現(xiàn)來(lái)自特定行業(yè)的客戶比其他更多  (提取出一些調(diào)查結(jié)果), 輸出結(jié)果是一些數(shù)字和圖表,不是特定行為。(管理者可能會(huì)根據(jù)這些結(jié)論改變銷售策略,但這個(gè)行為不是自發(fā)性的) 這意味著我會(huì)將我的工作描述為數(shù)據(jù)科學(xué): 如果將提高銷售額的方法歸結(jié)于人工智能將會(huì)是很尷尬的說(shuō)法。
請(qǐng)不要將經(jīng)受過(guò)算法訓(xùn)練的人都寫作具有人工智能能力的人
——Dave Gershgorn  ?@davegershgorn 3:17 AM - Sep 19, 2017
人工智能與機(jī)器學(xué)習(xí)的差異更加微妙,從發(fā)展歷史來(lái)說(shuō),機(jī)器學(xué)習(xí)通常被認(rèn)為人工智能的一個(gè)子領(lǐng)域 (計(jì)算機(jī)視覺(jué)尤其是一個(gè)經(jīng)典人工智能問(wèn)題)。但我認(rèn)為機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)與人工智能有較大割離,一定程度上是由于上面所提及的沖擊:大多數(shù)研究預(yù)測(cè)問(wèn)題的人都不喜歡把自己描述成人工智能研究人員。 (很多重要的機(jī)器學(xué)習(xí)所取得的突破來(lái)自于數(shù)據(jù)分析,而這些數(shù)據(jù)在AI領(lǐng)域的其他領(lǐng)域很少出現(xiàn)。) 這意味著,如果你能把一個(gè)問(wèn)題描述為“從Y中預(yù)測(cè)X”,我建議你完全避免使用“人工智能”這個(gè)詞。
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、人工智能,究竟有什么區(qū)別?
案例研究:怎樣將這三者一起使用
假設(shè)我們正在開(kāi)發(fā)一輛自動(dòng)駕駛汽車,并且正在研究將車??吭谕\嚇?biāo)志處的特定問(wèn)題。我們需要從這三個(gè)領(lǐng)域中獲得的技能。
機(jī)器學(xué)習(xí):  汽車必須使用它的攝像頭識(shí)別停車標(biāo)志。我們構(gòu)造一個(gè)包含數(shù)百萬(wàn)街邊對(duì)象的照片數(shù)據(jù)集,然后訓(xùn)練一個(gè)算法來(lái)判斷那些照片中有停車標(biāo)注。
人工智能:一旦我們的汽車識(shí)別出停車標(biāo)志,它就需要決定什么時(shí)候采取剎車動(dòng)作。太早或太晚應(yīng)用它們是危險(xiǎn)的,我們需要它來(lái)處理不同的路況  (例如,需要識(shí)別一條光滑道路,并不足以較快地將速度降下來(lái)識(shí)到它的速度不夠快), 這就是控制理論范疇。
數(shù)學(xué)科學(xué):在街頭測(cè)試中我們發(fā)現(xiàn)車的性能并不是足夠好,通過(guò)停車標(biāo)志來(lái)驅(qū)動(dòng)停車還是會(huì)有一些疏漏。在分析街邊測(cè)試數(shù)據(jù)后,我們?cè)俅味床斓铰┡新逝c每天的時(shí)間有關(guān):在日出之前或日落之后更容易出現(xiàn)漏判 停車標(biāo)志。我們意識(shí)到我們大多數(shù)訓(xùn)練數(shù)據(jù)僅都是大白天下的停車標(biāo)志,所以我們構(gòu)建了一個(gè)更好的數(shù)據(jù)集,包括夜間圖片然后在返回去進(jìn)行機(jī)器學(xué)習(xí)步驟。
通常將人工智能與能夠在不同的領(lǐng)域執(zhí)行任務(wù)的通用人工智能或者超過(guò)人類智力的超人工智能混為一談并沒(méi)有任何幫助。這對(duì)任何被描述為“人工智能”的系統(tǒng)都有不切實(shí)際的期望。
此處我提及到“機(jī)器人”是指用于解釋自然語(yǔ)言并以同樣方式回復(fù)的系統(tǒng)。這可以與用于提取數(shù)據(jù)的文本挖掘和用于分類文檔的文本分類相區(qū)分。
博客原址: http://varianceexplained.org/r/ds-ml-ai/
 
舉報(bào) 收藏 打賞 評(píng)論 0
 
更多>同類資訊
推薦圖文
推薦資訊
點(diǎn)擊排行
網(wǎng)站首頁(yè)  |  付款方式  |  關(guān)于我們  |  聯(lián)系方式  |  使用協(xié)議  |  版權(quán)隱私  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報(bào) 營(yíng)業(yè)執(zhí)照  |  粵ICP備18059797號(hào)-1
×