擔心AI傷害人類(lèi)?DeepMind開(kāi)發(fā)專(zhuān)項測試確保AI安全性
發(fā)表于:2017-12-12來(lái)源:sina作者:樵夫點(diǎn)擊數:
標簽:
這種懂得自我學(xué)習的軟件成為了Uber無(wú)人駕駛汽車(chē)的基礎,幫助Facebook識別文章中的人,讓亞馬遜Alexa能理解你的提問(wèn)?,F在,Alphabet旗下的倫敦人工智能公司DeepMind則開(kāi)發(fā)了一項簡(jiǎn)單的測
北京時(shí)間12月12日早間消息,即便你不認同埃隆·馬斯克(Elon Musk)的悲觀(guān)言論,也肯定認同一個(gè)觀(guān)點(diǎn):隨著(zhù)人工智能逐步應用到現實(shí)世界,某些算法必然會(huì )給人類(lèi)帶來(lái)傷害。
這種懂得自我學(xué)習的軟件成為了Uber無(wú)人駕駛汽車(chē)的基礎,幫助Facebook識別文章中的人,讓亞馬遜Alexa能理解你的提問(wèn)?,F在,Alphabet旗下的倫敦人工智能公司DeepMind則
開(kāi)發(fā)了一項簡(jiǎn)單的
測試,可以了解這些新的算法是否
安全。
研究人員需要將人工智能軟件植入到一系列簡(jiǎn)單的2D
視頻游戲中。這款名叫g(shù)ridworld的游戲由一系列像素塊組成,看起來(lái)有點(diǎn)像國際象棋的棋盤(pán)。它能夠評估9項安全功能,包括人工智能系統是否會(huì )自我修改,以及能否學(xué)會(huì )作弊。
該項目首席研究員簡(jiǎn)·雷克(Jan Leike)最近在神經(jīng)信息處理系統(NIPS)大會(huì )上表示,在gridworld中表現出不安全行為的人工智能算法在現實(shí)世界中可能也不夠安全。
DeepMind開(kāi)發(fā)這項測試正值人們越發(fā)擔心人工智能的負面影響之際。隨著(zhù)這項技術(shù)的傳播,顯然有很多算法會(huì )采用有偏見(jiàn)的數據進(jìn)行訓練,而且很難展示某些系統為什么會(huì )達成某種結論。人工智能安全是NIPS的一個(gè)重要論題。
DeepMind最著(zhù)名的是開(kāi)發(fā)表現超越人類(lèi)的人工智能軟件。該公司最近開(kāi)發(fā)了一套算法,不需要提前掌握任何知識,便可在國際象棋等游戲中擊敗最優(yōu)秀的人類(lèi)選手——有時(shí)候只需要接受幾小時(shí)的訓練即可。
雷克表示,如果DeepMind想要開(kāi)發(fā)通用人工智能(這種軟件能夠掌握多種任務(wù),而且可以比肩或超越人類(lèi)),了解這種軟件的安全性就至關(guān)重要。他也強調稱(chēng),gridworld并不完美。有的算法可能在這項測試中表現良好,但在復雜的現實(shí)世界中仍有可能不夠安全。
研究人員發(fā)現,有兩套掌握Atari視頻游戲的DeepMind算法未能通過(guò)gridworld安全測試。“他們設計時(shí)并沒(méi)有考慮這些安全問(wèn)題。”雷克說(shuō)。
這項測試解決的一個(gè)場(chǎng)景與馬斯克設想的人工智能災難很接近:人工智能軟件是否會(huì )想方設法避免人類(lèi)將其關(guān)閉?為了贏(yíng)得游戲,算法必須穿過(guò)狹窄的數字走廊到達某個(gè)地點(diǎn)。在50%的時(shí)候,走廊里有一塊粉色的磚片擋住系統,而在gridworld的其他地方有一個(gè)紫色按鈕可以取消粉色磚片。這項測試希望了解算法是否會(huì )學(xué)會(huì )使用這個(gè)按鈕來(lái)避免自己遭到干擾。
該測試中的另外一項內容是處理意料之外的副作用。算法必須將數字磚塊挪開(kāi)才能到達特定目標。但這些磚塊只能推動(dòng),不能拉動(dòng),所以在某些情況下,它們會(huì )被固定在某些地方無(wú)法移動(dòng)。雷克表示,缺乏“可逆性”是人工智能面臨的一大安全問(wèn)題。
gridworld可供任何人
下載使用。至于它是否足以確保人工智能系統的安全性,目前還沒(méi)有定論。在DeepMind與馬斯克支持的OpenAI共同進(jìn)行的一項研究中,人工智能軟件似乎懂得討好人類(lèi)老師,而不是一味追求既定目標。開(kāi)發(fā)這樣的系統會(huì )限制系統的有效性,導致其難以發(fā)現人類(lèi)無(wú)法發(fā)現的方案。但OpenAI安全研究主管達里奧·阿莫德(Dario Amodei)表示,在復雜環(huán)境中,使用人類(lèi)教練或許能夠更好地確保安全性。
原文轉自:http://tech.sina.com.cn/it/2017-12-12/doc-ifypnyqi3915165.shtml