第3章 第二十八次測試

謝睿寒十指交叉,撐着下巴,冷冷環顧周圍衆多年長的同事。十六歲的天才少年一大早就被人從宿舍裏拉過來開會,積了一肚子起床氣。眼前這份測試失敗的報告更是火上澆油,讓他幾乎達到爆炸的臨界點。

會議室中氣氛極度壓抑,以至于沒人敢第一個發言。

謝睿寒抓起手邊的咖啡杯,憤怒地一飲而盡,然後重重地将杯子敲在桌上,發出一聲巨響。

“天樞是結合了深度神經網絡的AI,它會自主學習關于人類的一切。我們提供了足夠龐大的計算單元供它順利運行。理論上來說,它會擁有真正意義上的‘人類思維’。”

超級人工智能“天樞”,就是這個通稱“研究所”的科研機構目前正在研發的項目。謝睿寒雖然年輕,卻擔任開發小組組長一職,亦是天樞的主程序設計師。

“我們特意招募了一批不同年齡、性別、學歷和職業的測試員,對它進行圖靈測試。但是測試開始的一個月以來,已經經歷了二十七次失敗!不是兩次,不是七次,是二十七次!換言之所有的測試都失敗了!我們開發組已經再三檢查了算法,我們也搞不明白是哪裏出了問題!要是我明确知道哪裏有問題,這問題還會存在嗎!”

謝睿寒暴跳如雷。與會的其他人員和藹地看着他。大家的年齡普遍比謝睿寒大上至少一輪,雖然是平級的同事,但相處時總難免将他當成孩子。謝睿寒能力固然出衆,但依舊保持着少年沖動易怒的脾性。大家都是從這個階段過來的,對謝睿寒一直抱着包容多過嚴厲的态度。

謝睿寒頓了頓,意識到自己的失态,整了整淩亂的頭發,沉聲說:“如果這條路行不通,就說明天樞的算法設計根本從一開始就走錯了路。但是我們讨論過,大方向是沒有問題的。所以問題肯定出在別的地方。”

他望向測試組人員:“秦康博士呢?”

秦康博士是測試組的負責人,一個性情溫文爾雅的中年男子。這段時間他和年少氣盛的謝睿寒之間矛盾頻發,每一次測試失敗,謝睿寒都免不了在秦康面前炸毛。

研究所的例會,按理說謝睿寒和秦康是必須出席的,但秦康這一次卻罕見地缺席了。他的助手代替他出現在會議桌旁。

“秦康博士正在監督第二十八次圖靈測試。”助手道。

謝睿寒劍眉一挑:“今天的日程上沒有安排測試。”

“是他臨時決定的。他懷疑或許測試裏有什麽不為人知的bug,被測試員無意中觀察到了,所以這次想盡量排除這個可能性。”

謝睿寒面色稍緩。他之前就推測過,測試一直失敗或許和自己的算法沒有必然關系,而是測試過程中出現了bug,因為為了測試超級人工智能天樞,他們特意采用了一套前無古人的方法。

圖靈測試的原理就是讓測試者與電腦對話,看電腦能否騙過測試者,使其以為自己是個人類。研究所對測試進行了修改和升級,不僅僅讓測試員與天樞交流,更讓他們面對面的交流。

時至今日,全息拟真技術已經發展成熟,只要在腦後植入微小的神經接駁器,就可以與電腦對接,體驗栩栩如生的虛拟景象。各類全息拟真游戲大行其道,以至于傳統的鍵盤類游戲幾乎有了退出歷史舞臺的趨勢。

研究所正是采用了拟真情境方式對天樞進行測試。

他們招募了一批志願者作為測試員,将其放入各種各樣的拟真情境之中。測試員身邊的人物有些是真人,有些則是天樞扮演的。每當情境結束後,所有的測試員必須憑借觀察、經驗和直覺,指認哪些人物是真人,哪些是AI。有時還會加入對照組,如整個情境中都是真人,或除了單一的測試者之外都是AI。

超過一定比例指認成功,則意味着天樞未能通過此次測試。

謝睿寒對測試信心滿滿,認為自己的團隊一定能創造出完美的人工智能,然而測試結果卻讓他大跌眼鏡。二十七次測試,全數失敗,那一頁頁測試員的指認報告簡直就是在嘲笑他所付出的心血。

最初的四次測試,參與人員中有專業的圍棋和國際象棋選手,所以大家決定舉行比賽,天樞扮演的年輕棋手将其他人殺得片甲不留,被一致指認為AI,原因是“人類不可能有這樣的計算能力”。

接下來的五次測試,謝睿寒要求天樞降低自己的計算力,扮演普通人,并且增加了競技項目。天樞于是學會了輸給人類。然而輸掉比賽的方法非常拙劣,一看就知道是故意為之,結果又被指認了出來。

或許天樞就是個好勝心格外強烈的人工智能吧。之後的七次測試将測試員們放入極端的虛拟環境,比如即将沉沒的輪船或被暴風雨包圍的孤島,可是在這六次測試中,天樞的表現都不盡如人意,不是太過聰明,就是太過愚蠢,好像它根本不懂得怎麽低調生活。

最後的十次測試,謝睿寒修改了天樞的學習模式,并要求将情境改為普通日常生活,讓測試員和天樞進行日常交流,并抛出一些争議性話題,要求衆人讨論。可就連這樣的測試,天樞都無法騙過人類的眼睛。它不是過于标新立異,就是機械地重複他人的觀點。

二十六次失敗後,謝睿寒甚至生出了将天樞整個删除的想法。天樞倒十分謙遜,恭敬地請求謝睿寒為它修改算法。但說起來容易,謝睿寒連問題出在哪裏都不知道,又從何談起修改呢!

但如果是拟真情境本身出了問題,那他就好受多了。情境是由測試組的人員制作的,會不會有什麽地方粗制濫造,被人一眼就識破了?謝睿寒雖然自認為擁有一絲不茍的科學精神,但到了這種危急存亡的關頭,難免會抱有些許甩鍋心理。

“這次的測試員是誰?”他随口問道,“那個指認正确率100%的俞少清?”

助手點點頭:“就是他。這次測試只有他一個人進入情境。”

“是對照組測試?”

“這我就不清楚了。這次測試的情境是秦康博士親自設計的,詳情他沒告訴過任何人。”

謝睿寒陷入長久的沉默中。

測試員俞少清是研究所測試小組的一個神話,對于開發小組來說則是噩夢的代名詞。

他原本在加州理工大學就讀,研究的正是人工智能領域,但沒有取得學位便回了國,在秦康博士的介紹下進入研究所,作為測試員參與了天樞項目。

起初謝睿寒對這個俞少清不以為然:連博士都沒讀完就灰溜溜跑回國的家夥能有什麽本事?還不是靠着秦康的關系走後門進組的麽?

然而一次次測試下來,謝睿寒的态度逐漸從不屑變成驚訝,最後變成了惶恐。每當新一次測試開始,謝睿寒就會不由自主地想起被俞少清支配的那種恐怖。

迄今為止俞少清參與的每次圖靈測試,都成功地指認出了AI,正确率100%,比測試員中觀察力一流的資深刑警還高。他的存在就是在狠狠打開發小組的臉,每打一次都會在他們心裏烙下一句話:你們的設計還遠遠不夠完美!

關于俞少清的正确率為何如此之高,他自己是這麽說的:“我其實沒看出什麽破綻,只是一旦和AI扮演的角色相處,就渾身不舒服。和真人相處就沒這種感覺。”

秦康博士對此的解釋是恐怖谷效應使然。機器的外表越似人類,越容易引起人類的好感,然而一旦相似到某個程度,反而會引起人的厭惡。比起外表誇張的怪物,人類更害怕“似人而非人”的那些東西。譬如一個圓滾滾的小機器人,人們覺得它憨态可掬。但一個精致的人偶娃娃坐在那兒一動不動地看着你,就有點兒毛骨悚然了。

俞少清或許正是比較敏感的那種人,與AI角色待在一起,就會本能地感受到恐怖,因此指認正确率比普通人更高。

秦康博士懷疑他是不是發現了什麽不為人知的bug而沒有上報。畢竟俞少清讀博期間專攻的正是人工智能領域。

所以他要進行一次特別加試,試着排除這種可能性。

“聯系秦康博士。”謝睿寒對助手說,“讓他把拟真情境的畫面接進會議室。我要親自看看測試經過。”

他銳利的視線掃過諸多年長的同事們,“所有人都要看。”

同類推薦