書白讀了!機(jī)器人挑戰(zhàn)北京高考數(shù)學(xué)卷,考了105分
6月7日,成都高新造人工智能系統(tǒng)“準(zhǔn)星數(shù)學(xué)高考機(jī)器人”AI-MATHS對(duì)2017高考數(shù)學(xué)科目發(fā)起了挑戰(zhàn),在22分鐘的時(shí)間里,得分105分。整個(gè)過(guò)程是嚴(yán)格按照斷網(wǎng)、斷庫(kù)、自然語(yǔ)言理解、綜合復(fù)雜推理等嚴(yán)格流程進(jìn)行的公開透明測(cè)試。
據(jù)介紹,AI-MATHS是成都高新區(qū)一家本土人工智能企業(yè)—一成都準(zhǔn)星云學(xué)科技有限公司,依托清華大學(xué)大數(shù)據(jù)、人工智能、自然語(yǔ)言識(shí)別等前沿技術(shù),研發(fā)的一款以自動(dòng)解題技術(shù)為核心的人工智能系統(tǒng)。
圖為機(jī)器人所做的答卷。
在成都高新區(qū)天府新谷10棟9層的一個(gè)封閉空間里,一位特殊“考生”準(zhǔn)備挑戰(zhàn)今年全國(guó)高考的數(shù)學(xué)。它就是成都高新區(qū)一家企業(yè)研制的高考機(jī)器人,名叫“AI-MATHS”。
圖為封閉在房間里的準(zhǔn)星數(shù)學(xué)高考機(jī)器人。
“AI-MATHS”考試的房間門外貼有“所有設(shè)備斷網(wǎng)斷庫(kù)”的標(biāo)識(shí)。所謂斷網(wǎng)斷庫(kù)意味著,模仿考生封閉環(huán)境的閉卷考試;測(cè)試復(fù)雜邏輯推理能力與聯(lián)想能力;斷絕一切可能的外界支持,包括專家系統(tǒng)庫(kù)。這也是人工智能技術(shù)的核心——斷網(wǎng)斷庫(kù)場(chǎng)景下的綜合邏輯推理能力。
圖為挑戰(zhàn)現(xiàn)場(chǎng)。
從下午18時(shí)28分到19時(shí)29分,“AI-MATHS”分別挑戰(zhàn)了北京卷文科數(shù)學(xué)以及全國(guó)二卷文科數(shù)學(xué)的考試,分別用時(shí)22分鐘和10分鐘,得分為105分和100分。盡管和之前預(yù)期的110分目標(biāo)還有差距,但是作為“家長(zhǎng)”——成都準(zhǔn)星云學(xué)科技有限公司CEO、清華大學(xué)蘇州研究院大數(shù)據(jù)中心主任林輝介紹,“前幾個(gè)月的書,這孩子沒(méi)白讀。”
兩次考試具體得分如下:北京文科數(shù)學(xué)卷,選擇題滿分、填空題20分、解答題45分,全卷105分;全國(guó)卷二選擇題55分、填空題20分,解答題25,全卷100分。在選擇題和填空題上,“AI-MATHS”表現(xiàn)十分亮眼。丟分環(huán)節(jié)主要是解答題,有些題目甚至是0分。
圖為錄題區(qū)。
研發(fā)高考機(jī)器人最大的難點(diǎn)在于,要讓系統(tǒng)準(zhǔn)確理解人類語(yǔ)言。“AI-MATHS”之父林輝稱:“直接用數(shù)學(xué)語(yǔ)言表述的應(yīng)用題它可以輕松解答,但它最大的弱項(xiàng)是不能理解考題里場(chǎng)景式的描述語(yǔ)言,它會(huì)讀不懂題目。”
圖為機(jī)器人答題現(xiàn)場(chǎng)。
林輝打了個(gè)比方,如果題目是10-1=?人工智能系統(tǒng)可以輕松作答。但如果題目用了場(chǎng)景描寫將其表述為“小明有10個(gè)蘋果,小麗吃了一個(gè),請(qǐng)問(wèn)還有幾個(gè)蘋果?”面對(duì)這樣的情況,人工智能系統(tǒng)就“傻”了,“它不理解小明是什么、小麗是什么、吃又是什么意思。”
圖為機(jī)器人答題現(xiàn)場(chǎng)。
評(píng)閱試卷的老師分析,在評(píng)卷過(guò)程中,“AI-MATHS”所犯錯(cuò)誤的題目都有一個(gè)共同點(diǎn):語(yǔ)言文字太多。這表示,高考機(jī)器人在自然語(yǔ)言上的理解稍稍欠缺。相反,在理解數(shù)學(xué)語(yǔ)言上相對(duì)容易。
圖為老師判卷現(xiàn)場(chǎng)。
教師祁祖海認(rèn)為,一般學(xué)生的成績(jī)大約在110分左右,而這次“AI-MATHS”取得的分?jǐn)?shù),大概處于本班學(xué)生的中等水平。但是他坦言,高考機(jī)器人的進(jìn)步空間會(huì)很大。
圖為機(jī)器人答題現(xiàn)場(chǎng)。